Caso de estudio

El operador de cruceros más grande del mundo utiliza el Administrador de aplicaciones para garantizar el tiempo de actividad empresarial

Introducción

La cadena de entrega de aplicaciones tradicional se centró en alojar la aplicación y las bases de datos en servidores en centros de datos, lo que en sí mismo presentaba más desafíos que los propios en relación con la supervisión del rendimiento de las aplicaciones. Si monitorear el centro de datos de la vieja escuela no fuera lo suficientemente desafiante, imagine un centro de datos flotante. Ahora imagina 24 de ellos. Y por si acaso, imagina que todos se comunican entre sí y con un servidor central. Tener que monitorear una configuración de TI tan intrincadamente interconectada fue el predicamento en el que se encontró Carnival Cruise Lines. Ingrese al Administrador de aplicaciones. Pedro Esteban, analista senior (TI), lleva más de una década en la empresa. Había estado buscando una herramienta sólida de monitoreo de aplicaciones desde 2005. Aquí nos cuenta sobre la vida antes y después del Administrador de aplicaciones.

Entorno de TI de Carnival

Carnival Cruise Lines (Carnival Corp.) tiene su sede en Miami, Florida y actualmente opera 24 barcos, y cada barco se comporta como un centro de datos. La sede de Miami alberga el centro de datos principal y también es el sitio principal de BCP. Carnival también aloja y opera un servidor de administración, varios servidores administrados y su sitio web principal, Carnival.com, fuera de su sede de Miami. El Administrador de aplicaciones está instalado en todos sus servidores y a bordo de cada uno de sus barcos.

El desafío de TI de Carnival

Cada barco tiene un servidor ManageEngine, que envía alertas al administrador de alertas para que la persona de TI a bordo pueda responder a los problemas y tomar medidas de inmediato. Debido a que el servidor de administración está en la sede de Miami, los barcos se conectan y se comunican con la sede, y entre sí, a través de un enlace por satélite. El problema es que la comunicación no siempre está activa. Cuando los barcos cambian de dirección o atracan en el puerto, por ejemplo, a veces se desconectan. "Pero en la sede central ... debemos estar al tanto de todo lo que está sucediendo ... de modo que [en el] momento [la] conexión se restablezca, podamos verificar los datos históricos sobre la duración del tiempo de inactividad de cualquier servidor en particular", dice Pedro nosotros.

¿Por qué elegir el Administrador de aplicaciones?

"Una herramienta de monitoreo del entorno debe estar disponible las 24 horas del día, los 7 días de la semana, si algo no funciona, debemos saberlo en menos de cinco minutos, en tiempo real", dice Pedro, porque el tiempo de inactividad de cualquier aplicación, incluso por unos pocos minutos, podría significar la pérdida de negocio.

Antes de ser Gerente de Aplicaciones, Pedro había estado tratando de conseguir la solución APM adecuada durante más de seis años. “Algunas aplicaciones están hechas a medida para la industria de cruceros, otras son genéricas”, dice Pedro sobre la combinación de aplicaciones críticas para el negocio de Carnival, otro factor para seleccionar la solución de monitoreo adecuada, ya que no todas las soluciones APM pueden monitorear todas las aplicaciones.

  • En 2005, Carnival evaluó a Microsoft Operations Manager (MOM). "Cada pocos días", relata Pedro, "la base de datos SQL [de MOM] se caía y teníamos que abrir un caso", por considerar que MOM no era confiable.
  • Carnival escaló a System Center Operations Manager (SCOM) de Microsoft, pero eso cambió la visión del equipo de operaciones de la supervisión del entorno a la supervisión de tecnología de puntos; por lo que el equipo perdió mucha visibilidad. Según Pedro, "el problema con SCOM era que una alerta agregada hoy no podía probarse hasta el día siguiente", un gran cuello de botella para un equipo que opera las 24 horas del día, los 7 días de la semana.
  • Carnival luego implementó SMARTS de EMC, pero esa herramienta priorizó el monitoreo de la red y tenía capacidades limitadas de monitoreo ambiental. Carnival, sin embargo, necesitaba un equilibrio entre el monitoreo ambiental y de la red, por lo que SMARTS no encajaba bien.
  • El siguiente fue SiteScope de HP. Según Pedro, “[Con SiteScope], cada sonda es una licencia. [Y por lo tanto] nos quedamos sin licencias muy rápido ".

Por fin, Pedro "tropezó" con el Administrador de aplicaciones. "Alguien harto de SCOM estaba ejecutando una prueba [del Administrador de aplicaciones]", dijo. "Lo vi y luego me di cuenta de que podía hacerlo funcionar". El Administrador de aplicaciones le dio al equipo de Pedro la comodidad de poder monitorear todo el espectro de la configuración de TI de Carnival desde un servidor a un servicio, un proceso o algo tan básico como el espacio en disco, sin dejar de ser rápido de implementar y fácil de trabajar. Veamos cómo funciona el Administrador de aplicaciones para Carnival Cruise Lines:

Visibilidad completa con datos históricos

Carnival HQ necesita tener los ojos en el horizonte en todo momento. Cuando falla un enlace por satélite, el equipo de Pedro en el cuartel general no sabe nada de todo lo que sucede a bordo de un barco. Entre ese momento y cuando se restablezca el enlace con el continente, el Administrador de aplicaciones llena los vacíos al continuar registrando las estadísticas de rendimiento a bordo. El equipo de Pedro puede obtener datos históricos y mantenerse informado sobre lo que sucedió durante la interrupción, por lo que no hay puntos ciegos.

Análisis de raíz de la causa

La TI de Carnival solía configurarse como una hilera de fichas de dominó: un elemento deshonesto derribaba varias funciones simultáneamente, ya sea a bordo de un barco que está en el mar o la TI de la oficina en la sede central. Por ejemplo, una aplicación con un registro descontrolado o un proceso descontrolado que escribe cosas indiscriminadamente provocaría la caída de los servicios, lo que provocaría bloqueos de aplicaciones que provocarían un tiempo de inactividad empresarial. El protocolo entra en acción, es decir, alguien llama a la mesa de ayuda, crea un ticket P1, y solo entonces Pedro y el equipo entran a la refriega. El administrador de TI a bordo actúa sobre los boletos en los barcos, mientras que los miembros inmediatos del equipo de Pedro responden a los boletos para la oficina central. Tras la investigación, todo lo que se puede encontrar, al menos nueve de cada diez veces, es que el servicio de la aplicación no funciona.

La capacidad de reiniciar un servicio, dice Pedro, les ha ayudado mucho. Y la rapidez con la que Applications Manager realiza esta tarea es lo que realmente se destaca. "Lo bueno es que es tan rápido que el negocio no lo sabe", señala Pedro. "¡Realmente no tenemos un tiempo de inactividad notable en el negocio que nos cuesta dinero!"

Los informes sólidos establecen el control de crucero

Applications Manager equipa a Pedro y su equipo para analizar enormes cantidades de datos históricos. Carnival almacena hasta un año de datos históricos y se basa en informes de tendencias, gráficos e informes de estadísticas vitales fácilmente comprensibles. La inteligencia procesable ayuda a dar sentido a todos esos datos y ayuda a informar a la administración.

Estos informes integrales ayudan a Pedro a analizar e identificar patrones en la degradación del rendimiento de TI, lo que le permite planificar la capacidad y programar el mantenimiento con anticipación. Esto evita problemas, evitando así tiempos de inactividad no deseados para la empresa. Si puede proporcionar una prueba sólida de por qué un determinado recurso, como el espacio en disco en un servidor o un determinado clúster de archivos, se cayó, o se interrumpió en un día y hora específicos, entonces los ingenieros pueden retroceder y verificar si es solo un problema de capacidad o un problema. problema de rendimiento genuino.

Planificación de capacidad

La administración generalmente genera solicitudes de más capacidad o más espacio en disco. El departamento de ingeniería requiere que Pedro explique la base de los requisitos para cualquier solicitud. Antes del Administrador de aplicaciones, por lo general no tenía una respuesta. Un escenario típico en el que la capacidad queda bajo el escáner es el "síndrome de la hora punta del lunes por la mañana". Todos los lunes por la mañana, prácticamente todos en Carnival quieren obtener informes de todas las diferentes aplicaciones, por ejemplo, Siebel. Esto sería cuando la carga de capacidad está en su punto máximo y la utilización de la CPU está cerca del 99 por ciento.

Cumpliendo lo prometido

El otro beneficio comercial principal de utilizar Applications Manager son los SLA: poder cumplirlos y prevenir incidentes de tickets (denominados "eventos P1" en su sistema) para reducir las llamadas al servicio de asistencia técnica. Según Pedro, antes de usar el Administrador de aplicaciones, su equipo "recibía llamadas cada dos noches". Ahora, con la solución ManageEngine en su lugar, ha visto una "gran reducción de llamadas".

Solución de problemas

En Carnival, la resolución de problemas exitosa y oportuna se reduce a los datos históricos disponibles y a reducir los parámetros. A su vez, el equipo de operaciones puede, digamos, detectar cada interrupción de la red, identificar el minuto exacto en que un servidor o una aplicación se desconecta, monitorear los procesos por ID de proceso, verificar la disponibilidad y ver si algún recurso realmente se interrumpió durante la noche.

En resumen, Applications Manager ha demostrado ser invaluable en sus contribuciones a la gestión de TI de Carnival. En lo que respecta a las operaciones diarias, la planificación de la capacidad, el análisis de rendimiento histórico y la resolución de problemas, Pedro dice: "Estamos muy contentos. El nivel de detalle es tan crítico. Porque la mayoría de las veces, las cosas más simples pueden tener el mayor impacto ". Y para Carnival, navegar sin problemas, para Pedro, su equipo de TI y el resto de las unidades de negocio de la línea de cruceros, es el mayor impacto logrado por el Administrador de aplicaciones.

Pruebe Applications Manager hoy mismo de forma gratuita en: https://www.manageengine.com/products/applications_manager/download.html

Para obtener más información, visite https://www.manageengine.com

Siga nuestro blog en http://blogs.manageengine.com

¿Interesado en el Administrador de aplicaciones? ¡Empiece ahora con una demostración personalizada!
Solicitar demostración