Última actualización: 25 de junio de 2020

La gestión de incidentes de TI es uno de los procesos fundamentales de la mesa de ayuda. En esta guía, aprenderá los conceptos básicos de la gestión de incidentes, sus componentes, los roles y responsabilidades involucrados, y cómo la gestión de incidentes funciona con otros componentes de la mesa de servicio.

En esta guía de gestión de incidentes, analizaremos lo siguiente:

  1. Definición de incidente
  2. Ciclo de vida / flujo de proceso de gestión de incidentes de ITIL®
  3. Funciones y responsabilidades de gestión de incidentes
  4. Mejores prácticas de gestión de incidentes
  5. Beneficios y ventajas de la gestión de incidentes
  6. Lista de verificación de funciones del software de gestión de incidentes
  7. KPI de gestión de incidentes
  8. Diferencia entre incidente, problema, cambio y activo
  9. Glosario de ITIL® para la gestión de incidentes
  10. Descargue gratis el kit de implementación de gestión de incidentes

Definición de incidentes de ITIL®

¿Qué es la gestión de incidentes en ITIL?

¿Qué es un incidente de TI?

Un incidente de TI es cualquier interrupción de los servicios de TI de una organización que afecta cualquier cosa, desde un solo usuario o toda la empresa. En resumen, un incidente es cualquier cosa que interrumpa la continuidad del negocio.

¿Qué es la gestión de incidentes de TI?

La gestión de incidentes es el proceso de gestionar las interrupciones del servicio de TI y restaurar los servicios dentro de los acuerdos de nivel de servicio (SLA) acordados.

El alcance de la gestión de incidentes comienza con un usuario final que informa un problema y termina con un miembro del equipo de la mesa de servicio que resuelve ese problema.

Las etapas de la gestión de incidentes

Con una gestión adecuada de incidentes, la recopilación de información sobre los incidentes se simplifica y es menos caótica sin que los correos electrónicos se transmitan de un lado a otro para ese propósito. Los equipos de la mesa de servicio pueden publicar formularios en el portal de autoservicio del usuario para garantizar que toda la información relevante se recopile justo en el momento de la creación del ticket.

La siguiente etapa en la gestión de incidentes es la categorización y priorización de incidentes. Esto no solo ayuda a clasificar los tickets entrantes, sino que también asegura que los tickets se envíen a los técnicos, más calificados para trabajar en el problema. La categorización de incidentes también ayuda al sistema de mesa de servicio a aplicar los SLA más apropiados a los incidentes y comunicar esas prioridades a los usuarios finales. Una vez que un incidente se clasifica y se prioriza, los técnicos pueden diagnosticar el incidente y proporcionar una resolución al usuario final.

El proceso de gestión de incidentes cuando se habilita con las automatizaciones relevantes permite a los equipos de la mesa de servicio vigilar el cumplimiento del SLA y envía notificaciones a los técnicos cuando se acercan a una infracción del SLA; Los técnicos también tienen la opción de escalar las violaciones del SLA mediante la configuración de escaladas automáticas, según corresponda al incidente. Después de diagnosticar el problema, el técnico ofrece al usuario final una resolución, que el usuario final puede validar. Este proceso de varios pasos asegura que cualquier problema de TI que afecte la continuidad del negocio se resuelva lo antes posible.

Cómo clasificar los incidentes de TI

Los incidentes en un entorno de TI se pueden clasificar de varias formas diferentes. Algunos factores que influyen en la categorización de incidentes incluyen la urgencia del incidente y la gravedad de su impacto en los usuarios o en la empresa en general. La clasificación y categorización de los incidentes de TI ayuda a identificar y dirigir los incidentes al técnico adecuado, lo que ahorra tiempo y esfuerzo. Por ejemplo, los incidentes pueden clasificarse como incidentes mayores o menores según su impacto en el negocio y su urgencia. Por lo general, los incidentes importantes son los que afectan los servicios críticos para el negocio, lo que afecta a toda la organización y necesitan una resolución inmediata. Los incidentes menores generalmente afectan a un solo usuario o departamento, y es posible que ya tengan una resolución documentada.

¿Qué sucede cuando no se cuenta con la gestión de incidentes de TI?

La gestión de incidentes cubre todos los aspectos de un incidente a lo largo de su ciclo de vida. Acelera el proceso de resolución y hace que la gestión de tickets sea transparente. Sin la gestión de incidentes, el manejo de los tickets puede resultar complicado. Algunos de los problemas clave que pueden surgir incluyen:

  • Falta de transparencia sobre el estado de los tickets y los plazos previstos para los usuarios finales.
  • No hay un registro adecuado de incidentes pasados.
  • Incapacidad para documentar soluciones para problemas repetidos o familiares.
  • Mayor riesgo de interrupciones del negocio, especialmente con incidentes importantes .
  • Tiempos de resolución extendidos
  • Falta de capacidad para informar.
  • Disminución de la satisfacción del cliente.

¿Quién usa la gestión de incidentes de TI?

Las prácticas de gestión de incidentes son ampliamente utilizadas por los equipos de la mesa de servicio de TI. Las mesas de servicio suelen ser el único punto de contacto para que los usuarios finales informen sobre problemas a los equipos de gestión de TI.

El ciclo de vida de la gestión de incidentes de TI

Pasos del proceso de gestión de incidentes

El proceso de gestión de incidentes se puede resumir de la siguiente manera:

  • Paso 1: registro de incidentes.
  • Paso 2: categorización de incidentes.
  • Paso 3: priorización de incidentes.
  • Paso 4: Asignación de incidentes.
  • Paso 5: creación y gestión de tareas.
  • Paso 6: gestión SLA y escalado de .
  • Paso 7: resolución de incidencias.
  • Paso 8: Cierre del incidente.
Diagrama de flujo del proceso de gestión de incidentes de ITIL

Estos procesos pueden ser simples o complejos según el tipo de incidente; también pueden incluir varios flujos de trabajo y tareas además del proceso básico descrito anteriormente.

Registro de incidentes

Un incidente se puede registrar a través de llamadas telefónicas, correos electrónicos, SMS, formularios web publicados en el portal de autoservicio o mediante mensajes de chat en vivo .

Categorización de incidentes

Los incidentes se pueden categorizar y subcategorizar en función del área de TI o del negocio en el que el incidente causa una interrupción en la red, el hardware, etc.

Priorización de incidentes

La prioridad de un incidente se puede determinar en función de su impacto y urgencia utilizando una matriz de prioridades. El impacto de un incidente denota el grado de daño que el problema causará al usuario o la empresa. La urgencia de un incidente indica el tiempo dentro del cual debe resolverse el incidente. Según la prioridad, los incidentes se pueden clasificar como:

  • Crítico
  • Alto
  • Medio
  • Bajo

Enrutamiento y asignación de incidentes

Una vez que el incidente se categoriza y prioriza, se envía automáticamente a un técnico con la experiencia relevante.

Crear y administrar tareas

Según la complejidad del incidente, se puede dividir en subactividades o tareas. Las tareas se crean normalmente cuando la resolución de un incidente requiere la contribución de varios técnicos de varios departamentos.

Gestión y escalado de SLA

Mientras se procesa el incidente, el técnico debe asegurarse de que no se infrinja el SLA. Un SLA es el tiempo aceptable dentro del cual un incidente necesita respuesta (SLA de respuesta) o resolución (SLA de resolución). Los SLA se pueden asignar a incidentes en función de sus parámetros como categoría, solicitante, impacto, urgencia, etc. En los casos en que un SLA está a punto de ser incumplido o ya se ha incumplido, el incidente se puede escalar funcional o jerárquicamente para garantizar que se resuelva. como pronto.

Resolución de incidencias

Un incidente se considera resuelto cuando el técnico ha encontrado una solución temporal o una solución permanente para el problema.

Cierre de incidentes

Un incidente se puede cerrar una vez que se resuelve el problema y el usuario reconoce la resolución y está satisfecho con ella.

Revisión posterior al incidente

Una vez que se ha cerrado un incidente, es una buena práctica documentar todas las conclusiones de ese incidente. Esto ayuda a preparar mejor a los equipos para futuros incidentes y crea un proceso de gestión de incidentes más eficiente. El proceso de revisión posterior al incidente se puede dividir en varios aspectos, como se muestra a continuación, y es particularmente útil para los incidentes importantes.

Evaluación interna

Identificación de incidentes

  • ¿Quién detectó el incidente y cómo?
  • ¿Qué tan pronto se detectó el incidente después de que ocurrió?
  • ¿Podría haberse identificado el incidente antes?
  • ¿Podría alguna herramienta o tecnología haber ayudado a la detección rápida o preventiva del incidente?

Flujo de información y comunicación:

  • ¿Con qué rapidez se informó a las partes interesadas sobre el incidente?
  • ¿Qué canal se utilizó para transmitir notificaciones?
  • ¿Fueron todas las partes interesadas relevantes actualizadas de inmediato con la información más reciente?
  • ¿Qué tan fácil fue comunicarse con los usuarios finales para recopilar información y mantenerlos informados sobre el estado del ticket?

Estructura

  • ¿Cómo se estructuró inicialmente el equipo de respuesta a incidentes?
  • ¿Se respetó esta estructura durante todo el ciclo de vida de la gestión de incidentes? Si no, ¿por qué? ¿Qué cambios hubo que hacer en la estructura?
  • ¿Se puede organizar mejor el equipo de manejo de incidentes? ¿Si es así, cómo?

Utilización de recursos

  • ¿Qué recursos se emplearon para manejar el incidente?
  • ¿Se utilizaron esos recursos a su capacidad óptima?
  • ¿Con qué rapidez se movilizaron los recursos para manejar el incidente?
  • ¿Podría mejorarse la utilización de recursos en el futuro?

Proceso

  • ¿Qué tan de cerca se siguió el proceso de gestión de incidentes definido?
  • ¿Hubo alguna desviación en el flujo de trabajo y el proceso de gestión de incidentes?
  • ¿Se respetaron los SLA del incidente? De no ser así, ¿qué SLA se infringieron? ¿Por qué?
  • ¿Se realizó un seguimiento adecuado del proceso que se estaba siguiendo para manejar el incidente?
  • ¿Se podría mejorar el proceso para hacerlo más eficiente? Si es así, ¿cómo?

Reportando

  • ¿Se generaron informes para analizar cómo se manejó el incidente?
  • ¿Qué parámetros se incluyeron en los informes?
  • ¿Qué partes del ciclo de vida del incidente se analizaron?
  • ¿Hay margen de mejora? Si es así, ¿cómo se puede lograr?

Evaluación externa: encuestas a usuarios finales

Aparte de los factores anteriores, también deben evaluarse algunos factores relacionados con el usuario final. Para ello, se realiza una encuesta posterior al cierre para recopilar comentarios de los usuarios finales afectados por el incidente. Esta encuesta debe usarse para obtener información sobre algunas áreas clave, como:

  • ¿Qué tan fácil o difícil fue para el usuario final informar un incidente?
  • ¿La primera respuesta del equipo de TI fue rápida y rápida?
  • ¿Se resolvió el incidente de manera oportuna?
  • ¿Qué tan satisfecho está el usuario final con la resolución?

Cree sus flujos de trabajo de gestión de incidentes personalizados

Los roles y responsabilidades involucrados en la gestión de incidentes de TI

Funciones y responsabilidades del administrador de incidentes

Aunque cada organización puede tener sus propios roles y responsabilidades personalizados, a continuación se muestran algunos de los roles de gestión de incidentes de TI más comunes.

Usuario final / usuario / solicitante

Esta es la parte interesada que generalmente experimenta una interrupción en el servicio y genera un ticket de incidente para iniciar el proceso de gestión de incidentes.

Mesa de servicio de nivel 1

Este es el primer punto de contacto para los solicitantes cuando quieren presentar una solicitud o un ticket de incidente. La mesa de servicio de nivel 1 generalmente consta de técnicos que tienen un conocimiento práctico de los problemas más comunes que pueden ocurrir en un entorno de TI, incluidos el restablecimiento de contraseñas y problemas de Wi-Fi.

Mesa de servicio de nivel 2

Esta mesa de servicio está formada por técnicos con conocimientos avanzados en gestión de incidentes. Suelen recibir solicitudes más complejas de los usuarios finales; también reciben solicitudes en forma de escaladas del Nivel 1.

Mesa de servicio de nivel 3 (y superior)

Este nivel generalmente está compuesto por técnicos especializados que tienen conocimientos avanzados de dominios particulares en la infraestructura de TI. Por ejemplo, los técnicos de mantenimiento de hardware y soporte de servidores se especializan en campos muy específicos.

Gerente de incidentes

Esta parte interesada juega un papel clave en el proceso de gestión de incidentes al monitorear cuán efectivo es el proceso, recomendar mejoras y garantizar que se siga el proceso, entre otras responsabilidades.

Dueño del proceso

Esta parte interesada es dueña del proceso seguido para la gestión de incidencias. También analizan, modifican y mejoran el proceso para garantizar que sirva mejor a los intereses de la organización.

Cada función tiene responsabilidades únicas, como se muestra a continuación.

Usuario final / usuario / solicitante:

  • Comuníquese con la mesa de servicio para generar una nueva solicitud de incidente.
  • Dar seguimiento a una solicitud existente.
  • Comunique claramente toda la información requerida a los técnicos.
  • Reconozca la restauración del servicio y la finalización del ticket.
  • Responda a las encuestas de seguimiento después de la resolución del ticket completando el ciclo de comentarios.

Mesa de ayuda de nivel 1:

  • Registre todas las solicitudes de incidentes entrantes con los parámetros adecuados como categoría, urgencia y prioridad.
  • Asignar tickets a técnicos.
  • Analizar y resolver una incidencia para restaurar el servicio.
  • Escale los incidentes no resueltos a la mesa de servicio de nivel 2.
  • Reúna toda la información requerida de los solicitantes y envíeles actualizaciones periódicas sobre el estado de su solicitud.
  • Actúe como un punto de contacto para los solicitantes y, si es necesario, coordine entre la mesa de soporte de Nivel 2 y los solicitantes.
  • Verifique la resolución con el usuario final y recopile comentarios.

Mesa de servicio de nivel 2 y 3:

  • Realizar diagnóstico de incidencias.
  • Documente los pasos seguidos para resolver el incidente y envíe artículos de la base de conocimientos.
  • Identifique cuándo un incidente es un problema y convierta el ticket de incidente en un ticket de problema.
  • Si se resuelve el incidente, confirme la resolución con el usuario final.
  • Si el incidente no se resuelve, transmítalo a la mesa de servicio de Nivel 3.
  • Si no se el incidente al gestión de problemas de TI resuelve, escale equipo de para identificar el problema subyacente o los proveedores externos, según corresponda.
  • Proporcionar experiencia en la materia.

Responsable de incidencias:

  • Servir como punto de contacto para todos los incidentes importantes.
  • Planifique y facilite todas las actividades involucradas en el proceso de gestión de incidentes.
  • Asegúrese de que se siga el proceso correcto para todos los tickets y corrija cualquier desviación.
  • Coordinar y comunicarse con el propietario del proceso.
  • Asegúrese de que se cumplan los SLA.
  • Identificar las incidencias que deben revisarse y realizar la revisión.

Dueño del proceso:

  • Asuma la responsabilidad del proceso general de gestión de incidentes.
  • Definir indicadores clave de rendimiento (KPI) y alinearlos con factores críticos de éxito (CSF).
  • Revise los KPI y asegúrese de que cumplan los objetivos comerciales y los CSF.
  • Diseñar, documentar, revisar y mejorar procesos.
  • Establecer la mejora continua del servicio (CSI) en la que se revisan y mejoran los procedimientos, las políticas, los roles, la tecnología y otros aspectos del proceso de gestión de incidentes.
  • Manténgase informado sobre las mejores prácticas de la industria e incorpórelas al proceso de gestión de incidentes.

Mejores prácticas para una gestión exitosa de incidentes de ITIL

Técnicas de gestión de incidentes
  • Ofrezca múltiples modos para la creación de boletos, incluso a través de un correo electrónico, una llamada telefónica o un portal de autoservicio.
  • Publique formularios de incidentes de TI personalizados y orientados al negocio para una recopilación de información eficaz.
  • Categorice y priorice automáticamente los incidentes de TI según los criterios de los tickets.
  • Asocie los SLA con incidentes de TI según los parámetros del ticket, como la prioridad.
  • Si todos los técnicos tienen los mismos niveles de habilidad, asigne automáticamente tickets a los técnicos según algoritmos como el balanceo de carga y el round robin .
  • Asocie datos de activos de TI, problemas de TI y cambios de TI con tickets de incidentes de TI.
  • Asegúrese de que los incidentes se cierren solo después de proporcionar una resolución adecuada confirmando con el usuario final y aplicando los códigos de cierre adecuados.
  • Configure un proceso de comunicación personalizado con el usuario final para cada paso del ciclo de vida de un incidente de TI
  • Crear y mantener una base de conocimientos con soluciones adecuadas.
  • Proporcione acceso basado en roles a usuarios finales y técnicos en función de la complejidad de las soluciones.
  • Maneje los incidentes importantes mediante la creación de flujos de trabajo únicos .
  • ITIL® es una marca registrada de AXELOS Limited. IT Infrastructure Library® es una marca registrada de AXELOS Limited.