IA

Papel de la IA en ServicePilot

La inteligencia artificial desempeña un papel fundamental en ServicePilot para acelerar el diagnóstico, detectar automáticamente comportamientos anómalos y facilitar la toma de decisiones. La plataforma combina varios enfoques complementarios:

IA interna de ServicePilot:
Basada en algoritmos y modelos de aprendizaje automático integrados (detección de anomalías, correlación de eventos, análisis de tendencias, búsqueda inteligente). Funciona de forma automática, sin necesidad de configuración.

IA externa (LLM):
Posibilidad de conectar un modelo de lenguaje externo (OpenAI, Azure OpenAI, etc.) para beneficiarse de una búsqueda conversacional y de una interpretación avanzada del lenguaje natural.

Se puede acceder a estas diferentes IA en varias secciones del producto, cada una de las cuales responde a una necesidad específica.

Anomalías

Las anomalías en ServicePilot corresponden a cambios inesperados en el estado de los objetos supervisados. Se activan cuando el estado de un indicador cambia de forma inusual con respecto a su comportamiento normal.

Un indicador puede cambiar de estado cuando supera un umbral (por ejemplo: OK → Advertencia → Crítico). Este cambio de estado se convierte en una anomalía cuando presenta alguna de las siguientes características:

  • No se produce con regularidad (no es cíclico, no es normal para ese objeto).
  • No se corresponde con el estado habitual del objeto.
  • No es coherente con el historial del objeto.
  • No es previsible en el contexto operativo.

Por lo tanto, la IA interna analiza el historial de estados, los eventos asociados y el comportamiento normal del objeto para determinar si este cambio es realmente anormal.

Ejemplo:
Un objeto denominado Server - eth0 pasa al estado “Down”. Sin embargo, esta interfaz suele estar permanentemente en estado “Up”.
Por lo tanto, este cambio de estado se considera una anomalía, ya que no se corresponde con su comportamiento normal.
En este caso, el objeto se marca como en estado de anomalía y se genera un evento asociado.

Las anomalías aparecen en la página dedicada desde MONITOR > Status > Anomalías.

Al seleccionar una opción en el menú superior, se muestra el número de anomalías en los recursos de las tarjetas de identificación.

Problemas

Los Problemas en ServicePilot son agrupaciones inteligentes de recursos que presentan estados anómalos al mismo tiempo. Permiten reducir el ruido, deduplicar las alertas y ofrecer una visión consolidada de los incidentes que afectan a varios objetos relacionados. A diferencia de las anomalías, que se refieren a un cambio de estado inesperado en un objeto, los problemas agrupan varias anomalías relacionadas entre sí en el tiempo y por su relación técnica.

Se crea un problema cuando un recurso permanece en un estado anómalo durante más de 3 minutos. A continuación, se pueden añadir otros recursos al mismo problema si:

  • Pasan a estar en estado anómalo en un plazo de 90 minutos.
  • Están relacionados con el recurso inicial (por IP, nombre de host, dependencias, etc.).

Esto permite agrupar automáticamente incidentes que probablemente tengan una causa común. Un problema se cierra automáticamente cuando ningún recurso del grupo ha permanecido en estado anómalo durante más de 30 minutos.

Los problemas permiten:

  • Agrupar varias anomalías relacionadas.
  • Evitar la multiplicación de alertas aisladas.
  • Identificar más rápidamente la causa probable.
  • Visualizar el impacto global de un incidente en varios recursos.

Constituyen una capa de IA de correlación temporal y relacional basada en la detección de anomalías.

Ejemplo:
Se genera una anomalía cuando un host denominado VMHost1 deja de estar disponible. Poco después, las máquinas virtuales VM1 y VM2 también entran en estado de anomalía. Dado que estos recursos están relacionados y que las anomalías se producen en el mismo intervalo de tiempo, se agrupan en un único problema.

Esta agrupación permite comprender rápidamente que la causa probable es la pérdida del host, y no tres incidentes independientes.

Las anomalías aparecen en la página dedicada desde MONITOR > Estado > Problemas.

Al seleccionar una opción en el menú superior, se muestra el número de problemas que hay en las insignias.

Páginas de ML

Las páginas de ML presentes en cada panel de control estándar de ServicePilot ofrecen un análisis avanzado de las métricas gracias a modelos de aprendizaje automático aplicados a las series temporales. Se centran en la evolución de los valores a lo largo del tiempo: picos, tendencias y previsiones.

Esto permite identificar comportamientos inusuales o emergentes en los indicadores, anticipar riesgos y comprender mejor la dinámica de los recursos supervisados.

Los widgets de ML integrados realizan varios tipos de análisis:

  • Detección de picos: identificación automática de valores anormalmente altos o bajos para un indicador determinado, en función de su historial.
  • Análisis de tendencias: cálculo de tendencias a lo largo de 24 horas y 30 días para visualizar la evolución de un indicador: aumento, descenso o estabilidad.
  • Previsión del umbral crítico: estimación del número de días que quedan antes de que un indicador alcance un umbral crítico, basándose en la tendencia observada.

Ejemplos:

  • Un pico aislado de la CPU puede indicar una carga puntual, pero una fuerte tendencia al alza a lo largo de 30 días puede revelar un riesgo de saturación.
  • Una previsión que indique que un disco alcanzará su umbral crítico en 12 días permite planificar una ampliación de la capacidad o una limpieza de datos.
  • Una tendencia a la baja del tráfico de aplicaciones puede indicar un problema de uso o de conectividad.

Las Páginas de ML son, por lo tanto, una herramienta de apoyo a la toma de decisiones basada en el análisis de la evolución de las métricas a lo largo del tiempo.

Se puede acceder a los análisis de ML desde una pestaña de los paneles de control estándar de cada familia tecnológica, tanto los de cada paquete como los de recursos específicos.

Búsqueda interna con IA

La búsqueda interna con IA de ServicePilot es un motor de búsqueda inteligente diseñado para ayudar al usuario a encontrar rápidamente información en la plataforma.

Se basa en una IA interna ligera, sin LLM, para mejorar la relevancia de los resultados al tiempo que garantiza rapidez y coherencia. A diferencia de la búsqueda externa con LLM, esta búsqueda no interpreta el lenguaje natural de forma conversacional. Optimiza la búsqueda en los contenidos del producto y de la documentación, no en textos libres.

La búsqueda interna con IA abarca varias áreas clave de la plataforma:

  • Documentación: páginas de ayuda, guías, conceptos.
  • Packages: búsqueda por nombre, tecnología, uso.
  • Cuadros de mando: paneles estándar, personalizados, por recurso.
  • SQL: consultas, vistas, elementos relacionados con los datos.
  • Datos: objetos, recursos, indicadores, eventos.

Esta búsqueda centralizada permite navegar rápidamente por todo el ecosistema de ServicePilot.

Se puede acceder al modal de ServicePilotAI desde el icono del robot, situado en el menú superior.

Búsqueda externa con LLM

ServicePilot permite conectar un LLM externo para disfrutar de una búsqueda conversacional y de una comprensión avanzada del lenguaje natural.

Al configurar un LLM (utilizando la API de OpenAI), el usuario puede:

  • Formular preguntas en lenguaje natural.
  • Obtener respuestas contextualizadas.
  • Solicitar explicaciones o resúmenes.
  • Generar texto o análisis.

La configuración se realiza en los ajustes de ServicePilot, en la sección dedicada a las integraciones de IA externas.

Se puede acceder a la ventana emergente de ServicePilotAI desde el icono del robot en el menú superior.