Documentation
Descubre el modo de configuración cero

Funcionamiento de ServicePilot

Gestionar los datos

Los agentes del ServicePilot recogen o reciben datos que se añaden a la base de datos del ServicePilot. La configuración del ServicePilot determina lo que debe guardarse y por cuánto tiempo. Dependiendo de la fuente de datos monitorizados, se pueden almacenar otras estadísticas calculadas.

Ejemplo: se busca un servidor disk size y disk bytes used. Usando esta información, un disk usage percentage se calcula y se almacena en la base de datos.

Supervisión de los períodos

Por defecto, ServicePilot consulta y almacena datos continuamente. Es posible modificar este comportamiento utilizando Policies de monitoring que incluyen períodos para la recolección de datos.

Ejemplo: aplique un Policy de monitoring en una vista que contiene todos los recursos de un sitio. Este Policy de monitoring contiene una definición de períodos indicando que la vigilancia sólo debe tener lugar durante el horario de trabajo de la empresa. Fuera de este lapso de tiempo, los recursos del sitio no serán monitoreados y su estado será unknown.

Time period definition

Monitoring policy with Time period definition

Suele ser útil definir períodos de vigilancia cuando se sabe que los elementos tienen paradas de mantenimiento o reinicios programados.

Gestión de objetos

Aunque los períodos de mantenimiento programados o los reinicios pueden ocurrir en momentos conocidos, puede ser necesaria una gestión ad hoc de los recursos para dejar de alertar sobre los problemas en curso.

Ejemplo: una interfaz de red está causando problemas y ha sido retirada del servicio hasta que el problema se haya resuelto. La alerta de ServicePilot para esta interfaz debe ser desactivada.

Es posible declarar como unmanage un objeto individual o una parte entera de la jerarquía supervisada seleccionando una vista. El acceso a la función unmanage está disponible en la jerarquía de vistas o en la lista de estatus.

Acceder a la función de desmanejo de un objeto desde la jerarquía de vistas

1. Como usuario con al menos los siguientes privilegios operator, navegar hasta el submenú Vista hasta que la vista que desea poner unmanage está abierto
2. Haga clic en el Manage

Acceder a la función de desadministración de una vista desde la jerarquía de vistas

1. Como usuario con al menos los siguientes privilegios operator, navegar hasta el submenú Vista hasta que la vista que desea poner unmanage está abierto
2. Haga clic en el icono View information View information icon
3. Haga clic en el Manage

Acceder a la función Unmanage desde las listas de estado

1. Como usuario con al menos los siguientes privilegios operator, navegar en el Estado
2. Seleccione Recurso, Objeto o Vista en el submenú El estado depende del componente que se quiera poner en unmanage
3. Seleccione uno o más elementos para establecer unmanage y luego haga clic en el botón naranja Manage/Unmanage

Ponga Manage o Unmanage los elementos

Manage dialog

Una vez que se abre el cuadro de diálogo de gestión, puede elegir poner en manage (reiniciar la vigilancia) o unmanage (dejar de monitorear) el artículo seleccionado. Si ha seleccionado una vista, esto afectará a la vista y a todos sus subelementos.

Cuando se "unmanage" un artículo, también se puede pedir a ServicePilot que deje de almacenar datos de ese artículo en la base de datos. Si simplemente se unmanage el artículo, los datos del indicador monitoreado seguirán siendo recuperados y almacenados, pero el estado de los artículos será unknown. Si se "unmanage" los objetos y se dejan de almacenar datos, los objetos ya no se cuentan para el uso de la licencia; se convierten en objetos "free".

Si desea iniciar la operación en una fecha posterior o especificar cuándo ServicePilot debe comenzar a supervisar de nuevo, puede rellenar los campos de fecha y hora. Son opcionales porque la acción predeterminada es detener o iniciar la operación inmediatamente.

Se puede añadir una nota para que los usuarios de ServicePilot puedan entender por qué se ha tomado esta medida.

Eliminar los objetos

Aunque raramente se necesita, es posible eliminar objetos de la configuración del ServicePilot. Sólo los objetos creados automáticamente por ServicePilot pueden ser eliminados de esta manera. Para detener la vigilancia del equipo, suele ser un usuario administrador ServicePilot que eliminará el recurso de la configuración o cambiará la configuración del recurso para dejar de monitorear un elemento en particular.

La eliminación de un objeto no eliminará de la base de datos los datos históricos asociados a ese objeto. El objeto seguirá apareciendo en los cuadros de mando que solicitan información cuando el objeto aún estaba presente.

Tenga en cuenta que si un objeto es eliminado, puede reaparecer si el componente está todavía presente cuando el próximo script de descubrimiento. En este caso, el objeto debe ser eliminado utilizando los parámetros de los recursos, y si esto no es posible, se puede establecer en unmanage.

Ejemplo: ServicePilot monitoriza un servidor con múltiples volúmenes de disco. Uno de los volúmenes del disco se borra permanentemente. El objeto correspondiente puede ser eliminado, ya que normalmente no volverá a aparecer.

Eliminar un objeto de la jerarquía de vistas

Sólo para los objetos creados automáticamente por ServicePilot.

1. Usar una cuenta con privilegios administradores, navegar en el submenú Vista hasta que el objeto que quieres borrar esté abierto
2. Haga clic en el enlace Delete Object

Re-load a custom package

En el caso de las instalaciones On Premise de ServicePilot, cuando se añaden o modifican packages custom, es necesario obligar a ServicePilot a recargar su configuración para que se tengan en cuenta estos cambios. Esto puede hacerse de dos maneras:

1. Utilizando una cuenta con privilegios de administradores, acceda a ServicePilot
2. Abrir AJUSTES > Configuración
3. Navegue hasta la pestaña Avanzadas
4. Haga clic en el botón Recargar de la sección Packages

También es posible llamar a este método utilizando una API de ServicePilot. Consulte las instrucciones de la API Volver a cargar la configuración.

La frecuencia de polling

Muchas de las estadísticas recopiladas por ServicePilot se obtienen mediante un equipo de sondeo cada minuto para obtener su valor o estado actual. Las estadísticas recopiladas se definen en los packages proporcionados y se ven afectadas por la configuración de los recursos y por las Policies aplicados a estos recursos.

Los datos recopilados se dividen en tres categorías según el tipo de recopilación. La forma en que se establece la frecuencia de las encuestas depende del tipo de colección.

Tipo de colección Ping Consultas SNMP Otras consultas
Cambiar el período de polling Monitoring policy Monitoring policy Monitoring policy
Cambiar la frecuencia de polling Monitoring policy Monitoring policy Resource parameter
Cambiar la frecuencia de descubrimiento N/A Monitoring policy Resource parameter
Cambiar confirmación No response Monitoring policy Monitoring policy N/A
Cambiar duración antes No response N/A N/A Monitoring policy
Estado No response Monitoring policy Monitoring policy Monitoring policy

Si un dispositivo encuestado no responde, ServicePilot cambia el objeto a no response pending. En función del número de veces que sea necesario confirmarlo, el objeto pasará posteriormente a un estado deno response.

La frecuencia de polling, la frecuencia de descubrimiento, el número de confirmaciones, no hay tiempo de respuesta antes de que se declare un retraso y el estado en el que se encuentra el objeto puede modificarse aplicando las monitoring policies.

Polling Ping

Una vez por minuto, el agente ServicePilot envía una solicitud de ICMP Echo y espera una respuesta. Si el agente ServicePilot no recibe una respuesta, lo intentará una segunda vez, en el mismo minuto. Si no hay respuesta, el objeto se clasificará como unavailable.

Polling SNMP

LLos datos pueden obtenerse interrogando al equipo utilizando Polling SNMP. En general, los OID individuales se obtienen una vez por minuto, mientras que las tablas se descargan cada 6 horas. La tabla de descubrimiento se descarga según la frecuencia de descubrimiento y se utiliza para comprobar si se ha añadido nuevo equipo. Se crean nuevos objetos y se les consulta cada minuto.

Ejemplo: Uno switch se supervisa para obtener datos de una serie de interfaces Ethernet activas. Cada 6 horas, la lista de interfaces activas se descarga y las interfaces previamente inactivas se añaden a la lista de interfaces y luego se consultan cada minuto.

Si se hacen cambios en la configuración de los recursos, los script de descubrimiento se reinician inmediatamente después de que los cambios se hayan implementado.

Un objeto que obtiene datos por consulta SNMP se encuentra por defecto a un no response pending si no ha recibido ningún dato en un minuto (sin confirmación). Esto significa que el objeto irá directamente al estado no response si no recibe datos. En este caso, el objeto cambia entonces al informe unknown. La razón para usar unknown en lugar de unavailable es que es común tener un objeto Ping para el mismo equipo, y para evitar múltiples alertas por el mismo problema, es preferible tener un solo objeto que se convierta en unavailable.

Otros tipos de consultas

Los agentes ServicePilot utilizan muchos otros métodos para obtener datos del equipo. Por ejemplo, las consultas WMI Windows, TCP checks, consultas SQL y consultas de páginas web, entre otras.

Resource polling interval

La frecuencia mínima de consulta es siempre de 1 minuto, pero es común consultar los artículos con menos frecuencia. Tenga en cuenta que incluso si se establece la frecuencia de la consulta, no permite especificar a qué hora tendrá lugar cada consulta. Por esta razón, establecer un valor alto para la frecuencia de los sondeos no tiene mucho sentido porque no se sabrá cuándo se realizarán los sondeos durante el día.

El estado de no response del objeto se establecerá después de un cierto número de minutos durante los cuales no se han enviado datos entre el Agente ServicePilot y ServicePilot.

Cuando se determina que el objeto está en un estado de no response, el estado del objeto cambiará a unknown o unavailable (según la definición del package utilizado).

Por ejemplo, un objeto de control de web cambiará al estado unavailable si no se reciben datos durante una hora.
Web App No response

Un objeto de disco del servidor irá al estado unknown si no se reciben datos durante 10 minutos.
Server Disk No response

Datos del evento

Algunos datos que recibe ServicePilot pueden estar basados en hechos no solicitados. Por ejemplo, un mensaje syslog o un Trap SNMP se envía a un Agente ServicePilot.

Este tipo de datos está asociado al recurso que se utilizó para configurar el agente ServicePilot para que aceptara estos datos. Sin embargo, los datos no se almacenan como indicadores en los objetos. Por otra parte, los eventos se almacenan en la base de datos según el tipo de datos (Syslogs, SNMP Traps, VoIP call records). A continuación, se proporcionan cuadros de mando para visualizar estos datos de eventos de forma estándar. Se pueden añadir consultas personalizadas para filtrar los datos o mostrar la información de otras maneras.

Retención de datos

ServicePilot retiene los datos durante un período de tiempo limitado para reducir la cantidad de espacio en disco necesario y gestionar la velocidad de ejecución de las consultas. Los datos numéricos de los indicadores pueden resumirse y conservarse más tiempo, pero como promedios, mínimos y máximos de los datos realmente reunidos. Por lo tanto, es posible crear un gráfico de un indicador considerando sólo los promedios diarios a lo largo de un año. Si luego haces un zoom en un período más corto, puedes ver los promedios horarios, pero sólo de los últimos 3 meses, o los promedios trimestrales del último mes, o los promedios trimestrales del último mes, o los datos de los minutos, pero sólo de los últimos 7 días.

Otros tipos de datos no pueden ser comprimidos de esta manera, por lo que los datos se mantienen durante un período de tiempo más corto. La consulta de estos datos también requiere mucho más tiempo, por lo que la elección de un período de tiempo más corto le permitirá obtener resultados más rápidamente.

Algunos datos se almacenan en la base de datos, pero no se guarda ningún historial. Por ejemplo, este es el caso del estado actual de todos los objetos y datos de inventario.

Nota: La monitorización gratuita del ServicePilot no almacena ningún dato histórico en la base de datos. Sólo se puede ver el estado actual de los recursos vigilados. Por lo tanto, muchos tableros e informes estarán vacíos.

Tipo de datos Retención
Datos de los indicadores 7 días
Datos resumidos del indicator por cuarto de hora 30 días
Datos resumidos de los indicadores por hora 365 días
Disponibilidad y rendimiento de los objetos 90 días
Resumen diario de la disponibilidad y el rendimiento de los objetos 365 días
Eventos y cambios de estado detectados por ServicePilot 90 días
Syslogs 60 días
Traps SNMP y notificaciones 60 días
Grabaciones de calidad de llamadas VoIP 90 días
IP Flow, IPFIX, NetFlow, sFlow, Jflow 30 días
Rastros de las aplicaciones Web 7 días
Registrar los datos asociados a los objetos 30 días