ServicePilot Documentación

Gestionar los datos

Los agentes del ServicePilot recogen o reciben datos que se añaden a la base de datos del ServicePilot. La configuración del ServicePilot determina lo que debe guardarse y por cuánto tiempo. Dependiendo de la fuente de datos vigilada, pueden almacenarse otras estadísticas calculadas.

Ejemplo: Se busca un servidor disk size y disk bytes used. Usando esta información, un disk usage percentage se calcula y se almacena en la base de datos.

Supervisión de los períodos

Por defecto, ServicePilot consulta y almacena datos continuamente. Es posible modificar este comportamiento utilizando policies de monitoring que incluyen períodos para la recolección de datos.

Ejemplo: Aplique un policy de monitoring en una vista que contiene todos los recursos de un sitio. Este policy de monitoring contiene una definición de períodos indicando que la vigilancia sólo debe tener lugar durante el horario de trabajo de la empresa. Fuera de este lapso de tiempo, los recursos del sitio no serán monitoreados y su estado será unknown.

Time period definition

Monitoring policy with Time period definition

Suele ser útil definir períodos de vigilancia cuando se sabe que los elementos tienen paradas de mantenimiento o reinicios programados.

Gestión de objetos

Aunque los períodos de mantenimiento programados o los reinicios pueden ocurrir en momentos conocidos, puede ser necesaria una gestión ad hoc de los recursos para dejar de alertar sobre los problemas en curso.

Ejemplo: Una interfaz de red está causando problemas y ha sido retirada del servicio hasta que el problema se haya resuelto. La alerta de ServicePilot para esta interfaz debe ser desactivada.

Es posible declarar como unmanage un objeto individual o una parte entera de la jerarquía supervisada seleccionando una vista. El acceso a la función unmanage está disponible en la jerarquía de vistas o en la lista de estatus.

Acceso a la función Unmanage en un objeto del mapa

  1. Como usuario con al menos los siguientes privilegios operator, navegar en el Mapa hasta que la vista que desea poner unmanage está abierto Map menu item
  2. Haga clic en el Manage Manage button

Acceso a la función Unmanage en una vista del mapa

  1. Como usuario con al menos los siguientes privilegios operator, navegar en el Mapa hasta que la vista que desea poner unmanage está abierto Map menu item
  2. Haga clic en el icono View information View information icon
  3. Haga clic en el Manage Manage button

Acceder a la función Unmanage desde las listas de estado

  1. Como usuario con al menos los siguientes privilegios operator, navegar en el Estado Status menu item
  2. Seleccione Recurso, Objeto o Vista en el submenú El estado depende del componente que se quiera poner en unmanage Status sub-menu
  3. Seleccione uno o más elementos para establecer unmanage y luego haga clic en el botón gris unmanage Manage button

Ponga Manage o Unmanage los elementos

Una vez que se abre el cuadro de diálogo de gestión, puede elegir poner en manage (reiniciar la vigilancia) o unmanage (dejar de monitorear) el artículo seleccionado. Si ha seleccionado una vista, esto afectará a la vista y a todos sus subelementos.

Cuando se "unmanage" un artículo, también se puede pedir a ServicePilot que deje de almacenar datos de ese artículo en la base de datos. Si simplemente se unmanage el artículo, los datos del indicador monitoreado seguirán siendo recuperados y almacenados, pero el estado de los artículos será unknown.

Si desea iniciar la operación en una fecha posterior o especificar cuándo ServicePilot debe comenzar a supervisar de nuevo, puede rellenar los campos de fecha y hora. Son opcionales porque la acción predeterminada es detener o iniciar la operación inmediatamente.

Se puede añadir una nota para que los usuarios de ServicePilot puedan entender por qué se ha tomado esta medida.

Manage dialog

Eliminar los objetos

Aunque raramente se necesita, es posible eliminar objetos de la configuración del ServicePilot. Sólo los objetos creados automáticamente por ServicePilot pueden ser eliminados de esta manera. Para detener la vigilancia del equipo, suele ser un usuario administrador ServicePilot que eliminará el recurso de la configuración o cambiará la configuración del recurso para dejar de monitorear un elemento en particular.

La eliminación de un objeto no eliminará de la base de datos los datos históricos asociados a ese objeto, por lo que seguirá mostrándose en los cuadros de mandos que consultan la información cuando el objeto estaba todavía presente.

Tenga en cuenta que si un objeto es eliminado, puede reaparecer si el componente está todavía presente cuando el próximo script de descubrimiento. En este caso, el objeto debe ser eliminado utilizando los filtros presentes en los parámetros de los recursos, y si esto no es posible, entonces siempre es posible poner en unmanage el objeto.

Ejemplo: ServicePilot monitoriza un servidor con múltiples volúmenes de disco. Uno de los volúmenes del disco se borra permanentemente. El objeto correspondiente puede ser eliminado, ya que normalmente no volverá a aparecer.

Borrar un objeto del mapa

  1. Usar una cuenta con privilegios administradores, navegar en el Mapa hasta que el objeto que quieres borrar esté abierto Map menu item
  2. Haga clic en el enlace Delete ObjectDelete Object link

La frecuencia de polling

Muchas de las estadísticas recopiladas por ServicePilot se obtienen mediante un equipo de sondeo cada minuto para obtener su valor o estado actual. Las estadísticas recopiladas se definen en los packages proporcionados y se ven afectadas por la configuración de los recursos y por las policies aplicados a estos recursos.

Los datos recopilados se dividen en tres categorías según el tipo de recopilación. La forma en que se establece la frecuencia de las encuestas depende del tipo de colección.

Tipo de colección Cambiar el período de polling Cambiar la frecuencia de polling Cambiar la frecuencia de descubrimiento Cambiar confirmación No response Cambiar duración antes No response Estado No response
Ping Monitoring policy Monitoring policy N/A Monitoring policy N/A Monitoring policy
SNMP queries Monitoring policy Monitoring policy Monitoring policy Monitoring policy N/A Monitoring policy
Other queries Monitoring policy Parámetro del recurso Parámetro del recurso N/A Monitoring policy Monitoring policy

Si un dispositivo encuestado no responde, ServicePilot cambia el objeto a no response pending. Dependiendo del número de veces que esto necesite ser confirmado, el objeto se ajustará a no response.

La frecuencia de polling, la frecuencia de descubrimiento, el número de confirmaciones y/o no hay tiempo de respuesta antes de que se declare un retraso y el estado en el que se encuentra el objeto puede modificarse aplicando las monitoting policies.

Polling Ping

Una vez por minuto, el agente ServicePilot envía una solicitud de ICMP Echo y espera una respuesta. Si el agente ServicePilot no recibe una respuesta, lo intentará una segunda vez, en el mismo minuto. Si no hay respuesta, el objeto se clasificará como unavailable.

Polling SNMP

LLos datos pueden obtenerse interrogando al equipo utilizando Polling SNMP. En general, los OID individuales se obtienen una vez por minuto, mientras que las tablas se descargan cada 6 horas. La tabla de descubrimiento se descarga según la frecuencia de descubrimiento y se utiliza para comprobar si se ha añadido nuevo equipo. Se crean nuevos objetos y se les consulta cada minuto.

Ejemplo: Uno switch se supervisa para obtener datos de una serie de interfaces Ethernet activas. Cada 6 horas, la lista de interfaces activas se descarga y las interfaces previamente inactivas se añaden a la lista de interfaces y luego se consultan cada minuto.

Si se hacen cambios en la configuración de los recursos, los script de descubrimiento se reinician inmediatamente después de que los cambios se hayan implementado.

Un objeto que obtiene datos por consulta SNMP se encuentra por defecto a un no response pending si no ha recibido ningún dato en un minuto (sin confirmación). Esto significa que el objeto irá directamente al estado no response si no recibe datos. En este caso, el objeto cambia entonces al informe unknown. La razón para usar unknown en lugar de unavailable es que es común tener un objeto Ping para el mismo equipo, y para evitar múltiples alertas por el mismo problema, es preferible tener un solo objeto que se convierta en unavailable.

Otros tipos de consultas

Los agentes ServicePilot utilizan muchos otros métodos para obtener datos del equipo. Por ejemplo, las consultas WMI Windows, TCP checks, consultas SQL y consultas de páginas web, entre otras.

Resource polling interval

La frecuencia mínima de consulta es siempre de 1 minuto, pero es común consultar los artículos con menos frecuencia. Tenga en cuenta que incluso si se establece la frecuencia de la consulta, no permite especificar a qué hora tendrá lugar cada consulta. Por esta razón, establecer un valor alto para la frecuencia de los sondeos no tiene mucho sentido porque no se sabrá cuándo se realizarán los sondeos durante el día.

El estado de no response del objeto se establecerá después de un cierto número de minutos durante los cuales no se han enviado datos entre el Agente ServicePilot y ServicePilot.

Cuando se determina que el objeto está en un estado de no response, el estado del objeto cambiará a unknown o unavailable (según la definición del package utilizado).

Por ejemplo, un objeto de control de web cambiará al estado unavailable si no se reciben datos durante una hora. Web App No response

Un objeto de disco del servidor irá al estado unknown si no se reciben datos durante 10 minutos. Server Disk No response

Datos del evento

Algunos datos que recibe ServicePilot pueden estar basados en hechos no solicitados. Por ejemplo, un mensaje syslog o un Trap SNMP se envía al agente de ServicePilot.

Este tipo de datos está asociado al recurso que se utilizó para configurar el agente ServicePilot para que aceptara estos datos. Sin embargo, los datos no se almacenan como indicadores en los objetos. Por otra parte, los eventos se almacenan en la base de datos según el tipo de datos (Syslogs, SNMP Traps, VoIP call records). A continuación, se proporcionan cuadros de mando para visualizar estos datos de eventos de forma estándar. Se pueden añadir consultas personalizadas para filtrar los datos o mostrar la información de otras maneras.

Retención de datos

ServicePilot retiene los datos durante un período de tiempo limitado para reducir la cantidad de espacio en disco necesario y gestionar la velocidad de ejecución de las consultas. Los datos numéricos de los indicadores pueden resumirse y conservarse más tiempo, pero como promedios, mínimos y máximos de los datos realmente reunidos. Por lo tanto, es posible crear un gráfico de un indicador considerando sólo los promedios diarios a lo largo de un año. Si luego haces un zoom en un período más corto, puedes ver los promedios horarios, pero sólo de los últimos 3 meses, o los promedios trimestrales del último mes, o los promedios trimestrales del último mes, o los datos de los minutos, pero sólo de los últimos 7 días.

Otros tipos de datos no pueden ser comprimidos de esta manera, por lo que los datos se mantienen durante un período de tiempo más corto. La consulta de estos datos también requiere mucho más tiempo, por lo que la elección de un período de tiempo más corto le permitirá obtener resultados más rápidamente.

Algunos datos se almacenan en la base de datos, pero no se guarda ningún historial. Por ejemplo, este es el caso del estado actual de todos los objetos y datos de inventario.

Nota: La monitorización gratuita del ServicePilot no almacena ningún dato histórico en la base de datos. Sólo se puede ver el estado actual de los recursos vigilados. Por lo tanto, muchos tableros e informes estarán vacíos.

Tipo de datos Retención
Datos de los indicadores 7 días
Datos resumidos del indicator por cuarto de hora 30 dias
Datos resumidos de los indicadores por hora 90 dias
Datos resumidos de los indicadores por día 365 dias
Disponibilidad y rendimiento de los objetos 90 dias
Resumen diario de la disponibilidad y el rendimiento de los objetos 365 dias
Eventos y cambios de estado detectados por ServicePilot 90 dias
Syslogs 60 dias
Traps SNMP y notificaciones 60 dias
Grabaciones de calidad de llamadas VoIP 90 dias
IP Flow, IPFIX, NetFlow, sFlow, Jflow 30 dias
Rastros de las aplicaciones Web 7 dias
Registrar los datos asociados a los objetos 30 dias

Empiece Ahora