ServicePilot SaaS Documentación

Recopilación de datos

Los agentes del ServicePilot recogen o reciben datos que se añaden a la base de datos del ServicePilot. La configuración del ServicePilot determina lo que debe guardarse y por cuánto tiempo. Dependiendo de la fuente de datos vigilada, pueden almacenarse otras estadísticas calculadas.

Ejemplo: Se busca un servidor disk size y disk bytes used. Usando esta información, un disk usage percentage se calcula y se almacena en la base de datos.

Los datos de la encuesta

Muchas de las estadísticas recopiladas por ServicePilot se obtienen mediante un equipo de sondeo cada minuto para obtener su valor o estado actual. Las estadísticas recopiladas se definen en los paquetes proporcionados y se ven afectadas por la configuración de los recursos y por la policies aplicado a estos recursos.

Consulta Ping

Un ejemplo sencillo de datos consultados es un Ping o ICMP Echo a una dirección IP. En la configuración de ServicePilot, si se añade un recurso con una dirección IP remota para consultar, los datos devueltos contienen el tiempo de respuesta en milisegundos entre el agente ServicePilot y la dirección IP remota.

Una vez por minuto, el agente de ServicePilot enviará el Ping y esperar la respuesta. Si el agente de ServicePilot no obtiene una respuesta, lo intentará una segunda vez, en el mismo minuto. Si no se responde a ninguna de las dos peticiones, se considerará que el objeto ServicePilot está en un no response pending. Un segundo minuto de votación puede tener éxito o fracasar. Dependiendo del número de veces que esto tenga que ser confirmado, el objeto cambiará al estado no response. Esto hará que el objeto entre en el estado unavailable.

El frecuencia de consulta, el número de confirmaciones y el estado en el que el objeto terminará puede ser modificado aplicando policies.

Consulta SNMP

Los datos pueden obtenerse interrogando al equipo utilizando Consulta SNMP. Esto es similar a la consulta Ping pero con algunas diferencias. Los datos resultantes incluyen una serie de consultas SNMP OID, ya sea para valores individuales o para toda una tabla de datos.

En general, el OIDs se obtendrán cada minuto mientras que las tablas se descargarán cada 6 horas. Las tablas de descubrimiento se recuperan de acuerdo con la frecuencia de descubrimiento y se utilizan para comprobar si se han añadido nuevos elementos. Se crean nuevos objetos y se consultan cada minuto.

Ejemplo: Uno switch se supervisa para obtener datos de una serie de interfaces Ethernet activas. Cada 6 horas, la lista de interfaces activas se descarga y las interfaces previamente inactivas se añaden a la lista de interfaces y luego se consultan cada minuto.

Si se hacen cambios en la configuración de los recursos, la guiones de descubrimiento se reinician inmediatamente después de que los cambios se hayan implementado.

Un objeto que obtiene datos por consulta SNMP se encuentra por defecto a un no response pending si no ha recibido ningún dato en un minuto (sin confirmación). Esto significa que el objeto irá directamente al estado no response si no recibe datos. En este caso, el objeto cambia entonces al informe unknown. La razón para usar unknown en lugar de unavailable es que es común tener un objeto Ping para el mismo equipo, y para evitar múltiples alertas por el mismo problema, es preferible tener un solo objeto que se convierta en unavailable.

El frecuencia de consulta, el frecuencia de descubrimiento, el número de confirmaciones y el estado en el cual el objeto es transitado puede ser modificado aplicando policies.

Otros tipos de consultas

Los agentes ServicePilot utilizan muchos otros métodos para obtener datos del equipo. Por ejemplo, las consultas WMI Windows, Comprobaciones de puertos TCP, consultas SQL y consultas de páginas web, entre otras. En estos casos, la frecuencia de la consulta está determinada por el paquete y la configuración de los recursos.

Resource polling interval

a frecuencia mínima de consulta es siempre de 1 minuto, pero es común consultar los artículos con menos frecuencia. Tenga en cuenta que incluso si se establece la frecuencia de la consulta, no permite especificar a qué hora tendrá lugar cada consulta. Por esta razón, establecer un valor alto para la frecuencia de los sondeos no tiene mucho sentido porque no se sabrá cuándo se realizarán los sondeos durante el día.

Para todos estos otros tipos de recopilación de datos clasificados como custom, el estado no response el objeto se definirá después de un cierto número de minutos durante los cuales no se ha enviado ningún dato entre el agente ServicePilot y el ServicePilot.

Cuando se determina que el objeto está en un estado de no response, el estado del objeto cambiará a unknown o unavailable (según la definición del paquete utilizado).

Por ejemplo, un objeto de control de web cambiará al estado unavailable si no se reciben datos durante una hora. Web App No response

Un objeto de disco del servidor irá al estado unknown si no se reciben datos durante 10 minutos. Server Disk No response

El duración de no response antes de que se declare un período de espera y el estado que se utilizará puede modificarse aplicando policies.

Supervisión de los períodos

Por defecto, ServicePilot consulta y almacena datos continuamente. Es posible modificar este comportamiento utilizando policies de monitoring que incluyen períodos para la recolección de datos.

Ejemplo: Aplique un policy de monitoring en una vista que contiene todos los recursos de un sitio. Este policy de monitoring contiene una definición de períodos indicando que la vigilancia sólo debe tener lugar durante el horario de trabajo de la empresa. Fuera de este lapso de tiempo, los recursos del sitio no serán monitoreados y su estado será unknown.

Time period definition

Monitoring policy with Time period definition

Suele ser útil definir períodos de vigilancia cuando se sabe que los elementos tienen paradas de mantenimiento o reinicios programados.

Gestión de objetos

Aunque los períodos de mantenimiento programados o los reinicios pueden ocurrir en momentos conocidos, puede ser necesaria una gestión ad hoc de los recursos para dejar de alertar sobre los problemas en curso.

Ejemplo: Una interfaz de red está causando problemas y ha sido retirada del servicio hasta que el problema se haya resuelto. La alerta de ServicePilot para esta interfaz debe ser desactivada.

Es posible declarar como unmanage un objeto individual o una parte entera de la jerarquía supervisada seleccionando una vista. L'accès à la fonction unmanage está disponible en la jerarquía de vistas o en la lista de estatus.

Accès à la fonction Unmanage sur un objet depuis la carte

  1. En tant qu'utilisateur avec au moins les privilèges operator, naviguez dans la Carte jusqu'à ce que l'objet que vous souhaitez mettre en unmanage soit ouvert Map menu item
  2. Cliquez sur le bouton ManageManage button

Acceso a la función Unmanage en una vista del mapa

  1. Como usuario con al menos los siguientes privilegios operator, navegar en el Mapa hasta que la vista que desea poner unmanage está abierto Map menu item
  2. Haga clic en el icono View information View information icon
  3. Haga clic en el Manage Manage button

Acceder a la función Unmanage desde las listas de estado

  1. Como usuario con al menos los siguientes privilegios operator, navegar en el Estado Status menu item
  2. Seleccione Recurso, Objeto o Vista en el submenú El estado depende del componente que se quiera poner en una sola gestión Status sub-menu
  3. Seleccione uno o más elementos para establecer unmanage y luego haga clic en el botón gris unmanage Manage button

Ponga Manage o Unmanage los elementos

Una vez que se abre el cuadro de diálogo de gestión, puede elegir poner en manage (reiniciar la vigilancia) o unmanage (dejar de monitorear) el artículo seleccionado. Si ha seleccionado una vista, esto afectará a la vista y a todos sus subelementos.

Cuando tú "unmanage" un artículo, también puede pedirle a ServicePilot que deje de almacenar datos de ese artículo en la base de datos. Si nosotros unmanagesimplemente el artículo, los datos del indicador monitoreado seguirán siendo recuperados y almacenados, pero el estado de los artículos será unknown.

Si desea iniciar la operación en una fecha posterior o especificar cuándo ServicePilot debe comenzar a supervisar de nuevo, puede rellenar los campos de fecha y hora. Son opcionales porque la acción predeterminada es detener o iniciar la operación inmediatamente.

Se puede añadir una nota para que los usuarios de ServicePilot puedan entender por qué se ha tomado esta medida.

Manage dialog

Eliminar los objetos

Aunque raramente se necesita, es posible eliminar objetos de la configuración del ServicePilot. Sólo los objetos creados automáticamente por ServicePilot pueden ser eliminados de esta manera. Para detener la vigilancia del equipo, suele ser un usuario administrador ServicePilot que eliminará el recurso de la configuración o cambiará la configuración del recurso para dejar de monitorear un elemento en particular.

La eliminación de un objeto no eliminará de la base de datos los datos históricos asociados a ese objeto, por lo que seguirá mostrándose en los cuadros de mandos que consultan la información cuando el objeto estaba todavía presente.

Tenga en cuenta que si un objeto es eliminado, puede reaparecer si el componente está todavía presente cuando el próximo guión de descubrimiento. En este caso, el objeto debe ser eliminado utilizando los filtros presentes en los parámetros de los recursos, y si esto no es posible, entonces siempre es posible poner en unmanage el objeto.

Ejemplo: ServicePilot monitoriza un servidor con múltiples volúmenes de disco. Uno de los volúmenes del disco se borra permanentemente. El objeto correspondiente puede ser eliminado, ya que normalmente no volverá a aparecer.

Borrar un objeto del mapa

  1. Usar una cuenta con privilegios administradores, navegar en el Mapa hasta que el objeto que quieres borrar esté abierto Map menu item
  2. Haga clic en el enlace Delete ObjectDelete Object link

Datos del evento

Algunos datos que recibe ServicePilot pueden estar basados en hechos no solicitados. Por ejemplo, un mensaje syslog o un Trap SNMP se envía al agente de ServicePilot.

Este tipo de datos está asociado al recurso que se utilizó para configurar el agente ServicePilot para que aceptara estos datos. Sin embargo, los datos no se almacenan como indicadores en los objetos. Por otra parte, los eventos se almacenan en la base de datos según el tipo de datos (Syslogs, SNMP Traps, VoIP call records). A continuación, se proporcionan paneles para visualizar estos datos de eventos de forma estándar. Se pueden añadir consultas personalizadas para filtrar los datos o mostrar la información de otras maneras.

Retención de datos

ServicePilot retiene los datos durante un período de tiempo limitado para reducir la cantidad de espacio en disco necesario y gestionar la velocidad de ejecución de las consultas. Los datos numéricos de los indicadores pueden resumirse y conservarse más tiempo, pero como promedios, mínimos y máximos de los datos realmente reunidos. Por lo tanto, es posible crear un gráfico de un indicador considerando sólo los promedios diarios a lo largo de un año. Si luego haces un zoom en un período más corto, puedes ver los promedios horarios, pero sólo de los últimos 3 meses, o los promedios trimestrales del último mes, o los promedios trimestrales del último mes, o los datos de los minutos, pero sólo de los últimos 7 días.

Otros tipos de datos no pueden ser comprimidos de esta manera, por lo que los datos se mantienen durante un período de tiempo más corto. La consulta de estos datos también requiere mucho más tiempo, por lo que la elección de un período de tiempo más corto le permitirá obtener resultados más rápidamente.

Algunos datos se almacenan en la base de datos, pero no se guarda ningún historial. Por ejemplo, este es el caso del estado actual de todos los objetos y datos de inventario.

Nota: La monitorización gratuita del ServicePilot no almacena ningún dato histórico en la base de datos. Sólo se puede ver el estado actual de los recursos vigilados. Por lo tanto, muchos tableros e informes estarán vacíos.

Tipo de datos Retención
Datos de los indicadores 7 días
Datos resumidos del indicador trimestral 30 dias
Datos resumidos de los indicadores por hora 90 dias
Datos resumidos de los indicadores por día 365 dias
Disponibilidad y rendimiento de los objetos 90 dias
Resumen diario de la disponibilidad y el rendimiento de los objetos 365 dias
Eventos y cambios de estado detectados por ServicePilot 90 dias
Syslogs 60 dias
Traps SNMP y notificaciones 60 dias
Grabaciones de calidad de llamadas VoIP 90 dias
IP Flow, IPFIX, NetFlow, sFlow, Jflow 30 dias
Rastros de las aplicaciones Web 7 dias
Registrar los datos asociados a los objetos 30 dias

Empiece Ahora