Novedades WOCU 0.41

A continuación se presentan las novedades de la versión 0.41 de WOCU Monitoring.

../../_images/0_41_18_intro.jpg

Continuamos trabajando en una línea de monitorización unificada y homogénea. WOCU es una herramienta todo en uno, donde en una única consola se integra toda la información referente al estado, rendimiento y capacidad de la infraestructura monitorizada. Así pues, en esta versión se suma la nueva vista Performance, donde se recogen todas las métricas de monitorización junto con sus valores de rendimiento, registrados por cada servicio, resultado de las continuas comprobaciones en términos de operatividad hacia los elementos de red.

En relación al módulo de Inventario de datos y atributos de activos, WOCU ya es capaz de detectar links en los valores de inventario y convertirlos en clickables. Otra funcionalidad con la que se continúa optimizando uno de los módulos más potentes de la herramienta.

También se ha modificado el método de ordenación de dos de las columnas más relevantes de las tablas de Alarmas (Problems): Impact y Duration. Estos campos están estrechamente relacionados y permitirá al operario una resolución más ágil de alertas en función del impacto asignado.

A pesar de que en la anterior versión se incorporó la acción Differences para Dispositivos ubicados en la lista de pendientes, ha sido mejorada incorporando una nueva tabla donde se desglosan las Macros de configuración que han sido recientemente actualizadas.

Continuamos enriqueciendo nuestro Manual de Usuario con un nuevo caso de uso sobre cómo sacar el máximo partido a la Monitorización Pasiva en WOCU, mediante la aplicación de un pack específico.

En cuanto a seguridad, en esta ocasión se ha trabajado en la capacidad de monitorización de los intentos de acceso a la herramienta. Siendo conscientes de la exposición de WOCU en internet, era necesario trabajar en la trazabilidad de accesos, para la detección de autenticaciones fallidas y actuación en consecuencia mediante el bloqueo de cuentas.

Además, se han añadido nuevas mejoras en la API de configuración y seguimos agregando valor a nuestro catálogo Packs de Monitorización, tanto añadiendo nuevos packs y servicios de monitorización, como dando soporte a nuevas tecnologías y fabricantes.

Esta versión viene cargada de nuevas integraciones y mejoras, sigue leyendo y conoce el listado completo de novedades y amplía información con el manual de usuario si es necesario.

Interfaz

Nueva Vista de datos de Rendimiento (Performance) de métricas de monitorización

La operativa de WOCU es a grandes rasgos la siguiente: un pack monitoriza Dispositivos mediante servicios. Como resultado de las verificaciones de operatividad que el servicio lanza a un Dispositivo, se generan métricas que registran valores de rendimiento, permitiendo un análisis más profundo del servicio, y por consiguiente, del Dispositivo en términos de disponibilidad.

En esta nueva versión, WOCU añade una nueva pestaña llamada Datos de Rendimiento (Performance) de la Vista de Detalle de Servicios, donde se recopilan las métricas de monitorización generadas en cada servicio. El conjunto de valores es presentado a través de un formato tabular, donde se incluye una entrada por cada métrica, lo que facilita su estudio individualizado. Esta tabla es meramente informativa, no permite efectuar ningún cambio sobre el Dispositivo.

../../_images/0_41_14_performance_tab_services.jpg

La tabla Service Performance recoge los siguientes datos:

1. Datos de la métrica de monitorización:

Name: nombre de la métrica de monitorización.

Value: último valor de rendimiento registrado en dicha métrica.

2. Umbrales de medición:

Minimum: umbral mínimo definido que puede alcanzar la métrica. Se identifica con una línea vertical en color verde posicionada (normalmente) en el inicio de la barra.

Warning: umbral definido a partir del cual la métrica alcanzará un estado de advertencia o alarma. Se identifica con una línea vertical en color naranja.

Critical: umbral definido a partir del cual la métrica alcanzará un estado crítico. Se identifica con una línea vertical en color rojo.

Maximum: umbral máximo definido que puede alcanzar la métrica. Se identifica con una línea vertical en color negro posicionada (normalmente) al final de la barra.

3. Graficado de la métrica:

Graph: se representa gráficamente el valor actual de la métrica (columna Value) mediante una barra rectangular de longitud proporcional al valor registrado.

  • Los umbrales actúan como indicadores y se representan con líneas verticales ubicadas a lo largo de la barra. Cada umbral tiene asociado un color identificativo.

    ../../_images/2_080a_aggregator_realm_assets_modal-services-performance-bar_0-41.jpg
  • La distinción de colores es la siguiente:

    • Color gris claro: indica la ausencia de datos métricos (valor = 0).
    • Color gris oscuro: indica que el valor es menor al mínimo establecido.
    • Color azul: indica la existencia de un valor registrado pero ausencia de umbrales de alerta. Esta situación genera cierta incertidumbre sobre la situación real de la métrica.
    • Color verde: indica que el valor está por encima del valor mínimo y por debajo de los umbrales de alerta.
    • Color naranja: indica que el valor está por encima del umbral WARNING pero sin exceder los umbrales superiores.
    • Color rojo: indica que el valor está por encima del umbral CRITICAL o superior.

Por último, esta tabla también se ha incluído en la sección Dispositivo (Host) de la Vista de Detalle de Activos y BP, en concreto en el apartado HOST STATUS, donde se ofrece información precisa sobre la configuración, propiedades y estado del Dispositivo en cuestión.

../../_images/0_41_15_performance_tab_hosts.jpg

Gracias a la versatilidad de WOCU para gestionar infinidad de Packs de Monitorización, servicios y métricas de diferente índole, es posible generar tablas de rendimiento que nos permitan realizar un estudio pormenorizado y conocer la situación real de nuestra red o infraestructura, así como ayudar a identificar problemas y errores de rendimiento y capacidad.

Continuamos trabajando para integrar y proveer en una consola única, toda la información referente al estado, rendimiento, limitaciones y capacidad de los activos que administra y supervisa WOCU, sin tener que recurrir a otras herramientas externas.

Ordenación múltiple de las columnas Impacto y Duración en el listado de Hosts Problems

Uno de los conceptos cruciales en las tareas de monitorización y operación de redes y sistemas, es el diagnóstico y gestión de Alarmas (Problems). El flujo de trabajo habitual en el entorno de WOCU supone que toda alarma debe ser examinada y tratada por el operario o Administrador. Por ello, es siempre una buena práctica realizar un reconocimiento (Acknowledged) de las incidencias tratadas, alternativamente deshabilitar los chequeos activos (en determinadas circunstancias), o bien aplicar el tiempo de caída programado (en el caso de un mantenimiento o intervención programada). De esta forma, se mantendrá lo más limpia y despejada posible la vista de alarmas.

A esta nueva versión se suma la ordenación múltiple de las columnas Impact (grado de criticidad o trascendencia del activo en el proceso de negocio) y Duration (tiempo transcurrido entre el comienzo y fin de una alarma). Esto quiere decir que previa ordenación (ascendente o descendente) de la columna Impacto, automáticamente el sistema mostrará los valores registrados de la columna Duración en orden ascendente (por cada escala de valores), con la finalidad de ubicar en las primeras posiciones de la tabla las incidencias más recientes (duración más breve), ya que probablemente su resolución urja más que el resto, puesto que en ocasiones el operario obvia voluntariamente algunas de ellas.

  • Orden ascendiente de la columna Impact:
../../_images/0_41_08_order_impact_duraction.jpg
  • Orden decreciente de la columna Impact:
../../_images/0_41_09_order_impact_duraction.jpg

En definitiva, además de las buenas prácticas en el uso de la herramienta, como por ejemplo la aplicación conjunta de filtros y acciones que permitan una gestión más organizada de alarmas en entornos complejos, continuamos trabajando en simplificar el tratamiento de las mismas, primando la resolución de incidencias de mayor a menor impacto en el listado de alarmas de Dispositivos.

Mejoras en la configuración

Incorporación de Macros modificadas en la vista de la acción Differences de un Dispositivo

En la anterior versión 0.40 se añadió una nueva acción para cada Dispositivo de la tabla de Activos Pendientes (Pending Assets) llamada Differences, donde a través de un formato tabular se presentan las principales diferencias de configuración que ha sufrido un Dispositivo que ha sido nuevamente descubierto, y que en consecuencia, vuelve a estar alojado en la BBDD de activos pendientes.

Pero esta vista no llegaba a mostrar las Macros que habían sido modificadas en nuevos descubrimientos. Por consiguiente, esta acción es mejorada incorporando una nueva tabla donde se desglosan las Macros que han sufrido alguna modificación, acogiendo en una única vista todos los atributos y variables de configuración de un Dispositivo, sin necesidad de acceder al backend de administración para observar posibles variaciones.

Esta nueva vista, quedará distribuida en dos tablas:

../../_images/0_41_19_diff_table.jpg
  • General Information: incluye atributos y propiedades de inventario que han sido modificadas.
  • Differences in Macros: incluye variables y parámetros de configuración interna del Dispositivo que han sido modificados.

Trazabilidad y bloqueo de accesos

Cada vez más y más usuarios utilizan WOCU para administrar sus infraestructuras. Y en muchas ocasiones, WOCU se encuentra expuesto a internet para dar servicio a más clientes. Así pues, era necesario añadir capacidades de trazabilidad de accesos, detectar autenticaciones fallidas y actuar sobre ellas.

../../_images/0_41_17_failure-login-logs.jpg

En esta nueva versión, se ha añadido una nueva funcionalidad de seguridad adicional, la capacidad para monitorizar los intentos de acceso al interfaz y de prevenir ataques de fuerza bruta, cuando se excede un límite de intentos permitidos previamente configurado. Esta información persistirá en la base de datos lo que posibilitará realizar auditorías o reenviar los eventos registrados a otros sistemas.

Se monitorizan los intentos de acceso por dirección IP, por nombre de usuario, por user agent, o por una combinación de ambos, y cuando se supera el límite permitido el usuario recibirá el siguiente mensaje prohibiendo el ingreso en la aplicación:

Attention

Account locked: too many login attempts. Please try again later

También se pueden configurar periodos de inactividad para limpiar los intentos fallidos acumulados y de ese modo volver a permitir accesos desde la dirección IP o el usuario previamente bloqueado.

Note

Más información en: Acceso a WOCU.

API

Mejoras en la API de configuración

A partir de esta nueva versión, ya es posible agregar un nuevo miembro a un determinado Hostgroup, mediante una petición al API de configuración, sin necesidad de conocer previamente los miembros que lo componen y sin sobrescribir la configuración establecida.

Además, la petición de agregación de nuevos miembros se realiza a través del Host_name y no por ID como se venía implementando.

Esta mejora resulta muy útil cuando el número de miembros en Hostgroups y Business Processes es elevado, haciendo que la tarea de agregación de nuevos elementos sea lo más ágil y menos tediosa posible.

PATCH /api/hostgroup/hostgroup1
Member (host_member/bp_members/hostgroups_members): new-member

Filtro por dominio o URL en la configuración de Dashboards Externos

En versiones anteriores de WOCU se introdujo la capacidad de integrar y visualizar Dashboards de otras herramientas como por ejemplo Grafana.

En muchas ocasiones, los dashboards configurados no son accesibles desde el navegador por limitaciones de acceso a redes internas. Se ha añadido una variable de configuración que permite filtrar mediante una expresión regular, dashboards de un determinado domino o nombre de URL. De este modo, los usuarios no sentirán la confusión de desplegar dashboards a los que de antemano no tienen acceso.

../../_images/0_41_16_filters_list_dashboard.jpg

Nuevos endpoints para el cálculo de Indicadores Clave de Rendimiento (KPI’s)

Se han implementado nuevos endpoints para el cálculo de Indicadores Clave de Rendimiento o KPI’s por su siglas en inglés, que nos permitirá obtener información referente a la eficiencia durante la resolución y escalado de incidencias originadas en la planta monitorizada.

  • Endpoints para la obtención de KPI’s sobre las incidencias de Dispositivos y Servicios en un Reino:
GET /api/events/realms/{realm_name}/monitoring/kpi/hosts/
GET /api/events/realms/{realm_name}/monitoring/kpi/services/
  • Endpoints para la obtención de KPI’s sobre las incidencias de Dispositivos y Servicios en un Multireino:
GET /api/events/multirealms/{realm_name}/monitoring/kpi/hosts/
GET /api/events/multirealms/{realm_name}/monitoring/kpi/services/

Estos KPI’s generan un listado con las fechas de todas las caídas de Dispositivos o de Servicios (en Reinos o Multireinos) producidas dentro del periodo de tiempo indicado, junto con la fecha y usuario de creación del ACK asociado (si existiera) y la fecha de vuelta al funcionamiento del activo si esta se hubiera producido ya.

De esta manera se puede cuantificar y medir niveles de eficacia en términos de tiempo, a la hora de responder y solventar las incidencias que van surgiendo en la infraestructura monitorizada. Los datos devueltos serán útiles como medida de optimización del proceso de resolución de incidencias interno, con el fin de garantizar la mejor operación de servicio.

Note

Accede a la documentación í­ntegra de la API de WOCU en: Documentación API pública.

Otras mejoras y arreglos

Durante el desarrollo de esta versión 0.41, se han ido mejorando otros aspectos de la versión estable que pasamos a listar:

  • Se han añadido nuevas opciones para el filtrado por duración en la página de Alarmas (Problems), a fin de ajustar y limitar todavía más las búsquedas.
  • Solucionado un problema que impedía cerrar el modal de Dispositivos cuando el sistema de ACLs estaba activado.
  • Se han refactorizado los endpoints de disponibilidad eliminando etiquetas HTML.
  • Se ha eliminado la visualización de determinadas macros con información sensible en la página de Activos (Assets).
  • Ahora es posible que un informe sea público, aunque no tenga contactos/destinatarios asignados en la programación del mismo.
  • Se han realizado cambios estéticos en la tabla de acciones masivas y en la tabla de tareas programadas.
  • El indicador final obtenido en Informes de Disponibilidad (Availability) ahora es truncado para evitar decimales innecesarios.
  • Corregido un fallo en el listado de contactos/usuarios de informes programados, en el que podían visualizarse usuarios de otros reinos.
  • Se ha mejorado la visualización de los indicadores de disponibilidad cuando no se encontraban datos en el rango temporal solicitado.
  • Mejoras generales en el modal de diferencias en cuanto a configuración entre Dispositivos descubiertos y Dispositivos ya monitorizados.
  • Se ha solucionado un problema con los campos de tipo porcentaje en la configuración de Packs de Monitorización.
  • Los Informes de Dispositivos más relevantes (Top Hosts) ahora incluyen más unidades de conversión en sus opciones.
  • La gráfica de disponibilidad de Dispositivos por Ping (Panel RTA (últimas 24 horas)) ahora soporta intervalos de monitorización distintos al de por defecto.
  • El botón que permite lanzar nuevas tareas de importación y descubrimiento de activos, ahora aparecerá deshabilitado cuando la tarea en cuestión esté ocupada.
  • La pestaña Cuadros de Mando (Dashboards) ahora solo estará habilitada cuando existan cuadros de mando configurados en el Reino. A excepción de para Administradores cuya visualización es permanente.

Documentación

Nuevo caso de uso sobre la Monitorización Pasiva en WOCU

Se ha añadido un nuevo caso de uso al Manual de Usuario de WOCU.

WOCU unifica y gestiona dos metodologías referentes a la monitorización de redes: la Monitorización Pasiva* y la Monitorización Activa. Gracias al uso combinado, las limitaciones que presentan ambas tipologías se reducen y se incrementa el nivel de garantía de calidad de nuestra herramienta, puesto que los problemas son detectados antes de que ocurran, o casi en tiempo real, permitiendo una comprensión profunda de la causa raíz que los ha motivado.

../../_images/0_41_11_active_passive_monitoring.jpg

Así pues, este caso de uso muestra cómo WOCU gestiona los logs indexados en el backend de eventos procedentes del mundo de la monitorización pasiva, y cómo crear alertas a medida basadas en estos eventos externos mediante la configuración y aplicación del pack de monitorización Log Ocurrences.

../../_images/0_41_12_pack_log_ocurrences.jpg

Packs de monitorización

Consulta nuestro catálogo de Packs de Monitorización de WOCU en el siguiente enlace.

Nuevo pack bgp

Este pack descubre los peers BGP configurados en un router y monitoriza su estado. Además, genera alarmas si el estado del peer no es established.

Su funcionamiento ha sido probado con equipos Cisco, Juniper, Huawei, OneAccess y Teldat.

../../_images/0_41_01_bgp_discover.jpg ../../_images/0_41_02_bgp_assets.jpg

Nuevo pack purestorage

Pack destinado para los equipos de almacenamiento PureStorage FlashArray. Incluye funciones de descubrimiento para elegir los volúmenes y componentes de hardware que se quieren monitorizar.

Los diferentes servicios que incluye el pack son:

  • Info: muestra el modelo de hardware y la versión de software instalado en las controladoras.
  • Open Alerts: alertas en estado open.
  • Status: estado de los componentes hardware seleccionados.
  • Occupancy: porcentaje de ocupación global y por volúmenes.
  • Performance: métricas de rendimiento de lectura/escritura (latencia, ancho de banda, IOPS)
../../_images/0_41_03_purestorage_discover_hw.jpg ../../_images/0_41_04_purestorage_discover_vol.jpg ../../_images/0_41_05_purestorage_assets.jpg

Nuevo pack networkdevice-traffic-all

Hemos creado un pack que unifica los packs networkdevice-traffic y networkdevice-traffic-health. La principal ventaja es que tan solo es necesario descubrir los interfaces una sola vez para crear los servicios traffic, interface_discards e interfaces_errors.

En equipos con muchos interfaces de red, esto puedo significar un ahorro importante de tiempo de configuración. Por supuesto, los packs networkdevice-traffic y networkdevice-traffic-health siguen estando disponibles por separado.

Se añade la macro _TIME_RANGE al pack log-occurrences

Gracias a esta macro, ahora es posible configurar la ventana de tiempo en la consulta que se realiza en ElasticSearch. Esta macro hace referencia a los últimos x minutos. El valor máximo es de 1.440 minutos, equivalente a 24 horas.

Se añade el servicio VPN Active Tunnels al pack palo-alto

Se ha añadido un servicio para chequear el número de túneles VPN activos. Este servicio permite configurar umbrales para un número mínimo y máximo de túneles.

../../_images/0_41_10_palo-alto_tunnels.jpg ../../_images/0_41_10_palo-alto_tunnels_graph.jpg

Se añade el servicio node state al pack stonegate-fw

Se ha añadido un servicio para monitorizar el estado operativo de los nodos de un cluster. El servicio permite elegir el estado configurado en los nodos, y devolverá CRITICAL cuando el estado obtenido en la consulta sea diferente al elegido en el pack.

Este servicio también incluye una funcionalidad de persistencia de estado no-OK. Lo que permite mantener el estado CRITICAL provocado por un cambio de estado temporal. Una macro define el tiempo de permanencia de estado.

../../_images/0_41_13_stonegate-fw-node-state.jpg

Software actualizado

Django 2.2

Continuamos en el proceso de actualización de componentes core de WOCU. En este caso, nuestro framework más utilizado en backend, Django, ha sido actualizado de la versión 1.11 a la 2.2. Trae consigo la corrección de algunos errores de seguridad, junto con otras funcionalidades beneficiosas para el resto de aplicaciones. La anterior versión 1.11 dejó de tener soporte ante fallos y problemas de seguridad el mes anterior. Esta nueva versión, denominada LTS (Long Time Support) tiene soporte asegurado hasta Abril de 2022 y cabe destacar que únicamente es compatible con Python3 (la migración completa de Python2 a Python3 en el código base de WOCU ya se realizó en anteriores versiones).

Otros componentes

Se han incorporado y actualizado numerosas piezas de software integradas en WOCU:

Software Versión anterior Versión actual Observaciones
Python3 3.7.5 3.7.7 Última versión estable de la serie 3.7
LMD 1.8.2 1.8.3 Mejoras en el rendimiento de algunas peticiones y en la gestión de timeouts en conexiones

Utilidades para reparación de gráficas RRD

Hemos incluido varios scripts para reparar las gráficas RRD que se corrompen al añadir nuevas métricas a un servicio, o para recuperar los datos históricos cuando hay cambios en el identificador de un servicio (service_description), ya que esos identificadores se usan para nombrar los ficheros RRD.