Ferramentas fundamentais para uma boa gestão de redes
21/07/2022
Autor: Eduardo Barasal Morales – Coordinador del área de formação de sistemas autónomos de CEPTRO.br/NIC.br.
Mantener una red estable y operativa es esencial para el mantenimiento de los servicios que la utilizan. Por esta razón, los administradores de red deben monitorear constantemente y prestar atención al buen desempeño de su red, principalmente porque los cambios en las comunicaciones ocurren naturalmente en Internet. Puede que todo esté estable y que los paquetes estén siguiendo el mismo camino pero que, debido a un simple cambio en las rutas de propagación, de un momento a otro los paquetes empiecen a seguir otras rutas. A veces esto no tiene ningún impacto, pero en otros casos puede ser muy perjudicial para las instituciones que gestionan sus redes.
Conocer y saber utilizar herramientas ayuda mucho a los administradores de red en sus tareas diarias para mantener el buen funcionamiento de sus redes. Hay incontables herramientas disponibles en el mercado, muchas de las cuales son gratuitas y de código abierto. A través de ellas se puede comprender mejor cómo las redes se insertan en Internet (las interacciones entre los Sistemas Autónomos), verificar qué redes están conectadas a un determinado punto de intercambio de tráfico (IXP), examinar cómo están llegando los anuncios BGP de sus redes a Internet, detectar posibles secuestros de bloques que se estén produciendo en un momento dado, analizar la lentitud de las comunicaciones en la red y muchas otras cosas.
En este artículo se presenta un pequeño conjunto de herramientas simples, gratuitas y muchas veces desconocidas que están disponibles para que los administradores de red las utilicen para ayudar a resolver e identificar algunos de los problemas más comunes en la comunicación de sus redes.
Para ello, se mostrarán algunas situaciones problemáticas y luego se ejemplificará cómo estas herramientas pueden ayudar.
Problema causado por terceros
A menudo, un administrador de red se enfrenta a problemas en su red que son provocados por terceros. En ocasiones estos son intencionales, por ejemplo, un ataque de denegación de servicio que congestiona los enlaces y sobrecarga el procesamiento de las máquinas o un secuestro de prefijos que genera la pérdida de comunicación (Figura 1).
Otras veces se trata de errores de configuración, como puede ocurrir en una fuga de rutas que envía los paquetes por caminos equivocados, lo que puede enlentecer la comunicación (Figura 2).
Identificar estos problemas no es una tarea fácil para los administradores de red, especialmente porque no son internos y porque suelen durar poco tiempo. Es por esto que las herramientas externas que almacenan información a lo largo del tiempo ayudan a comprender y proporcionan datos para que los administradores de red puedan contactar a los terceros y resolver los problemas.
Kit de herramientas BGP de Hurricane Electric – https://bgp.he.net/
El kit de herramientas BGP de Hurricane Electric es un conjunto de herramientas presentadas en una aplicación web que el administrador de red puede utilizar para extraer datos relevantes sobre su Sistema Autónomo y sobre otros Sistemas Autónomos en Internet. Permite buscar información de Whois (un servicio para consultar información de contacto y de los recursos de Internet) y del registro de enrutamiento de Internet (IRR, una base de datos de información de enrutamiento), ver gráficos de conectividad entre los distintos Sistemas Autónomos, observar gráficos y anuncios de prefijos, recuentos de pares, infraestructura de clave pública de recursos (RPKI, una herramienta para evitar el robo de prefijos), de los IXP y mucho más.
El kit de herramientas es simple, su uso es intuitivo y no requiere registro. Para usarlo, el administrador de red debe acceder al sitio y realizar la búsqueda de una dirección IP, un prefijo, un ASN o un nombre de dominio. A continuación, se presentan algunas imágenes a modo de demostración de la información que se puede explorar en la herramienta.
Esta primera imagen (Figura 3) muestra información relacionada con el ASN (22548), sus prefijos originados y anunciados (IPv4 e IPv6), indica si todo está bien con su uso de RPKI (IPv4 e IPv6), los AS vecinos observados (IPv4 e IPv6), a cuántos IXP está conectado, y otros datos. Estos datos son extremadamente importantes para un administrador de red porque, además de poder verificar los datos de otro AS, le permiten tener una visión macro de cómo los demás están viendo sus anuncios.
Esta segunda imagen (Figura 4), que es la continuación de la pantalla de la herramienta de la imagen anterior, muestra en formato gráfico la cantidad de vecinos (peers) y de prefijos originados y anunciados (IPv4 e IPv6) en función del tiempo, entre otros datos.
En la tercera imagen (figura 5) se puede observar el gráfico de conectividad de las rutas IPv4 entre AS cercanos. En la cuarta imagen (Figura 6) tenemos el mismo gráfico, pero para las rutas IPv6. Aquí se puede analizar una situación interesante, ya que en algunos casos los caminos de propagación de las rutas IPv4 e IPv6 no siempre son los mismos. Una de las razones de ello es que no todos los proveedores de tránsito (upstreams) tienen IPv6 desplegado en sus redes como tienen IPv4. Si bien las mediciones de Google indican que el tráfico IPv6 ya supera el 40 %, aún existen muchos AS que no utilizan IPv6, lo que provoca asimetrías en los caminos en comparación con IPv4.
La quinta imagen (Figura 7) muestra los datos relativos al servicio Whois. Presenta los prefijos asignados al AS, el nombre de la empresa y del responsable del AS, las políticas de enrutamiento (si las hubiera) y el contacto asociado.
Esta última imagen (Figura 8) contiene información relacionada con las altas realizadas en el IRR. Allí se pueden observar las políticas de enrutamiento expuestas por el AS.
Aunque la herramienta muestra más elementos, solo se destacan algunos para ejemplificar la importancia de la aplicación. No obstante, se sugiere que el administrador de red observe detenidamente todo el conjunto de información, ya que todos los datos pueden aportar conocimiento que puede ayudar a resolver un problema.
BGPlay – https://bgplay.massimocandela.com/
BGPlay es una aplicación web Javascript que presenta gráficamente las actividades de enrutamiento en un período de tiempo determinado. Utiliza la base de datos de Route Views (un proyecto de la Universidad de Oregón que recopila y analiza los datos de la tabla de enrutamiento global) y permite a los usuarios realizar numerosos análisis basados en el tiempo, las direcciones IP y los prefijos, y los números de sistema autónomo (ASN). A través de esta aplicación, el administrador de red puede identificar si hubo un robo de su prefijo, quién filtró su ruta, observar cómo otros sistemas autónomos están aceptando o no sus anuncios e investigar posibles asimetrías en sus comunicaciones.
Para usarla, basta con acceder al servicio y elegir el parámetro que se desea investigar en el intervalo de tiempo. Luego, la herramienta generará un video que muestra de manera intuitiva la evolución del enrutamiento entre los AS a lo largo del tiempo. A continuación, se incluye una imagen (Figura 9) de BGPlay para comprender mejor su funcionamiento.
A título de curiosidad, algunos casos famosos de secuestros de prefijos se registraron en esta herramienta y se subieron a Youtube para su posterior consulta, entre ellos el caso del secuestro del prefijo del propio Youtube por parte de Pakistan Telecom en 2008, que se puede ver en este enlace https://youtu.be/IzLPKuAOe50.
Problema en redes de terceros
Es muy común en la vida de un administrador de red responder a reclamos de clientes que se quejan de que no pueden acceder a un determinado sitio o servicio web en otra red. En estos casos, el administrador de red se pregunta si se trata de un problema del cliente, de su red o del servicio al que quiere acceder, como se muestra en la Figura 10.
Una de las formas de investigar este problema es usando las herramientas “Downdetector” y “Down for Everyone or Just Me”.
Downdetector – https://downdetector.com/
La herramienta Downdetector recopila problemas reportados por diferentes usuarios de un sistema determinado a través del propio sitio y de redes sociales como Twitter, para generar un informe de falla y ponerlo a disposición en su sitio. Trabaja en tiempo real, capturando información y analizando todo lo recolectado en su sistema. Para garantizar la confiabilidad de los datos, solo identifica un problema si se identifican muchos incidentes en el mismo período de tiempo.
El administrador de red solo debe verificar si el servicio al que está intentando acceder su cliente en ese momento también está presentando problemas para otros usuarios. De ser así, el problema está en el contenido al que intenta acceder y no en su red.
Las siguientes imágenes (Figuras 11, 12 y 13) muestran el funcionamiento de la herramienta usando como ejemplo una búsqueda del servicio de Pokémon Go:
La Figura 11 muestra en formato gráfico la cantidad de incidentes reportados en un período de un día. Es importante tener en cuenta que la herramienta solo identifica un problema cuando la línea naranja (cantidad de incidentes reportados) supera la línea de referencia punteada.
Por su parte, la Figura 12 presenta los principales problemas identificados por la herramienta en ese momento respecto al servicio buscado (en este caso, Pokémon Go). Esta información puede incluso transmitirse a los usuarios para ayudarles a comprender qué está sucediendo con el servicio.
La Figura 13 muestra que en la propia herramienta se pueden informar problemas en un servicio en particular (en este caso Pokémon Go), para ayudar con los análisis presentados.
Down for Everyone or Just Me – https://downforeveryoneorjustme.com/
Esta herramienta permite probar si un determinado sitio web es inaccesible para todos o solo para el usuario que detecta el problema. Al ingresar un dominio, se desencadena una prueba de múltiples servidores distribuidos en diferentes redes. Si estos servidores tienen dificultades para acceder al dominio, la conclusión es que el problema está en el servidor que aloja el sitio web y que no es un problema del usuario, como se puede ver en la siguiente Figura 14:
De lo contrario, si los servidores pueden acceder al sitio web, la conclusión es un problema del usuario, como se muestra en la Figura 15 a continuación.
Además, cabe señalar que esta herramienta funciona tanto en IPv6 como en IPv4, priorizando IPv6 si el dominio buscado tiene registros AAAA y A. En el futuro, los desarrolladores pretenden individualizar la prueba y permitir que el administrador de red escoja el protocolo que desea probar (esta información no está en el sitio web, pero fue proporcionada por el personal de soporte por correo electrónico).
Conclusión
En este artículo se presentaron cuatro herramientas gratuitas y fáciles de usar. Sin embargo, existen muchas otras herramientas que son de gran importancia para los administradores de red, entre ellas PeeringDB, Looking Glass, BGPmon, RIPEstat y BGP Alerter.
Si el lector desea profundizar en este tema, recomiendo dos presentaciones disponibles en YouTube: la primera es un tutorial completo preparado para el evento de la Semana de Capacitación de NIC.br disponible en https://youtu.be/W-02c1g9Ltk (en portugués) y la segunda es una charla presentada en el evento LACNIC 37 disponible en https://youtu.be/ud3v-a_kRaY (en portugués), en https://youtu.be/OIZaWCCbmuM (en español) y en https://youtu.be/xa9isOWD5ks (en inglés).
As opiniões expressas pelos autores deste blog são próprias e não refletem necessariamente as opiniões de LACNIC.