Especialista en servidores y Hosting VPS
¿Como Facebook se borró de internet?
Con algunos servicios y empresas vemos normal “que caigan” en algunos casos somos tan crueles que hasta les echamos sal jajajaja pero hay otras empresas que por su influencia, importancia, o relevancia pensamos que nunca pueden caer ¡PERO CAEN! En esta semana fue Facebook que se “borro a sí misma” llevándose a Instagram y a WhatsApp. En este episodio hagamos un repaso “poco técnico” de que paso y aprendemos de los errores ajenos.
- Fue un inicio de semana un poco raro…
- Para que nos hagamos una idea
- Y haciendo gala de mis skills periodísticas
- Mascarilla en mano salí a la calle a preguntar a la gente “de a pie” como vivieron este lunes sin redes
- Naaaaa es broma, saludos a Susana Rodríguez del equipo de AtresMedia por las entrevistas
- Ahora si, pongamonos formales…
- Temprano por la mañana del día lunes
- Las búsquedas de los DNS de Facebook resolvían un error: SERVFAIL
- Cloudflare se puso a investigar
- Pensando que su DNS 1.1.1.1 posiblemente estuviera afectando a otros dominios en la red
- A punto estuvieron de publicar un estado público en su página de status
- Cuando vieron que era más grabe de lo que pensaron en un inicio
- Las redes (que no se vieron afectadas por Facebook) y muchos sitios de tecnología
- Comenzaron a informar que los nombres DNS de Facebook dejaron de resolverse por lo que era imposible llegar a las IP de su infraestructura
- Literalmente era como si alguien había entrado y corto los cables que conectaba Facebook a internet
- ¿Problemas de DNS? En un inicio la primera interrupción fue por la configuración de un DNS defectuoso
- Pero aquí viene lo raro… ¿es posible?
- Se vale a gente de a pie como vos o como yo
- Que por cansancio o prisas apretemos el botón que no es
- (Como el día que borré el servidor en producción de un cliente)
- ¿Pero a un gran gigante como Facebook?
- Pues si, pasaron varias cosas dentro de Facebook
- Y lo han compartido en su blog
- En estos post podemos ver desde dentro que pasó y porque todo se complico pasadas las horas
- Ahora veamos desde fuera…
- ¿Te suena de algo BGP? Significa Border Gateway Protocol
- El cual es un mecanismo para intercambiar información de enrutamiento entre sistemas autónomos
- Los grandes enrutadores que hacen que internet exista y funcione
- Tienen listas enormes y con actualizaciones constantes de las rutas a utilizar para dirigir el trafico de la red
- Sin los BGP los enrutadores de internet no sabían que hacer, donde dirigir nada, donde enviar nada, donde recibir nada… Por lo que internet dejaría de funcionar
- Recordemos que internet es una red de redes
- Y es una unión infinita de BGP
- Ya que cada BGP hace que una red se muestre a otras redes que forman internet
- El lunes la red de Facebook dejó de mostrarse y desapareció para las otras redes
- Por eso nadie podía acceder y sus servicios dejaron de funcionar
- ¿Entonces era cuestión de IP?
- No, las tablas de IP de Facebook seguían enrutadas
- Lo que había desaparecido eran los servidores DNS
- Por lo que si, el dominio de Facebook desapareció el día lunes
- Al querer acceder al dominio de Facebook y como desaparecieron sus DNS a travez de BGP
- Lo que cargaba era SERVFAIL
- Y se comenzó a almacenar en caché esta respuesta del dominio
- Lo que complicó mas la situación
- Porque a esto le tenemos que sumar los miles de millones de usuarios
- Insistiendo una y otra vez
- Y la caché almacenando mas SERVFAIL
- Mientras que el dominio apuntaba a la nada porque no tenia servidores DNS
- ¿Pero si da error no debería de quedar ahí el asunto?
- No, claro que no
- El internet que todos hemos ayudado a construir
- No acepta un no como respuesta
- Lo intenta una y otra vez
- Y en cada reintento lo hace de forma más agresiva
- A eso -otra vez- sumemos a los miles de millones de usuarios que no aceptan un no como respuesta
- Y seguían, seguían, seguían intentando entrar
Reflexiones sobre esto
- Internet para el usuario es algo muy sencillo de usar
- Es parte de nuestro día a día
- Pero aunque parece sencillo
- Es un red de redes muy compleja con millones de sistemas y protocolos conectados
- Por lo que si no podemos ser parte de una solución
- No hagamos más grande el problema
- Si entras a un sitio con problema de conexión
- Da el reporte y espera que haya comunicación oficial sobre el restablecimiento del servicio
- Dejemos de darle al botón actualizar
- Y dejemos que las cosas se resuelvan a su tiempo
En nuestro WordPress debemos de asegurarnos que solo el que sabe como solucionar tenga permisos para “cortar cables” o “apagar algo” porque luego vienen los problemas… Y en nuestros Hosting VPS ¡nunca metamos los DNS de nuestros dominios! Porque si el servidor se apaga nuestro dominio también va a desaparecer de internet con el susto y disgusto que esto conlleva.