AWS

Amazon atribuye a un fallo de DNS el apagón global de AWS

Tecnología cc pexels-cookiecutter-17489151
Un bug en la automatización de DynamoDB dejó sin servicio a bancos, apps y dispositivos conectados, evidenciando la dependencia mundial de unos pocos gigantes de la nube.

Amazon ha revelado que el masivo apagón de AWS registrado esta semana —que dejó fuera de juego desde aplicaciones de mensajería hasta camas inteligentes— tuvo su origen en un fallo en el sistema automatizado de gestión de DNS de DynamoDB. Un registro vacío en la región US-East-1 (Virginia) desencadenó una cadena de errores que impidió a miles de clientes conectarse a sus bases de datos y provocó la caída de más de 2.000 servicios en todo el mundo, según datos de Downdetector, con más de 8,1 millones de incidencias notificadas. El incidente reabre el debate sobre la concentración de servicios críticos en manos de unos pocos proveedores de nube.

El fallo en DynamoDB

En un extenso informe sobre las causas del incidente, AWS explicó que el problema se originó en DynamoDB, su sistema de bases de datos utilizado por miles de clientes para almacenar y consultar información en tiempo real.

DynamoDB gestiona cientos de miles de registros DNS y se apoya en procesos de automatización para actualizar esos registros, añadir capacidad cuando es necesario, gestionar fallos de hardware y distribuir el tráfico de forma eficiente. Según Amazon, un defecto latente en ese sistema automatizado de gestión de DNS provocó la creación de un registro vacío para la región US-East-1.

El error no se corrigió de manera automática —como estaba previsto—, lo que obligó a intervenir manualmente para restablecer el registro y recuperar la conectividad. Mientras tanto, los clientes no podían resolver los nombres de dominio necesarios para acceder a sus bases de datos, disparando errores en cascada en múltiples aplicaciones.

Downdetector 2025-12-25 at 11.43.56

Caída en cascada de servicios globales

El fallo en DynamoDB se trasladó rápidamente al resto del ecosistema de AWS. La imposibilidad de acceder a las bases de datos afectó a otros servicios de la plataforma y, con ello, a las aplicaciones de cliente que dependen de ellos.

Plataformas como Signal, Snapchat, Roblox o Duolingo, además de servicios bancarios y compañías como Ring, se vieron afectadas por la caída, que dejó durante horas a millones de usuarios sin acceso a aplicaciones y sistemas de los que dependen en su día a día.

Según Downdetector, más de 2.000 empresas reportaron problemas relacionados con el apagón, que generó más de 8,1 millones de avisos de usuarios en todo el mundo. Aunque los servicios se restablecieron en cuestión de horas, el impacto fue amplio y puso a prueba los planes de contingencia de numerosos actores del ecosistema digital.

Dispositivos conectados, sin control

El incidente también dejó al descubierto la vulnerabilidad de los dispositivos conectados que dependen por completo de la nube para operar. Un ejemplo llamativo fue el de Eight Sleep, una empresa de camas inteligentes que se conectan a internet para ajustar la temperatura y la inclinación del colchón.

Durante el apagón, muchos clientes se encontraron sin posibilidad de modificar los ajustes de su cama a través de la aplicación móvil, ya que el dispositivo no podía comunicarse con los servidores de AWS. El consejero delegado de la compañía, Matteo Franceschetti, se disculpó públicamente en X y anunció el despliegue de una actualización que permitirá controlar las funciones críticas de la cama mediante Bluetooth en caso de futuras caídas de la nube.

La respuesta de Amazon

Como medida inmediata, AWS indicó que ha desactivado globalmente el sistema automatizado conocido como DynamoDB DNS planner y DNS enactor, mientras revisa y corrige las condiciones que llevaron al fallo. La compañía también asegura estar añadiendo protecciones adicionales para evitar que un registro vacío o defectuoso pueda provocar una disrupción similar en el futuro.

El informe técnico publicado por Amazon busca aclarar lo sucedido y restaurar la confianza de sus clientes, aunque deja claro que, pese a las múltiples capas de redundancia, un error en un componente crítico puede seguir teniendo efectos de gran alcance.

Un solo fallo, tres grandes nubes

Para Suelette Dreyfus, profesora de sistemas de computación e información en la Universidad de Melbourne, el incidente es una señal de alarma. «Este tipo de caídas demuestran lo dependiente que es el mundo de puntos únicos de fallo en internet», sostiene.

Dreyfus recuerda que el problema no es solo AWS —que controla en torno al 30% del mercado de la nube—, sino la concentración global de servicios digitales en apenas tres grandes proveedores. «Internet fue diseñada para ser resiliente; existían múltiples canales para rodear problemas o ataques, pero hemos perdido parte de esa resiliencia al depender de un puñado de gigantes tecnológicos para alojar no solo datos, sino también servicios críticos», advierte.

Un aviso para la economía digital

El apagón de AWS se suma a otros incidentes recientes que han puesto en cuestión hasta qué punto la economía digital se ha convertido en rehén de unas pocas infraestructuras corporativas. Desde aplicaciones de mensajería y videojuegos hasta bancos y dispositivos domésticos inteligentes, cada vez más servicios esenciales se apoyan en arquitecturas centralizadas en la nube.

La caída provocada por un simple registro DNS vacío ha servido de recordatorio: incluso en sistemas diseñados para operar a escala planetaria, un fallo en la automatización puede paralizar, aunque sea temporalmente, buena parte de la vida digital de millones de personas. Para gobiernos, empresas y usuarios, la discusión sobre resiliencia, diversificación y planes de contingencia deja de ser teórica y se convierte en una prioridad estratégica.