¿Qué causó el fallo de Amazon AWS y cómo se podría prevenir que afectase a mi sistema?
Publicado el viernes, 24 de octubre de 2025
El lunes 20 por la mañana, numerosos usuarios experimentaron fallos en plataformas y servicios populares como Amazon, Prime Video, Alexa, Canva o Fortnite. Estos problemas no se debieron a fallos de los proveedores locales de internet, sino a un error interno en la infraestructura de Amazon Web Services (AWS), uno de los mayores proveedores de servicios en la nube del mundo. El incidente afectó especialmente a la región US-EAST-1, una de las más utilizadas globalmente, lo que generó interrupciones generalizadas en múltiples servicios.
AWS detectó los primeros indicios del problema a las 9:11 (hora peninsular española) y, poco después, identificó un incremento en los errores y la latencia en la región afectada. Hacia las 10:26, la compañía determinó que la causa raíz estaba relacionada con DynamoDB, su servicio de base de datos NoSQL, debido a un fallo en la resolución DNS del punto final de su API. Esto impedía que las aplicaciones localizaran o se conectaran correctamente con los servidores de la base de datos. Amazon comenzó a aplicar mitigaciones desde las 11:22 y, alrededor del mediodía, informó que la mayoría de los servicios ya se habían recuperado.
Este incidente evidenció la importancia de distribuir los servicios en varias zonas o regiones dentro de la nube. Cuando todos los componentes de una aplicación dependen de una sola región, cualquier interrupción puede provocar un fallo global. En cambio, una arquitectura distribuida permite que los servicios en otras regiones sigan funcionando con normalidad, limitando el impacto del incidente. Además, la replicación de datos y servicios en diferentes ubicaciones garantiza una mayor disponibilidad y tolerancia a fallos, permitiendo conmutaciones automáticas o manuales en caso de caídas.
Por último, distribuir los sistemas no solo ayuda a prevenir interrupciones, sino también a mejorar la latencia, el rendimiento y la capacidad de recuperación. La cercanía de los servidores a los usuarios reduce el tiempo de respuesta, mientras que el uso de regiones alternativas puede absorber la carga durante fallos. En un modelo ideal, las aplicaciones críticas deben estar desplegadas en al menos dos regiones independientes o incluso en distintos proveedores, para asegurar la continuidad operativa ante fallos de infraestructura como el ocurrido en AWS.
24/10/2025 08:14 | Forlopd_Privacidad
SEGURIDAD Y PRIVACIDAD DE DATOS, S.L. (FORLOPD)
URL oficial/canónica: https://ceeivalencia.emprenemjunts.es/?op=113&n=18473
