Массовый сбой в работе AWS
19–20 октября произошёл серьёзный сбой в работе Amazon Web Services (AWS), в результате которого оказались недоступны многие популярные веб-сервисы и приложения. Среди пострадавших сервисов были Alexa, Snapchat, Fortnite, Venmo, Canva и множество других.
Хронология событий
- 3:11 утра — AWS сообщила о проблемах с DNS-разрешением в регионе US-EAST-1 (Северная Вирджиния).
- 5:01 утра — выявлена проблема с DNS-разрешением для DynamoDB API.
- 12:08 дня — компания сообщила о решении основной проблемы с DNS, но отметила продолжающиеся трудности с запуском новых инстансов EC2.
- 6:53 вечера — AWS объявила о полном восстановлении работы сервисов.
Причины сбоя
Основной причиной сбоя стали проблемы с DNS-разрешением для региональных конечных точек сервиса DynamoDB. Это привело к нарушению доступа приложений к данным, хранящимся в базе данных.
Пострадавшие сервисы
Сбой затронул множество крупных компаний и сервисов, включая:
- Финансовые приложения (Venmo, банки).
- Социальные сети (Snapchat, Reddit).
- Стриминговые сервисы (Disney+, Apple Music).
- Игровые платформы (Fortnite, Roblox).
- Новостные порталы (The New York Times).
- Службы такси (Lyft).
Последствия и выводы
Этот инцидент подчеркнул критическую зависимость современного интернета от нескольких крупных провайдеров облачных услуг. На момент 2025 года доля AWS на мировом рынке облачной инфраструктуры составляла 30%.
Несмотря на наличие глобальных дата-центров и возможностей автоматического масштабирования, подобные сбои показывают необходимость:
- Диверсификации облачных провайдеров.
- Создания резервных систем.
- Повышения устойчивости инфраструктуры.
К вечеру 20 октября большинство сервисов вернулось к нормальной работе, но инцидент остался важным напоминанием о рисках чрезмерной централизации интернет-инфраструктуры.