Coinbase анализирует майский сбой: каскадный отказ AWS выявил архитектурные риски
Coinbase опубликовала отчет о масштабном сбое в работе сервисов, произошедшем 7 мая 2026 года.
Перерыв в обслуживании длился около 8 часов, а полное восстановление заняло около 12 часов. В это время торговля, депозиты, вывод средств и большинство основных сервисов были недоступны или работали со значительными ограничениями. Coinbase заявила, что причиной сбоя стал одновременный выход из строя нескольких блоков охлаждения в дата-центре в одной из зон доступности (use1-az4) региона AWS us-east-1. Это привело к срабатыванию тепловой защиты стоек, отключению инстансов EC2 и томов EBS, что затронуло работу множества интернет-сервисов.
В процессе восстановления торговый движок Coinbase потерял кворум, так как кластерная архитектура, развернутая в одном дата-центре AWS, лишилась большинства узлов. Потребовались экстренная корректировка кода и создание новой группы узлов для возобновления работы, при этом торговля на рынке восстанавливалась постепенно.
Кроме того, в управляемом сервисе Kafka (MSK) от AWS произошли сбои плоскости управления, что предотвратило автоматический перевыбор лидеров разделов. Это заблокировало системы котировок, комиссий, а также некоторые системы расчетов и потоков данных, что увеличило масштаб последствий.
После ручной миграции разделов в сотрудничестве с инженерной командой AWS система постепенно вернулась к нормальной работе. Coinbase заявила, что этот инцидент выявил недостатки в возможностях автоматического переключения между зонами доступности и в аварийном восстановлении управляемого промежуточного ПО. Компания планирует модернизировать архитектуру межрегионального горячего резервирования, усилить регулярные учения по отработке сбоев и перевести систему Kafka с двухзонного на трехзонное развертывание, одновременно работая с AWS над устранением первопричин и улучшением инфраструктуры.
Вам также может понравиться

Почему Питер Тиль, стоящий за Palantir, готовит пути к отступлению в Аргентине?

Кризис среднего возраста крипто-фондов: без Product-Market Fit (PMF) не будет новых чеков от LP

Провальная защита стражей Solana: чтобы разгромить Hyperliquid, они решили использовать сценарий, за который когда-то критиковали Ethereum?

Интервью с макро-гуру Раулем Палом: гонка в сфере ИИ ведет к «экономической сингулярности», не спешите расставаться со своими активами в ближайшие четыре года

Новое исследование BIS: будущее стейблкоинов и глобальный валютный ландшафт

Три года спустя: взгляд на мои прогнозы по ChatGPT в 2023 году

От инструментов казино к глобальным машинам ценообразования: взгляд лидера NYSE на Hyperliquid

CEO Sharplink: будущее Ethereum уже наступает

Хакеры и регулирование: что погубило DeFi?

Крис Ли: от крипто-OG до крупных инвестиций в трех гигантов индустрии хранения данных, прогнозы по коррекции на «бычьем» рынке ИИ, Web4 и возможности для молодого поколения

Хэ И: Раз уж вы здесь, почему бы не попробовать

Шесть главных претензий от разработчика Ethereum

WEEX GOGOGO Эпизод 3|LALIGA: Путь к золоту — 6 взрывных моментов, 1 билет на Чемпионат мира и ночь, которую никто не забудет

2 года и доходность в 225 раз? Раскрываем «узкое место» инвестиционной стратегии загадочного исследователя Serenity

B.AI partners with BNB Chain to launch the "Billion AI Token Subsidy" celebration, fully igniting the on-chain intelligent agent ecosystem

Триллионный ажиотаж вокруг продажи памяти: прибыль от покупки памяти сократилась вдвое

Утренний отчет | Binance запускает исследовательский инструмент DYOR; YZi Labs открывает платформу для рекрутинга YZi Talent; Виталик заявляет, что Ethereum Foundation «сократит штат» и уменьшит объемы продаж ETH

