U k r V i s t i

l o a d i n g

Масштабний збій в мережі Cloudflare: наслідки та уроки

Деталі про масштабний збій в мережі Cloudflare, який стався 18 листопада 2025 року, його причини та заходи для запобігання подібних інцидентів.

image

Компанія Cloudflare розкрила інформацію про серйозний інцидент, що стався 18 листопада 2025 року, який вплинув на роботу багатьох онлайн-сервісів, включаючи ChatGPT, X та Downdetector. Цей інцидент був охарактеризований як "найгірший з 2019 року" і був пов'язаний з помилкою у системі управління ботами.
Основною причиною проблеми стало невірне налаштування запиту в базі даних ClickHouse, що відповідає за генерацію конфігураційного файлу для системи управління ботами. Зміни в поведінці запиту призвели до створення численних дублікатів даних, що, у свою чергу, викликало різке збільшення конфігураційного файлу, перевищуючи доступні ліміти пам'яті.
Це призвело до збою в основній проксі-системі, що обробляє трафік клієнтів, які використовують модуль ботів. Клієнти, які спиралися на дані про ботів у своїх правилах, почали блокувати справжній трафік, тоді як компанії, що не застосовували цю функцію, залишалися в мережі.
Cloudflare підкреслила, що проблема не була пов'язана з DNS, атаками чи новими системами на базі генеративного штучного інтелекту – помилка виникла в самій внутрішній логіці оновлення конфігурації Bot Management.

Для запобігання подібним інцидентам компанія запровадила чотири основні кроки:

  • посилення контролю за конфігураційними файлами та користувацьким введенням;
  • розширення кількості глобальних "kill switch" для функцій;
  • запобігання перевантаження системи через core dump або звіти про помилки;
  • перегляд всіх режимів відмови у важливих проксі-модулях.

Згідно з оцінками Cloudflare, близько 20% глобального інтернет-трафіку проходить через їхню мережу, тому будь-яка помилка в основних модулях може мати серйозні наслідки на світовому рівні.