Cloudflare потвърди, че масовият срив на услугите ѝ не се дължи на кибератака и не са загубени данни. Проблемът възникна около 20:52 ч. българско време вчера, когато Workers KV (Key-Value) — главната база данни на сървърната платформа на Cloudflare — спря да функционира напълно. В резултат на това множество услуги на Cloudflare претърпяха сериозни смущения.
Workers KV представлява разпределено, съгласувано хранилище с ключове и стойности, използвано като фундамент за множество услуги на Cloudflare, включително платформи като Cloudflare Workers, Access, WARP и Stream.
Неизправността засегна и услуги на Google Cloud Platform, с множество сървъри, платформи и приложно-програмен интерфейс, разчитащи на Cloudflare. В резултат на срива всички услуги, съхраняващи състояние или конфигурационни данни в Workers KV, изпаднаха в състояние на отказ.
Подробности за срива:
Неизправността трая около 2,5 часа и главната ѝ причина бе неуспех на съхранението на данните при външен партньор на Cloudflare.
Според Cloudflare:
„Причината за срива беше отказ на съхранителната инфраструктура на Workers KV, която зависи и от услуги на външен партньор. Вследствие на това всички услуги, изискващи съхранение на състоянието, станаха недостатъчно достъпни.“
Въздействие:
Неизправността засегна множество услуги на Cloudflare:
-
Workers KV: около 90,22% отказ при всички некеширани записи и четения.
-
Access, WARP, Gateway: всички претърпяха смущения при удостоверяване, сесиите и прилагане на правила.
-
Turnstile, Dashboard: отказ при логване и потвърждаване с CAPTCHA.
-
Browser Isolation, Stream, Pages: сериозни смущения при стартиране на сесии, поточно предаване на съдържание и внедряване на нови проекти.
-
Workers AI, Durable Objects, Queues: всички сървисни платформи изпитаха сериозно покачване на грешките.
-
Zaraz, Realtime, API Gateway: всички те също бяха засегнати, поради зависимостта си към KV.
Мерки:
Cloudflare съобщава, че ще премести съхранението на KV към нейно собствено обектно хранилище (R2) с цел да премахне зависимостите ѝ от външни платформи.
Допълнително, Cloudflare планира да внедри безотказни механизми, с чиято помощ да може да възстановява услуги постепенно при смущения, с цел да избегне лавинообразни откази.
В обобщение, събитие като това показва колко концентрирани могат да бъдат смущения при съвременната интернет инфраструктура. Cloudflare потвърди, че сривът не произтича от кибератака, а от техническа повреда при партньор, и потвърди, че не са загубени потребителски данни.









