JAKARTA – Cloudflare, raksasa infrastruktur internet yang menangani sekitar 20% trafik web dunia, merilis laporan resmi penyebab pemadaman masif yang melumpuhkan ribuan situs populer pada Selasa malam, 18 November 2025. Gangguan yang berlangsung hampir enam jam ini disebut CEO Matthew Prince sebagai insiden terburuk bagi perusahaan sejak 2019.
Gangguan dimulai sekitar pukul 18.20 WIB (11.20 UTC) dan baru sepenuhnya pulih pada pukul 00.06 WIB keesokan harinya. Ribuan layanan ternama seperti X (dulu Twitter), ChatGPT, Sora (OpenAI), Spotify, Discord, Canva, Apple Podcasts, hingga situs BMKG dan Downdetector ikut lumpuh total atau mengalami error 5xx.
Menurut penjelasan resmi Cloudflare, akar masalah terletak pada sistem Bot Management. Perubahan izin rutin pada database ClickHouse memicu duplikasi data secara masif pada file fitur deteksi bot. File ini mengenali karakteristik aktivitas bot, dan akhirnya berisi banyak duplikasi baris fitur.
File konfigurasi yang membengkak dua kali lipat itu kemudian disebarkan ke seluruh edge server global Cloudflare. Akibatnya, sistem proxy inti kehabisan memori dan mengalami crash berulang setiap lima menit, menciptakan pola naik-turun yang membingungkan tim insinyur—awalnya bahkan dicurigai sebagai serangan DDoS terbesar dalam sejarah.
Cloudflare menegaskan bahwa ini bukan serangan siber. Prince menulis bahwa insiden tersebut tidak disebabkan, secara langsung maupun tidak langsung, oleh serangan siber atau aktivitas berbahaya dalam bentuk apa pun.
Dampak Luas dan Kerugian Miliaran Dolar
Lebih dari 4.000 klien enterprise Cloudflare (dengan pendapatan tahunan di atas US$100.000) terdampak langsung. Sejumlah analis memperkirakan kerugian global mencapai US$5–15 miliar per jam, sehingga total potensi kerugian untuk gangguan hampir enam jam dapat menembus US$60 miliar. Saham Cloudflare (NET) turun lebih dari 2% pada sesi after-hours.
Empat Langkah Perbaikan
Untuk mencegah kejadian serupa, Cloudflare mengumumkan empat tindakan korektif:
- Memperketat validasi otomatis semua file konfigurasi internal sebelum penerapan.
- Menambahkan lebih banyak global kill switch untuk mematikan fitur bermasalah dalam hitungan detik.
- Menghilangkan risiko core dump yang membebani CPU dan memori saat terjadi crash.
- Melakukan audit ulang terhadap seluruh skenario kegagalan pada modul proxy inti.
Mengingat pentingnya layanan Cloudflare, setiap gangguan tidak dapat diterima. Perusahaan menyampaikan permintaan maaf kepada pelanggan dan seluruh pengguna internet.
Insiden ini menjadi pengingat bahwa infrastruktur internet modern sangat rapuh. Satu titik kegagalan pada penyedia tier-1 seperti Cloudflare mampu melumpuhkan sebagian besar dunia digital dalam waktu singkat.