Cloudflare的修復過程花了多久時間,從問題定位到全面解決的關鍵節點有哪些?
Answer
Cloudflare故障修復時程與關鍵節點
Cloudflare 於 11 月 18 日晚間發生全球性網路故障,導致大量網站和應用程式癱瘓。此次事件影響範圍廣泛,包括 X (Twitter)、ChatGPT、Spotify、AWS、英雄聯盟、Google、Canva、Azure 等知名平台均受到波及,出現連線失敗及系統錯誤等問題。根據 Downdetector 的統計,許多用戶回報無法登入網站,網頁元件遺失,甚至有用戶表示「全世界都受到影響」。
修復過程時間軸
根據 Cloudflare 官方狀態頁面的更新,故障修復的關鍵時間點如下(以 UTC 協調世界時為準):
- 13:09 UTC: 問題定位完成,開始進行修復。
- 13:13 UTC: Access 與 WARP 錯誤率恢復至事件前水準;倫敦的 WARP 使用重新啟用。
- 14:34 UTC: 部署變更,儀表板服務恢復,但廣泛應用服務仍在修復中。
- 14:42 UTC: 修復完成,官方認為事件已解決,進入監控階段。
- 14:57 UTC: 仍有部分客戶在登入/使用儀表板時出現問題,持續處理與監控。
綜合來看,從問題定位到宣告修復完成,Cloudflare 大約花費 1 小時 33 分鐘。但後續仍持續監控並處理部分客戶遇到的登入問題。
故障原因與影響
Cloudflare 作為大量網站的中介層,提供 CDN、DNS、安全與邊緣運算等服務。因此,當 Cloudflare 的全球網路出現問題時,經過其轉送或解析的流量會同時受到影響,導致許多網站出現 500 錯誤、連線超慢等狀況。此次故障凸顯了 Cloudflare 在網路基礎設施中的重要性,以及單點故障可能造成的廣泛影響。儘管故障發生在台灣時間深夜,對多數上班族影響不大,但仍引起廣泛關注,許多網友在社群媒體上討論相關情況。