Nelle scorse ore, Cloudflare ha dovuto fronteggiare una massiccia interruzione di servizio dovuta alla modifica della configurazione di rete in 19 data center, tra cui pure quello di Milano, che ha dato vita a non pochi problemi, impedendo per ben 45 minuti di accedere a servizi quali Amazon, Twitch, Steam, Telegram, Coinbase e molti altri. Pur rappresentando i data center coinvolti solo il 4% della rete totale, l’errore di configurazione ha avuto conseguenze per il 50% delle richieste HTTP.
Cloudflare: configurazione di rete modificata in 19 data center e problemi
Andando ad esaminare la situazione più in dettaglio, come comunicato da Cloudflare stessa, le problematiche si sono verificate durante un intervento programmato messo in atto al fine di incrementare la resilienza dei data center solitamente più carichi. Il problema ha avuto inizio alle ore 6:34 UTC, il primo data center è stato riportato online alle ore 6:58 UTC, mentre il ripristino completo è avvenuto alle ore 7:42 UTC.
Da tenere presente che è da oltre un anno che Cloudflare sta portando avanti i lavori necessari per la conversione alla nuova architettura Multi-Colo PoP (MCP) con i data center che si trovano nelle seguenti 19 città: Amsterdam, Atlanta, Ashburn, Chicago, Francoforte, Londra, Los Angeles, Madrid, Manchester, Miami, Milano, Mumbai, Newark, Osaka, São Paulo, San Jose, Singapore, Sydney e Tokyo.
La parte con maggiori criticità della nuova architettura e il layer di routing aggiuntivo che genera un mesh di connessioni, il quale consente a Cloudflare di abilitare e disabilitare parti della rete interna di un data center senza interrompere il traffico qualora sia in corso un'operazione di manutenzione oppure a seguito di un problema tecnico.