RIEPILOGO
Il 19 febbraio 2024, dalle 12:10 alle 12:35 UTC, un sottoinsieme di clienti di All Pods, con sede principalmente in India, potrebbe aver riscontrato ritardi di connettività e un aumento degli errori del server durante il tentativo di caricare i prodotti Zendesk.
Cronologia
13:18 UTC | 05:18 PT
Siamo a conoscenza di segnalazioni dei clienti su problemi di connettività regionali per gli agenti con sede in India. Possiamo vedere che il problema si è quasi completamente risolto, ma continueremo a monitorarlo attentamente fino alla risoluzione completa.
14:55 UTC | 06:55 PT
I clienti di tutti i pod, ma solo quelli con sede nella regione di Chennai in India, potrebbero aver riscontrato ritardi di connettività e un aumento degli errori del server HTTP 4xx/5xx durante il tentativo di caricare Zendesk. Il problema ha interessato il nostro provider CDN tra le 12:10 e le 12:35 UTC di oggi e ora è considerato completamente risolto. Grazie per la pazienza.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da complicazioni del provider di servizi Internet (ISP) regionale in India che hanno interrotto le funzionalità di indirizzamento di rete del data center di Chennai (colo) del provider CDN. Questa interruzione ha impedito il successo delle comunicazioni con la nostra infrastruttura, causando gli errori riscontrati dagli utenti. Un fattore secondario che ha esacerbato la situazione è stata la presenza di misure di riparazione temporanee da un incidente precedente, volte a prevenire il failover automatico da parte del progetto Internet Resilience per qualsiasi provider CDN in India. Di conseguenza, ciò ha disabilitato anche la nostra capacità di eseguire un failover manuale durante l'interruzione.
Soluzione
Per risolvere il problema, il nostro provider CDN è riuscito a reindirizzare il traffico interessato tramite Chennai colo verso le 12:33 UTC, ripristinando il servizio entro le 12:35 UTC. Dopo il ripristino, non sono stati segnalati ulteriori 522 errori HTTP. Inoltre, per precauzione, il traffico è stato reindirizzato al colo di Mumbai, ma non sono stati osservati effetti negativi da questa azione.
Elementi correttivi
- Modifica i nostri sistemi di monitoraggio per garantire che possano fornire avvisi anche quando sono in atto misure di riparazione specifiche, consentendo un rilevamento e una risposta più rapidi.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, registra un ticket con noi tramite la messaggistica ZBot nel Widget.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti