RIEPILOGO
Il 2 luglio 2024, tra le 18:20 e le 18:44 UTC, il nostro servizio Sunshine Conversations ha registrato una latenza elevata a causa di un aumento inaspettato del traffico. Ciò ha causato un rallentamento dei nostri sistemi e ritardi nell’elaborazione dei messaggi.
Cronologia
2 luglio 2024 22:12 UTC | 2 luglio 2024 15:12 PT
Il problema che influiva sulle prestazioni di Answer Bot nel Pod 13 è stato completamente risolto. Se il problema persiste, non esitare a contattarci.
2 luglio 2024 21:07 UTC | 2 luglio 2024 14:07 PT
Stiamo riscontrando miglioramenti alle prestazioni di Answer Bot nel Pod 13 e continueremo a monitorare le prestazioni. Fornirà un aggiornamento finale una volta risolto l’incidente.
2 luglio 2024 20:13 UTC | 2 luglio 2024 13:13 PT
I nostri tecnici stanno esaminando il problema che causa il degrado di Answer Bot sul Pod 13. Forniremo un altro aggiornamento quando avremo nuove informazioni da condividere.
2 luglio 2024 19:47 UTC | 2 luglio 2024 12:47 PT
Stiamo esaminando le segnalazioni di degrado di Answer Bot sul Pod 13. Forniremo un altro aggiornamento quando avremo maggiori informazioni.
POST-MORTEM
L’incidente è stato causato da un aumento significativo del traffico. Ciò ha causato un rallentamento dei nostri sistemi, con conseguenti ritardi e interruzioni temporanee del servizio. Abbiamo intrapreso un’azione immediata per gestire l’aumento del carico e ripristinare le normali operazioni.
Analisi della causa principale
La causa principale è stata un improvviso picco di traffico, che ha raddoppiato il traffico abituale e saturato il nostro database, causando ritardi. Inoltre, il nostro servizio AnswerBot non è stato in grado di gestire l'aumento del carico, causando ulteriori interruzioni.
Soluzione
Per mitigare il problema, abbiamo ampliato il database e il servizio AnswerBot, aumentandone la capacità di gestire l’impennata. Questo ci ha permesso di ripristinare le normali operazioni ed elaborare il backlog di messaggi.
Elementi correttivi
1. Abilita ridimensionamento automatico: Implementa la scalabilità automatica per i servizi critici per gestire i picchi di traffico improvvisi.
2. Presentazione degli interruttori automatici: Evita il sovraccarico dei servizi riducendo temporaneamente il traffico quando necessario.
3. Migliora il monitoraggio: Migliora i nostri sistemi di monitoraggio per rilevare e rispondere più rapidamente a problemi simili.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.