Riepilogo
Il 18 dicembre 2023, dalle 22:25 alle 23:18 UTC, i clienti Zendesk Chat e Support (Messaggistica) di tutti i pod potrebbero aver riscontrato diversi problemi, tra cui errori di chat e messaggistica, disconnessioni, problemi di accesso e impossibilità di cambiare lo stato degli agenti.
Cronologia
23:03 UTC | 15:03 PT
Stiamo esaminando le segnalazioni di problemi di connettività di Chat. Forniremo un altro aggiornamento tra 15 minuti.
23:20 UTC | 15:20 PT
Il nostro team continua a indagare sui problemi relativi a più pod che influiscono su più funzioni di Chat, Social Chat e Messaggistica (spazio di lavoro agente Support). Potrebbero influire su ritardi di chat/messaggi, problemi di accesso, indirizzamento di messaggi e chat e altre funzionalità. Prossimo aggiornamento tra 30 minuti.
23:42 UTC | 15:42 PT
I nostri tecnici hanno riavviato un server Chat non integro e ora stanno assistendo al ripristino. Continueremo a monitorare le prestazioni e forniremo un altro aggiornamento quando avremo ulteriori informazioni da condividere.
00:49 UTC | 16:49 PT
Chat e Messaggistica sono ora completamente guariti dal problema del server di oggi. I nostri team continueranno a monitorare le prestazioni e a lavorare per ripristinare le chat cronologiche recuperabili che non sono state ripristinate automaticamente. Al termine dei lavori, nelle prossime ore invieremo un messaggio finale.
01:24 UTC | 17:24 PT
I nostri team hanno ripristinato tutte le chat cronologiche recuperabili che non sono state recuperate durante l’interruzione del servizio di ieri. Grazie per la pazienza e ci scusiamo per i disagi causati da questo problema.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da un singolo errore dell’host di chat nell’infrastruttura del nostro provider di hosting. Ciò ha comportato un'interruzione del servizio di chat/messaggistica per i clienti serviti da questo particolare host di backend.
Soluzione
Per risolvere il problema, il nostro team ha riavviato l’host interessato. Il recupero dei messaggi non consegnati interessati durante l’interruzione è stato completato dopo il ripristino del servizio.
Elementi correttivi
- Migliora il tempo di ripristino quando si verifica un errore di istanza aggiornando i runbook per avviare le procedure di ciclo di spegnimento prima del tempo [Pianificato]
- Aggiorna l’accesso agli strumenti per i tecnici reperibili [Pianificato]
- Introduci ulteriori avvisi per rilevare gli errori delle istanze [In corso].
- Aumenta la priorità delle migrazioni degli account Pod per ridurre il raggio di impatto [In corso].
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, registra un ticket con noi tramite la messaggistica ZBot nel Widget.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti