RIEPILOGO
Tra le 23:30 UTC del 12 novembre 2024 e le 11:26 UTC del 15 novembre 2024, i clienti Support che usavano gli SLA nei pod 25 e 30 hanno riscontrato ritardi nei calcoli degli SLA e i badge SLA sui loro ticket non venivano visualizzati come previsto dopo l’applicazione aggiornamenti dei ticket.
CRONOLOGIA
15 novembre 2024 13:00 UTC | 15 novembre 2024 05:00 PT
Siamo lieti di comunicare che i problemi che influiscono sulle prestazioni degli SLA per le metriche nei pod 25 e 30 sono stati risolti. Grazie per la pazienza.
15 novembre 2024 12:16 UTC | 15 novembre 2024 04:16 PT
Stiamo riscontrando miglioramenti al problema che influisce sulle prestazioni degli SLA per le metriche nel pod 25 e 30. Continuiamo a monitorare e forniremo ulteriori aggiornamenti non appena saranno disponibili.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da un segreto configurato in modo errato per il servizio eventi di metrica. Ciò significava che quando Zendesk ha distribuito un aggiornamento con ulteriore convalida, il servizio non veniva inizializzato per le distribuzioni nell’area Asia-Pacifico, causando ritardi nell’elaborazione.
Soluzione
Per risolvere questo problema, il 15 novembre 2024 è stato aggiunto un valore "predefinito" per il segreto interessato. Ciò ha consentito al servizio eventi di metrica di inizializzarsi correttamente e di riprendere le normali operazioni. Zendesk ha anche identificato e impostato un valore predefinito per un segreto del servizio di trascrizione talk per mitigare eventuali rischi futuri.
Elementi correttivi
- Esegui un controllo approfondito di tutti i segreti per garantire che i valori siano impostati per tutte le località, in particolare nelle regioni Asia-Pacifico.
- Migliora gli strumenti di implementazione esistenti per evitare configurazioni errate simili in futuro.
- Crea ulteriori avvisi per notificare ai team interessati gli errori e i problemi di inizializzazione.
- Analizza il monitoraggio delle metriche degli errori per garantire che tali incidenti attivino avvisi per soluzioni tempestive.
Implementando queste soluzioni, miriamo a migliorare la resilienza dei nostri servizi e a prevenire incidenti simili in futuro.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti