RIEPILOGO
Il 13 gennaio 2025, dalle 11:07 UTC alle 12:07 UTC, i clienti del Pod 17 hanno riscontrato problemi con la mancata esecuzione dei trigger di messaggistica.
CRONOLOGIA
13 gennaio 2025 12:24 UTC | 13 gennaio 2025 04:24 PT
Il recente problema di messaggistica è stato completamente risolto e i nostri servizi sono tornati alla piena operatività. Grazie per la pazienza dimostrata durante questo periodo. Il nostro team continuerà a monitorare da vicino i nostri sistemi per garantire che tutto funzioni senza intoppi. Apprezziamo il tuo supporto e siamo qui per qualsiasi domanda o feedback tu possa avere.
13 gennaio 2025 11:51 UTC | 13 gennaio 2025 03:51 PT
Stiamo esaminando i problemi con i trigger di messaggistica in esecuzione per i nostri clienti sul POD17.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato dalla chiusura anticipata dei consumer del servizio Eventi del registro dei ticket di messaggistica, avvenuta mentre il servizio era ancora in esecuzione. Di conseguenza, i consumer non sono stati in grado di elaborare gli eventi in ingresso, con conseguente interruzione completa della valutazione e dell’esecuzione dei trigger di messaggistica nel pod 17.
Soluzione
Per risolvere questo problema, abbiamo identificato l’errore di configurazione che impostava il numero massimo di record da elaborare in un singolo batch su 500 anziché 250. Correggendo questo errore di battitura e riducendo il valore massimo di record, abbiamo mirato a ridurre la probabilità che i consumatori cessino a causa di problemi di timeout.
Elementi correttivi
- Implementa un controllo dello stato per rilevare le terminazioni premature dei consumer.
- Crea un monitor per monitorare il numero di consumer in esecuzione.
- Stabilisci un monitor per monitorare le partizioni interrotte per il consumer degli eventi del registro dei ticket Tessaging.
- Aggiungi un widget per lo stato del ritardo del consumatore al dashboard del servizio trigger di messaggistica.
- Crea una nuova metrica per misurare il tempo impiegato per elaborare un batch di messaggi dall’argomento Eventi del registro dei ticket di messaggistica.
Queste soluzioni sono progettate per migliorare il monitoraggio e prevenire incidenti simili in futuro, garantendo la stabilità e l’affidabilità del servizio trigger di messaggistica.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk e sugli impatti specifici sul tuo account, visita la nostra pagina sullo stato del sistema. Puoi seguire questo articolo per ricevere una notifica quando verrà pubblicato il nostro report post mortem. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti