RIEPILOGO
Il 16 gennaio 2025, dalle 9:40 UTC alle 10:47 UTC, alcuni clienti Chat nel Pod 19 hanno riscontrato problemi nella visualizzazione delle chat recenti, nella ricezione delle email di esportazione delle chat e nella creazione di ticket dalle chat.
CRONOLOGIA
16 gennaio 2025 11:26 UTC | 16 gennaio 2025 03:26 PT
Siamo lieti di informarti che i problemi relativi al nostro servizio Chat per i nostri clienti su POD19 sono stati risolti. Apprezziamo sinceramente la pazienza e la comprensione dimostrate durante questo periodo.
16 gennaio 2025 11:00 UTC | 16 gennaio 2025 03:00 PT
Abbiamo compiuto progressi significativi nel ripristino delle funzionalità, inclusa la possibilità di visualizzare le chat recenti, ricevere email di esportazione delle chat e creare ticket. Continueremo a monitorare la situazione da vicino e lavoreremo diligentemente per migliorare la tua esperienza. Grazie per la pazienza e la comprensione dimostrate durante questo periodo.
16 gennaio 2025 10:39 UTC | 16 gennaio 2025 02:39 PT
Attualmente stiamo riscontrando un problema con i nostri servizi di chat nel Pod 19, che potrebbe impedirti di visualizzare le chat recenti, ricevere email di esportazione delle chat e creare ticket. Il nostro team sta lavorando attivamente per risolvere questi problemi il più rapidamente possibile. Grazie per la pazienza.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da un servizio di chat che ha raggiunto il limite di memoria, causando un ciclo di riavvio continuo. Ogni riavvio generava metadati aggiuntivi nel nostro database in memoria, causando un esaurimento della memoria fino all’esaurimento della memoria del sistema, con ripercussioni sugli altri servizi che condividevano la stessa istanza del database.
Soluzione
Per risolvere il problema, il team ha rimosso dal database i metadati non necessari e le chiavi non riconosciute per liberare memoria. Inoltre, i tipi di istanza sono stati aumentati per adattarsi al carico ed è stata completata la distribuzione del servizio.
Elementi correttivi
- Aggiungi avvisi: Avvisi implementati per le condizioni di memoria insufficiente (OOM) nel servizio di chat.
- Modifica limiti di memoria: Abbassata la soglia dei limiti di memoria per consentire un intervento tempestivo prima di raggiungere i livelli critici.
- Miglioramenti al runbook: Documentazione e runbook migliorati per la gestione del servizio di chat e della gestione delle chiavi del database.
- Cluster di database: Pianificato per separare le istanze del database per i diversi servizi per evitare problemi di memoria condivisa in futuro.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk e sugli impatti specifici sul tuo account, visita la nostra pagina sullo stato del sistema. Puoi seguire questo articolo per ricevere una notifica quando verrà pubblicato il nostro report post mortem. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti