RIEPILOGO
Il 7 agosto 2024, dalle 20:48 alle 23:27 UTC, i clienti Support in tutti i pod hanno riscontrato problemi con le visualizzazioni dei ticket, inclusi ticket risolti che non scomparivano, aggiornamenti lenti e numeri visualizzati errati.
Cronologia
7 agosto 2024 22:00 UTC | 7 agosto 2024 15:00 PT
Stiamo esaminando le segnalazioni di visualizzazioni dei ticket di Support che non si aggiornano o mostrano ticket errati. Prossimo aggiornamento tra 30 minuti o quando avremo nuove informazioni da condividere.
7 agosto 2024 22:08 UTC | 7 agosto 2024 15:08 PT
I nostri ingegneri hanno apportato una modifica e ora stiamo riscontrando miglioramenti delle prestazioni in tutti i pod. Prossimo aggiornamento tra 30 minuti o quando avremo nuove informazioni da condividere.
7 agosto 2024 22:24 UTC | 7 agosto 2024 15:24 PT
Le prestazioni continuano a rimanere stabili in tutti i pod e continueremo a monitorare le prestazioni per la prossima ora. Prossimo aggiornamento tra un'ora.
7 agosto 2024 23:29 UTC | 7 agosto 2024 16:29 PT
Dopo il monitoraggio continuo, abbiamo riscontrato una stabilità e abbiamo la conferma che il problema relativo al mancato aggiornamento delle viste dei ticket di Support è stato risolto. Grazie per la pazienza dimostrata.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da un'interruzione del processo durante un passaggio di cluster blu/verde, in particolare a causa di una distribuzione incompleta che ha portato a errori di configurazione nei restanti pod di produzione.
Soluzione
Per risolvere questo problema, il team tecnico ha aumentato manualmente gli indicizzatori nel cluster attivo per elaborare gli aggiornamenti dei ticket accumulati. Hanno quindi ripreso la procedura di cambio cluster con la configurazione corretta.
Elementi correttivi
- È necessario esaminare il processo usato per il cambio di cluster per garantire che includa controlli post-distribuzione approfonditi per evitare che le distribuzioni incomplete passino inosservate.
- Sviluppa l’automazione per gestire il processo di cambio cluster, riducendo la necessità di interventi manuali e riducendo al minimo le possibilità di errore umano.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.