RIEPILOGO
Il 1° febbraio 2025, dalle 00:13 UTC alle 00:59 UTC, i clienti del POD 26 hanno riscontrato problemi con l’accesso ai ticket archiviati. Durante questo periodo, più nodi di lettura del database non sono stati in grado di aprire una tabella a causa di un difetto nel sistema del database. Ciò ha comportato query non riuscite per i ticket archiviati.
CRONOLOGIA
01 febbraio 2025 01:13 UTC | 31 gennaio 2025 17:13 PT
Siamo lieti di informarti che il problema che causava errori in un gruppo di clienti Support sul POD 26 è stato risolto. Grazie per la pazienza dimostrata durante la nostra indagine.
01 febbraio 2025 00:57 UTC | 31 gennaio 2025 16:57 PT
I nostri tecnici ritengono di aver identificato la causa principale degli errori che hanno interessato un gruppo di clienti Support nel POD 26 e stanno lavorando per risolvere il problema.
01 febbraio 2025 00:57 UTC | 31 gennaio 2025 16:57 PT
Stiamo esaminando potenziali errori per i nostri clienti Support ospitati sul POD 26.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da un difetto nel sistema del database che impediva ai nodi di lettura del cluster di accedere a una tabella di ticket archiviata. Il difetto è stato confermato dall’assistenza tecnica del nostro fornitore ed era specifico della versione del database installata in quel momento.
Soluzione
Per risolvere il problema, i nostri ingegneri hanno interrotto la distribuzione ad altri shard e hanno consentito il completamento delle modifiche in corso sugli shard interessati. A quel punto la tabella del database era accessibile. Successivamente, il team prevede di passare a una nuova versione del nostro sistema di database, che include una patch per il difetto identificato.
Elementi correttivi
- Passa alla versione con patch o successiva prima di riprendere le modifiche allo schema.
- Suddividi le aggiunte di colonne e le riduzioni di indici in azioni separate per ridurre al minimo i rischi durante le distribuzioni.
- Aggiorna il runbook per richiedere che le migrazioni di grandi dimensioni raggiungano inizialmente un solo cluster prima di espandersi ad altri.
- Implementa un processo di revisione regolare (almeno annuale) delle patch del sistema di database e stabilisci una cadenza di aggiornamento.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk e sugli impatti specifici sul tuo account, visita la nostra pagina sullo stato del sistema. Puoi seguire questo articolo per ricevere una notifica quando verrà pubblicato il nostro report post mortem. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti