RIEPILOGO
Il 6 febbraio 2025 dalle 18:00 UTC alle 10:25 UTC del 7 febbraio, alcuni clienti di Explore negli Stati Uniti hanno riscontrato ritardi nei dati dei dashboard di Explore.
CRONOLOGIA
7 febbraio 2025 11:12 UTC | 7 febbraio 2025 03:12 PT
Siamo lieti di informarti che il problema con il dashboard Explore è stato risolto alle 10:25 UTC. Grazie per la pazienza e la comprensione.
7 febbraio 2025 10:54 UTC | 7 febbraio 2025 02:54 PT
Attualmente stiamo riscontrando ritardi nel dashboard di Explore da ieri alle 20:00 UTC. Il nostro team tecnico ha identificato il problema e ha applicato una soluzione. Stiamo monitorando attivamente la situazione per garantire un’esperienza senza intoppi. Grazie per la pazienza.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da una capacità insufficiente in un cluster di elaborazione, a causa di un’esportazione di dati di grandi dimensioni usando il nuovo servizio Esportazione dati. L’esecuzione della query ha richiesto troppo tempo, provocando più tentativi, che hanno comportato tre esecuzioni simultanee della stessa query problematica. Queste query hanno continuato a essere eseguite anche dopo l’arresto del servizio che le aveva avviate, contribuendo al picco di utilizzo della CPU.
Soluzione
Per risolvere il problema, il team ha riavviato manualmente il cluster di elaborazione, terminando le query bloccate e ripristinando la normale capacità operativa del cluster. Questa azione ha ripristinato la capacità del cluster di elaborare altre query in modo efficace.
Elementi correttivi
- Limiti di tempo delle query di implementazione: Stabilisci limiti di tempo per le query di esportazione per evitare che esecuzioni troppo lunghe influiscano sulle prestazioni del sistema.
- Migliora il monitoraggio: Migliora i sistemi di monitoraggio per attivare gli avvisi in caso di utilizzo elevato della CPU in modo più evidente e sensibile, garantendo risposte più rapide a potenziali problemi.
- Verifica e ottimizza le query: Esamina tutte le query associate all’Esportatore di dati per identificare e ottimizzare quelle che usano clausole JOIN con condizioni OR, che sono problematiche per le prestazioni.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk e sugli impatti specifici sul tuo account, visita la nostra pagina sullo stato del sistema. Puoi seguire questo articolo per ricevere una notifica quando verrà pubblicato il nostro report post mortem. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti