RIEPILOGO
Il 14 ottobre 2024, dalle 13:49 alle 15:40 UTC, i clienti che usavano Explore nell’area geografica AMER hanno riscontrato errori di “download non riuscito” durante il tentativo di esportare o pianificare dashboard e report.
CRONOLOGIA
14 ottobre 2024 16:17 UTC | 14 ottobre 2024 09:17 PT
Siamo lieti di informarti che abbiamo risolto il problema che interessava i clienti Explore nelle Americhe, causando errori di "download non riuscito" durante il tentativo di esportare o pianificare dashboard e report. Grazie per la pazienza dimostrata durante la nostra indagine.
14 ottobre 2024 16:01 UTC | 14 ottobre 2024 09:01 PT
Abbiamo individuato la causa principale del problema che interessa i clienti US Explore che causano errori di "download non riuscito" durante il tentativo di scaricare o pianificare dashboard o report; tuttavia, esiste un arretrato di richieste che devono essere elaborate e potrebbero verificarsi alcuni ritardi. Verificheremo per garantire una soluzione completa. Se il problema persiste, non esitare a contattarci.
14 ottobre 2024 15:40 UTC | 14 ottobre 2024 08:40 PT
Abbiamo confermato un problema che riguardava i clienti di US Explore che causava errori di "download non riuscito" durante il tentativo di scaricare o pianificare dashboard o report. Il nostro team sta indagando e pubblicheremo ulteriori aggiornamenti nei prossimi 30 minuti.
14 ottobre 2024 15:26 UTC | 14 ottobre 2024 08:26 PT
Stiamo ricevendo segnalazioni di errori di "download non riuscito" per i clienti US Explore quando tentano di scaricare o pianificare dashboard o report. A breve pubblicheremo ulteriori informazioni.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato dall’eliminazione involontaria di un segreto necessario per l’autenticazione dei servizi in Explore. L’eliminazione si è verificata durante il processo di pulizia delle risorse Explore, quando si presumeva erroneamente che il segreto non fosse più necessario poiché era disponibile in una nuova versione del servizio.
Soluzione
Per risolvere il problema, è stato ricreato il segreto mancante, consentendo il riavvio del servizio. Ciò ha comportato un intervento manuale per riapplicare le definizioni dei segreti tramite la codebase, garantendo che tutti i componenti necessari funzionassero come previsto.
Elementi correttivi
- Porta a due il numero necessario di revisori nel repository pertinente per migliorare la supervisione delle modifiche.
- Documenta la procedura per verificare se un segreto nella nostra versione precedente è ancora in uso da altri servizi.
- Sviluppa un processo documentato per la convalida delle modifiche all’infrastruttura del rischio usando l’ambiente di staging e i test end-to-end.
- Definisci linee guida per l’implementazione delle modifiche alle infrastrutture di rischio nella produzione, incluso il tempo di interruzione appropriato.
- Indaga e risolvi i problemi di memoria correlati ai servizi Explore per prevenire il verificarsi di incidenti simili in futuro.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti