RIEPILOGO
Il 26 marzo 2024, dalle 10:54 UTC alle 13:00 UTC, un numero significativo di clienti Tymeshift su più pod ha riscontrato difficoltà ad accedere ai propri account. Il problema si è manifestato come errori di accesso o caricamento della pagina di accesso.
Cronologia
12:15 UTC | 05:15 PT
Siamo a conoscenza di un problema che impedisce ai clienti Tymeshift di accedere. Le indagini sono in corso e forniremo un altro aggiornamento a breve.
12:33 UTC | 05:33 PT
Stiamo continuando la nostra indagine sulla causa principale del mancato accesso a Tymeshift da parte dei clienti. Forniremo ulteriori informazioni tra 30 minuti.
13:00 UTC | 06:00 PT
Attualmente stiamo testando una possibile soluzione di ripristino per il problema su più pod che influisce sulla capacità di accesso dei clienti Tymeshift. Forniremo ulteriori informazioni tra 30 minuti.
13:07 UTC | 06:07 PT
Ora abbiamo implementato una soluzione per tutti i pod per risolvere il problema di accesso per i clienti Tymeshift. Prova ad accedere al tuo account come al solito e facci sapere se riscontri ulteriori problemi.
13:25 UTC | 06:25 PT
Non osserviamo più errori di accesso nel backend e i clienti hanno confermato di poter accedere ai propri account. In questo modo, consideriamo l’incidente risolto. Grazie.
POST-MORTEM
Analisi della causa principale
L’incidente è stato causato da un’impostazione di configurazione errata a seguito di un recente aggiornamento della nostra procedura di accesso. Una discrepanza nelle convenzioni di denominazione usate nel nostro sistema ha portato all’uso di un metodo obsoleto per la verifica delle identità degli utenti, che non era compatibile con il nostro sistema attuale. Ciò ha comportato errori da parte degli utenti durante il tentativo di accesso, poiché il sistema non ha riconosciuto le loro credenziali.
Soluzione
Per risolvere il problema, la configurazione errata è stata ripristinata a una versione precedente che non includeva la modifica problematica. Questo rollback ha ripristinato la capacità del sistema di autenticare correttamente gli utenti.
Elementi correttivi
- Migliora gli strumenti di implementazione esistenti, stabilendo un piano chiaro passo dopo passo per aggiornare la nostra procedura di accesso per garantire che tutte le parti del nostro sistema funzionino insieme senza problemi.
- Crea ulteriori test del fumo.
- Assicurati che gli aggiornamenti vengano spostati dal nostro ambiente di test al mondo reale senza intoppi.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, registra un ticket con noi tramite la messaggistica ZBot nel Widget.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.