Riepilogo
Il 23 luglio 2024, dalle 10:58 UTC alle 14:57 UTC, i clienti del Pod 29 hanno riscontrato l’impossibilità di accedere ai prodotti Zendesk (incluso il Centro amministrativo) tramite la barra delle applicazioni. Circa l’1% delle richieste dei clienti ha restituito 503 errori di accesso alle funzioni autenticate in Guide, Talk, Chat, Explore e Support e i clienti non sono stati in grado di aprire la barra dei prodotti Zendesk per passare da un prodotto all’altro. Sono stati presentati diversi errori nella barra dei prodotti e nella pagina principale del browser web.
Cronologia
23 luglio 2024 11:48 UTC | 23 luglio 2024 04:48 PT
Siamo a conoscenza e stiamo lavorando per mitigare i problemi per i clienti nel Pod 29 che non sono in grado di caricare il Centro amministrativo e ricevono l’errore “La pagina non funziona”. Anche altri prodotti sembrano non essere disponibili nella barra dei prodotti con il messaggio “Impossibile caricare i prodotti Zendesk. Riprova”. Prossimo aggiornamento tra 30 minuti o quando ne avremo altri da condividere.
23 luglio 2024 12:19 UTC | 23 luglio 2024 05:19 PT
Continuiamo a lavorare per risolvere i problemi di accesso relativi a più prodotti per i clienti nel Pod 29. La tua pazienza è molto apprezzata.
23 luglio 2024 13:22 UTC | 23 luglio 2024 06:22 PT
Stiamo continuando a lavorare a possibili soluzioni per i problemi di accesso che interessano più prodotti per i clienti sul Pod 29. Grazie per la pazienza dimostrata con noi durante questo periodo.
23 luglio 2024 13:46 UTC | 23 luglio 2024 06:46 PT
Abbiamo implementato una potenziale soluzione e stiamo notando una diminuzione degli errori, oltre ad alcuni miglioramenti durante il caricamento degli account di prova sul Pod 29. Ti chiediamo gentilmente di svuotare la cache e di svuotare i cookie, quindi di provare a caricare nuovamente Zendesk.
23 luglio 2024 14:06 UTC | 23 luglio 2024 07:06 PT
Anche se abbiamo ricevuto alcune conferme positive che le cose stanno funzionando, continuiamo a monitorare possibili nuovi picchi di errori. Apprezziamo la tua pazienza mentre attendiamo di contrassegnare il problema come completamente risolto.
23 luglio 2024 15:19 UTC | 23 luglio 2024 08:19 PT
Abbiamo identificato la causa principale del problema e abbiamo annullato la modifica per evitare ulteriori problemi. Dopo un ulteriore monitoraggio, abbiamo confermato l’assenza di ulteriori errori e stiamo contrassegnando questo incidente come completamente risolto.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato dall’implementazione della nuova autorizzazione alla gestione dei membri del team. Questa versione consente agli agenti con ruoli personalizzati di ottenere l’autorizzazione a visualizzare e gestire gli altri membri del team e le loro assegnazioni di ruolo come autorizzazione autonoma (annuncio). Questa implementazione ha portato a un forte aumento delle richieste al servizio di autorizzazioni interne sottostante, con conseguente saturazione della capacità del cluster di database. A causa di questo traffico, il cluster ha raggiunto la capacità massima di larghezza di banda della rete, causando un errore di rete tra il cluster e i server delle app del nostro servizio.
Soluzione
Per risolvere questo problema, il nostro team ha inizialmente aumentato la capacità dell’istanza del database del servizio di autorizzazioni per fornire un ripristino a breve termine. Una volta identificata la causa principale, i nostri tecnici hanno annullato la modifica del codice della funzione delle autorizzazioni.
Elementi correttivi
- Riduci il traffico di rete dai controlli delle autorizzazioni [In corso]
- Ulteriori monitoraggi e avvisi per rilevare gli aumenti di traffico [Pianificato]
- Analisi della capacità del database del servizio di autorizzazioni di dimensionamento corretto [Pianificato]
Per maggiori informazioni
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.