RIEPILOGO
Il 1° agosto 2024, dalle 12:10 UTC alle 12:33 UTC, un numero limitato di clienti Chat nel Pod 23 ha riscontrato la disconnessione delle chat e l’impossibilità di avviarne di nuove.
Cronologia
01 agosto 2024 12:40 UTC | 01 agosto 2024 05:40 PT
Siamo a conoscenza e stiamo esaminando i problemi e gli errori di Chat nel Pod 23. Ulteriori informazioni in arrivo.
01 agosto 2024 12:58 UTC | 01 agosto 2024 05:58 PT
Abbiamo riavviato il server che interessa in modo specifico il servizio Chat nel Pod 23 e stiamo riscontrando miglioramenti nel backend. Tuttavia, durante questo periodo potresti notare un ritardo nel salvataggio dei dati delle chat per le chat in corso. Inoltre, esiste una discrepanza temporanea tra lo stato mostrato nel selettore di stato nello spazio di lavoro agente e il server. Di conseguenza, un agente potrebbe apparire ONLINE nello spazio di lavoro agente ma essere OFFLINE sul server, il che potrebbe influire sull'indirizzamento dei ticket di chat.
01 agosto 2024 13:49 UTC | 01 agosto 2024 06:49 PT
Per ribadire, non dovrebbe esserci alcuna perdita di dati, ma le chat in corso per gli account interessati durante questo problema potrebbero essere state interrotte prematuramente. Queste chat verranno recuperate e salvate, anche se con un certo ritardo. Abbiamo anche consultato il nostro partner di infrastruttura, che ha confermato di avere un problema di fondo. Grazie per la pazienza dimostrata nel tentativo di risolvere completamente il problema.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da un errore imprevisto dell’infrastruttura AWS che ha interessato una particolare istanza di capacità di calcolo.
Soluzione
Per risolvere questo problema, abbiamo riavviato l’istanza di capacità di calcolo interessata, che ha successivamente migrato il servizio a un altro host AWS stabile, risolvendo efficacemente il problema.
Elementi correttivi
- Garantisci il riavvio automatico del server LiveChat se viene spento da AWS, usando il servizio che ci consente di eseguire codice senza effettuare il provisioning o la gestione dei server.
- Aggiorna il sistema di avvisi per notifiche più accurate.
- Riduci i tempi del meccanismo di riempimento chat.
- Conduci test di resilienza sulle soluzioni in collaborazione con il team responsabile.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti