RIEPILOGO
Il 21 novembre 2024, dalle 21:02 UTC alle 21:56 UTC, alcuni clienti che usavano Sunshine Conversations ospitate sul Pod 17 hanno riscontrato problemi di lentezza e di prestazioni.
CRONOLOGIA
24 novembre 2024 22:23 UTC | 24 novembre 2024 14:23 PT
Siamo lieti di annunciare che i problemi di latenza che influiscono su Sunshine Conversations per alcuni dei nostri clienti sul POD 17 sono stati risolti. Grazie mille per la pazienza.
24 novembre 2024 22:09 UTC | 24 novembre 2024 14:09 PT
Riteniamo di aver identificato la causa principale dei problemi di prestazioni che influiscono su SunCo per i nostri clienti su Pod17. Stiamo riscontrando miglioramenti e continueremo a monitorare il comportamento.
24 novembre 2024 21:53 UTC | 24 novembre 2024 13:53 PT
Continuiamo a esaminare i problemi di prestazioni del Pod 17. Potrebbero causare lentezza in Sunshine Conversations. Forniremo ulteriori aggiornamenti al più presto.
24 novembre 2024 21:36 UTC | 24 novembre 2024 13:36 PT
Stiamo esaminando potenziali problemi di prestazioni che influiscono su alcuni dei nostri clienti ospitati sul Pod 17. A breve pubblicheremo un aggiornamento con ulteriori dettagli.
POST-MORTEM
Analisi della causa principale
Questo incidente è stato causato da un aumento inaspettato del traffico sul Pod17, che è più che raddoppiato nella settimana precedente e ha quasi triplicato il giorno dell’incidente. L’SDK Unity utilizzato da un cliente inviava richieste eccessive all’API SunCo per recuperare il numero di messaggi non letti, con conseguente aumento del carico del sistema. Il ridimensionamento automatico delle risorse era già al massimo, impedendo l’aggiunta di altre risorse per gestire l’aumento del traffico. Di conseguenza, questo sovraccarico ha comportato tempi di risposta più lenti e alla fine ha attivato controlli di integrità che hanno avviato i riavvii, aggravando il problema.
Soluzione
Per risolvere i problemi di prestazioni, abbiamo aumentato il numero massimo di repliche per l’API SunCo sul Pod17. Questa modifica ha consentito al sistema di gestire meglio l’aumento del traffico e di ripristinare i normali tempi di risposta per tutti i clienti.
Elementi correttivi
- Esamina l’SDK Unity per capire perché invia un numero eccessivo di richieste a SunCo e implementa le ottimizzazioni.
- Documenta i modelli di interazione del back-end negli incorporabili per chiarire l’uso e identificare potenziali inefficienze.
- Valuta l’implementazione di una strategia di memorizzazione nella cache per le API SDK in SunCo per ridurre il numero di richieste.
- Aggiungi il monitoraggio per rilevare la crescita anomala del traffico in periodi specificati per affrontare in modo proattivo potenziali sovraccarichi.
PER MAGGIORI INFORMAZIONI
Per informazioni sullo stato attuale del sistema su Zendesk, consulta la nostra pagina sullo stato del sistema. Di solito, il riepilogo della nostra indagine post mortem viene pubblicato qui pochi giorni dopo la fine dell’incidente. Per ulteriori domande su questo incidente, contatta l’assistenza clienti Zendesk.
Avvertenza sulla traduzione: questo articolo è stato tradotto usando un software di traduzione automatizzata per fornire una comprensione di base del contenuto. È stato fatto tutto il possibile per fornire una traduzione accurata, tuttavia Zendesk non garantisce l'accuratezza della traduzione.
Per qualsiasi dubbio sull'accuratezza delle informazioni contenute nell'articolo tradotto, fai riferimento alla versione inglese dell'articolo come versione ufficiale.
0 commenti