ZUSAMMENFASSUNG
Am 1. August 2024 von 12:10 UTC bis 12:33 UTC verzeichnete eine kleine Anzahl von Chat-Kunden in Pod 23 die Erfahrung, dass Chats getrennt wurden und keine neuen Chats starten konnten.
Zeitleiste
01. August 2024 12:40 UTC | 01. August 2024, 05:40 Uhr PST
Wir untersuchen Chat-Probleme und -Fehler auf Pod 23 und möchten sie untersuchen. Weitere Informationen in Kürze.
01. August 2024 12:58 UTC | 01. August 2024 05:58 PST
Wir haben den Server neu gestartet, der speziell den Chat-Dienst in Pod 23 betrifft, und wir sehen Verbesserungen im Backend. Möglicherweise stellen Sie während dieses Zeitraums jedoch eine Verzögerung beim Speichern der Chatdaten für laufende Chats fest. Außerdem besteht vorübergehend eine Diskrepanz zwischen dem Status, der im Status-Switcher im Arbeitsbereich für Agenten angezeigt wird, und dem Server. In diesem Fall kann es vorkommen, dass ein Agent im Arbeitsbereich für Agenten ONLINE erscheint, auf dem Server aber OFFLINE ist, was sich auf die Verteilung von Chattickets auswirken könnte.
01. August 2024 13:49 Uhr UTC | 01. August 2024, 06:49 Uhr PT
Um es noch einmal zu sagen, es sollte kein Datenverlust sein, aber die laufenden Chats für die von diesem Problem betroffenen Konten wurden möglicherweise vorzeitig abgebrochen. Diese Chats werden wiederhergestellt und gespeichert, allerdings mit einer Zeitverzögerung. Wir haben auch mit unserem Infrastrukturpartner Rücksprache gehalten, der bestätigte, dass auf seiner Seite ein zugrundeliegendes Problem vorliegt. Vielen Dank für Ihr Verständnis, während wir an der Lösung dieses Problems gearbeitet haben.
POST-MORTEM
Ursachenanalyse
Dieser Vorfall wurde durch einen unerwarteten AWS-Infrastrukturfehler verursacht, der sich auf eine bestimmte Rechenkapazitätsinstanz auswirkte.
Lösung
Zur Behebung dieses Problems haben wir die betroffene Rechenkapazitätsinstanz neu gestartet. Anschließend wurde der Dienst auf einen anderen stabilen AWS-Host migriert und das Problem damit behoben.
Korrekturelemente
- Sicherstellen eines automatischen Neustarts des Live-Chat-Servers, wenn er von AWS abgeschaltet wird, und zwar über den Dienst, der es uns ermöglicht, Code auszuführen, ohne Server bereitstellen oder verwalten zu müssen.
- Aktualisieren des Benachrichtigungssystems, damit die Benachrichtigungen noch genauer sind.
- Die Zeit für den Chat-Auffüllmechanismus zu verkürzen.
- Führen Sie in Zusammenarbeit mit dem verantwortlichen Team Resilienztests für die Korrekturen durch.
WEITERE INFOS
Aktuelle Systemstatusinformationen zu Ihrem Zendesk finden Sie auf der Systemstatusseite. Die Zusammenfassung unserer Post-mortem-Untersuchung wird in der Regel hier einige Tage nach Abschluss des Vorfalls gepostet. Wenn Sie weitere Fragen zu diesem Vorfall haben, wenden Sie sich an den Zendesk-Kundensupport.
Hinweis zur Übersetzung: Dieser Beitrag wurde mit automatischer Übersetzungssoftware übersetzt, um dem Leser ein grundlegendes Verständnis des Inhalts zu vermitteln. Trotz angemessener Bemühungen, eine akkurate Übersetzung bereitzustellen, kann Zendesk keine Garantie für die Genauigkeit übernehmen.
Sollten in Bezug auf die Genauigkeit der Informationen im übersetzten Beitrag Fragen auftreten, beziehen Sie sich bitte auf die englische Version des Beitrags, die als offizielle Version gilt.
0 Kommentare