Überblick
Am 18. Dezember 2023 von 22:25 UTC bis 23:18 UTC waren Zendesk Chat- und Support (Messaging)-Kunden in allen Pods möglicherweise mit verschiedenen Problemen konfrontiert, darunter Chat- und Messaging-Fehler, Verbindungsabbrüche, Anmeldeprobleme und die Unfähigkeit, den Agentenstatus zu ändern.
Zeitleiste
23:03 UTC | 15:03 PT
Wir untersuchen Berichte über Probleme mit der Chat-Verbindung. Wir werden in 15 Minuten ein weiteres Update bereitstellen.
23:20 UTC | 15:20 PT
Unser Team untersucht weiterhin Probleme in mehreren Pods, die sich auf mehrere Funktionen in Chat, Social Chat und Messaging (Support Agent Workspace) auswirken. Chat-/Nachrichtenverzögerungen, Anmeldeprobleme, Nachrichten- und Chatverteilung und andere Funktionen können betroffen sein. Nächste Aktualisierung in 30 Minuten.
23:42 UTC | 15:42 PT
Unsere Techniker haben einen fehlerhaften Chat-Server neu gestartet und sehen jetzt die Wiederherstellung. Wir werden die Leistung weiterhin überwachen und weitere Updates bereitstellen, wenn wir weitere Informationen haben.
00:49 UTC | 16:49 PT
Chat und Messaging wurden nach dem heutigen Serverproblem vollständig wiederhergestellt. Unsere Teams überwachen die Leistung weiterhin und arbeiten daran, alle wiederherstellbaren historischen Chats, die nicht automatisch wiederhergestellt wurden, wiederherzustellen. Wir werden in den nächsten Stunden eine letzte Nachricht senden, wenn diese Arbeiten abgeschlossen sind.
01:24 UTC | 17:24 PT
Unsere Teams haben alle wiederherstellbaren historischen Chats wiederhergestellt, die während der gestrigen Serviceunterbrechung nicht wiederhergestellt wurden. Vielen Dank für Ihre Geduld und wir entschuldigen uns für die Unannehmlichkeiten, die dadurch verursacht wurden.
POST-MORTEM
Ursachenanalyse
Dieser Vorfall wurde durch einen einzelnen Fehler des Live-Chat-Hosts in der Infrastruktur unseres Hosting-Anbieters verursacht. Dies führte zu einer Störung des Chat-/Messaging-Dienstes für Kunden, die von diesem Backend-Host betreut werden.
Lösung
Um dieses Problem zu beheben, hat unser Team den betroffenen Host neu gestartet. Die Wiederherstellung nicht zugestellter Nachrichten, die während des Ausfalls betroffen waren, wurde nach Wiederherstellung des Dienstes abgeschlossen.
Korrekturelemente
- Verbessern Sie die Wiederherstellungszeit, wenn ein Instanzfehler auftritt, indem Sie die Runbooks aktualisieren, um die Power-Cycle-Verfahren früher einzuleiten [geplant]
- Toolzugriff für Bereitschaftstechniker aktualisieren [geplant]
- Zusätzliche Benachrichtigungen einführen, um Instanzfehler zu erkennen [in Bearbeitung].
- Priorität von Pod-Konto-Migrationen eskalieren, um den Wirkungsradius zu verringern [in Bearbeitung].
WEITERE INFOS
Aktuelle Systemstatusinformationen zu Ihrem Zendesk finden Sie auf der Systemstatusseite. Die Zusammenfassung unserer Post-mortem-Untersuchung wird in der Regel hier einige Tage nach Abschluss des Vorfalls gepostet. Wenn Sie weitere Fragen zu diesem Vorfall haben, reichen Sie bitte über ZBot Messaging im Widget ein Ticket bei uns ein.
Hinweis zur Übersetzung: Dieser Beitrag wurde mit automatischer Übersetzungssoftware übersetzt, um dem Leser ein grundlegendes Verständnis des Inhalts zu vermitteln. Trotz angemessener Bemühungen, eine akkurate Übersetzung bereitzustellen, kann Zendesk keine Garantie für die Genauigkeit übernehmen.
Sollten in Bezug auf die Genauigkeit der Informationen im übersetzten Beitrag Fragen auftreten, beziehen Sie sich bitte auf die englische Version des Beitrags, die als offizielle Version gilt.
0 Kommentare