ZUSAMMENFASSUNG
Am 2. Juli 2024 zwischen 18:20 und 18:44 UTC kam es bei unserem Sunshine Conversations-Dienst aufgrund eines unerwarteten Anstiegs des Datenverkehrs zu hohen Latenzzeiten. Dies führte zu einer Verlangsamung unserer Systeme und zu Verzögerungen bei der Nachrichtenverarbeitung.
Zeitleiste
02. Juli 2024, 22:12 Uhr UTC | 02. Juli 2024, 15:12 Uhr PT
Das Problem mit der Answer-Bot-Leistung in Pod 13 ist jetzt vollständig behoben. Bitte teilen Sie uns mit, wenn das Problem weiterhin auftritt.
02. Juli 2024, 21:07 Uhr UTC | 02. Juli 2024 14:07 Uhr PT
Wir sehen, dass die Leistung des Answer Bots in Pod 13 verbessert wurde, und werden die Leistung auch weiterhin überwachen. Stellt eine abschließende Aktualisierung bereit, sobald der Vorfall behoben ist.
02. Juli 2024 20:13 Uhr UTC | 02. Juli 2024, 13:13 Uhr PT
Unsere Ingenieure untersuchen das Problem, das zur Beeinträchtigung des Answer Bots in Pod 13 führt. Wir werden ein weiteres Update bereitstellen, wenn wir neue Informationen haben.
02. Juli 2024 19:47 Uhr UTC | 02. Juli 2024 12:47 Uhr PT
Wir untersuchen Berichte über eine Beeinträchtigung des Answer Bots auf Pod 13. Wir werden ein weiteres Update bereitstellen, wenn wir weitere Informationen haben.
POST-MORTEM
Der Vorfall wurde durch einen starken Anstieg des Verkehrsaufkommens ausgelöst. Dies führte zu einer Verlangsamung unserer Systeme, was zu Verzögerungen und vorübergehenden Dienstunterbrechungen führte. Wir haben sofort Maßnahmen ergriffen, um die zusätzliche Arbeitslast zu bewältigen und den normalen Betrieb wiederherzustellen.
Ursachenanalyse
Die Hauptursache war eine plötzliche Trafficspitze, die unser normales Traffic verdoppelte, unsere Datenbank überlastete und zu Verzögerungen führte. Außerdem konnte unser AnswerBot-Dienst die erhöhte Arbeitslast nicht bewältigen, was zu weiteren Störungen führte.
Lösung
Zur Eindämmung des Problems haben wir unsere Datenbank und unseren Answer Bot-Service erweitert und ihre Kapazität erhöht, um mit dem Anstieg Schritt zu halten. Auf diese Weise konnten wir den normalen Betrieb wiederherstellen und den Nachrichtenrückstand verarbeiten.
Korrekturelemente
1. Automatische Skalierung aktivieren: Implementieren Sie eine automatische Skalierung für kritische Dienste, um plötzliche Trafficspitzen zu bewältigen.
2. Wir stellen vor: Um eine Überlastung der Dienste zu verhindern, können Sie den Datenverkehr bei Bedarf vorübergehend reduzieren.
3. Überwachung verbessern: Verbessern Sie unsere Überwachungssysteme, um ähnliche Probleme schneller zu erkennen und darauf zu reagieren.
WEITERE INFOS
Aktuelle Systemstatusinformationen zu Ihrem Zendesk finden Sie auf der Systemstatusseite. Die Zusammenfassung unserer Post-mortem-Untersuchung wird in der Regel hier einige Tage nach Abschluss des Vorfalls gepostet. Wenn Sie weitere Fragen zu diesem Vorfall haben, wenden Sie sich an den Zendesk-Kundensupport.
Hinweis zur Übersetzung: Dieser Beitrag wurde mit automatischer Übersetzungssoftware übersetzt, um dem Leser ein grundlegendes Verständnis des Inhalts zu vermitteln. Trotz angemessener Bemühungen, eine akkurate Übersetzung bereitzustellen, kann Zendesk keine Garantie für die Genauigkeit übernehmen.
Sollten in Bezug auf die Genauigkeit der Informationen im übersetzten Beitrag Fragen auftreten, beziehen Sie sich bitte auf die englische Version des Beitrags, die als offizielle Version gilt.