ZUSAMMENFASSUNG
Am 11. März 2025 von 5:50 UTC bis 23:18 UTC verzeichneten Talk-Kunden in allen Pods eine erhöhte Anzahl unterbrochener Anrufe.
CHRONIK
11. März 2025 23:26 Uhr UTC | 11. März 2025, 16:26 Uhr PST
Wir freuen uns, Ihnen mitteilen zu können, dass das Problem mit zeitweise unterbrochenen Anrufen in Talk jetzt behoben ist. Vielen Dank für Ihr Verständnis. Wir haben mit unserem Anbieter an diesem Problem gearbeitet.
11. März 2025, 15:22 Uhr UTC | 11. März 2025, 08:22 Uhr PST
Wir überwachen die Situation zusammen mit unserem Telefonie-Partner und stellen leider zeitweise Spitzen bei Anrufabbrüchen fest. Wir bitten um Ihr Verständnis. Wir werden die Situation weiterhin beobachten und Updates veröffentlichen, sobald wir mehr wissen.
11. März 2025 09:23 UTC | 11. März 2025, 02:23 Uhr PST
Wir freuen uns, Ihnen mitteilen zu können, dass unser Talk-Partner bestätigt hat, dass die Probleme mit unterbrochenen Anrufen um 08:46 UTC vollständig behoben wurden.
11. März 2025 07:32 UTC | 11. März 2025, 0:32 Uhr PST
Unser Talk-Partner hat jetzt das Problem gelöst, das zu unterbrochenen Anrufen bei unseren Kunden führen konnte. Wir werden die Situation weiterhin beobachten und Sie über weitere Updates informieren, sobald diese verfügbar sind.
11. März 2025 06:59 UTC | 10. März 2025, 23:59 Uhr PT
Unser Dienstanbieter hat in allen Pods erhöhte Anteile unterbrochener Anrufe in Talk gemeldet. Er hat eine Fehlerbehebung implementiert und überwacht die vollständige Wiederherstellung. Wir benachrichtigen die nächste Aktualisierung, wenn wir mehr zu teilen haben.
POST-MORTEM
Ursachenanalyse
Dieser Vorfall wurde durch Out-of-Memory-Problem in einem Upstream-Dienst verursacht, der einen kaskadierenden Fehler auslöste. Die anfänglich kurzen Timeouts eskalierten zu erheblichen Fehlern, die eine Untersuchung durch die Ingenieure unseres Talk-Partners erforderten.
Lösung
Um dieses Problem zu beheben, haben die Ingenieure unseres Talk-Partners Behebungsmaßnahmen ergriffen, darunter den Austausch der betroffenen Hosts und das Zurücksetzen von Betafunktionen, die auf dem problematischen Upstream-Dienst beruhten. Diese Maßnahmen tragen dazu bei, den normalen Service wiederherzustellen und die Auswirkungen für die Kunden zu minimieren.
Korrekturelemente
- Bessere Überwachungs- und Benachrichtigungssysteme, um Serviceprobleme bei Upstream-Konversationen noch wirksamer zu erkennen.
- Verbessern Sie die Belastbarkeit der Plattform, um auftretende Ausfälle in Zukunft zu verhindern.
- Untersuchen Sie die Abhängigkeiten von Upstream-Diensten gründlich, um potenzielle Risiken zu identifizieren.
WEITERE INFOS
Weitere Informationen zum aktuellen Systemstatus von Zendesk und zu spezifischen Auswirkungen auf Ihr Konto finden Sie auf der Systemstatusseite. Sie können diesem Beitrag folgen, damit Sie benachrichtigt werden, wenn unser Post-mortem-Bericht veröffentlicht wird. Wenn Sie weitere Fragen zu diesem Vorfall haben, wenden Sie sich an den Zendesk- Support.
Hinweis zur Übersetzung: Dieser Beitrag wurde mit automatischer Übersetzungssoftware übersetzt, um dem Leser ein grundlegendes Verständnis des Inhalts zu vermitteln. Trotz angemessener Bemühungen, eine akkurate Übersetzung bereitzustellen, kann Zendesk keine Garantie für die Genauigkeit übernehmen.
Sollten in Bezug auf die Genauigkeit der Informationen im übersetzten Beitrag Fragen auftreten, beziehen Sie sich bitte auf die englische Version des Beitrags, die als offizielle Version gilt.