ZUSAMMENFASSUNG
Am 21. November 2024 von 21:02 UTC bis 21:56 UTC traten bei einigen Kunden, die auf Pod 17 gehostete Sunshine Conversations verwendeten, Verlangsamung und Leistungsprobleme auf.
CHRONIK
24. November 2024, 22:23 Uhr UTC | 24. November 2024 14:23 Uhr PT
Wir freuen uns, Ihnen mitteilen zu können, dass die Latenzprobleme, die Sunshine Conversations bei einigen unserer Kunden auf POD 17 betreffen, jetzt behoben sind. Vielen Dank für Ihre Geduld.
24. November 2024 22:09 Uhr UTC | 24. November 2024 14:09 Uhr PT
Wir glauben, die Ursache für die Leistungsprobleme, die SunCo für unseren Kunden auf Pod17 betreffen, identifiziert zu haben. Wir sehen jetzt Verbesserungen und werden das Verhalten weiterhin überwachen.
24. November 2024, 21:53 Uhr UTC | 24. November 2024, 13:53 Uhr PT
Wir untersuchen weiterhin Leistungsprobleme aus Pod 17. Diese können Sunshine Conversations. Wir werden in Kürze weitere Updates bereitstellen.
24. November 2024, 21:36 Uhr UTC | 24. November 2024, 13:36 Uhr PT
Wir untersuchen potenzielle Leistungsprobleme, die einige unserer auf Pod 17 gehosteten Kunden betreffen. Wir werden in Kürze ein Update mit weiteren Details veröffentlichen.
POST-MORTEM
Ursachenanalyse
Dieser Vorfall wurde durch einen unerwarteten Anstieg des Verkehrsaufkommens auf Pod17 verursacht, der sich in der Woche zuvor mehr als verdoppelt und am Tag des Vorfalls fast verdreifacht hatte. Das von einem Kunden verwendete Unity-SDK sendete übermäßig viele Anforderungen an die SunCo-API, um die Anzahl ungelesener Nachrichten abzurufen, was zu einer erhöhten Systemlast führte. Die automatische Skalierung von Ressourcen hatte bereits ihre maximale Kapazität erreicht, sodass keine weiteren Ressourcen zur Bewältigung des zusätzlichen Datenverkehrs hinzugefügt werden mussten. In der Folge führte diese Überlastung zu langsameren Antwortzeiten und letztendlich zu Integritätsprüfungen, die einen Neustart einleiteten, was das Problem noch verschlimmerte.
Lösung
Um die Leistungsprobleme zu beheben, haben wir die maximale Anzahl von Replikationen für die SunCo-API auf Pod17 erhöht. Dank dieser Anpassung konnte das System das erhöhte Verkehrsaufkommen besser bewältigen, und für alle Kunden wurden die normalen Antwortzeiten wiederhergestellt.
Korrekturelemente
- Untersuchen Sie das Unity-SDK, um zu verstehen, warum es zu viele Anfragen an SunCo sendet, und optimieren Sie es.
- Dokumentieren Sie Backend-Interaktionsmuster in Embeddables, um die Nutzung zu verdeutlichen und potenzielle Ineffizienzen zu identifizieren.
- Prüfen Sie die Implementierung einer Caching-Strategie für SDK-APIs in SunCo, um die Anzahl der gesendeten Anfragen zu reduzieren.
- Fügen Sie Überwachungsfunktionen hinzu, um ein ungewöhnliches Wachstum des Datenverkehrs in bestimmten Zeiträumen zu erkennen, damit Sie proaktiv auf mögliche Überlastungen reagieren können.
WEITERE INFOS
Aktuelle Systemstatusinformationen zu Ihrem Zendesk finden Sie auf der Systemstatusseite. Die Zusammenfassung unserer Post-mortem-Untersuchung wird in der Regel hier einige Tage nach Abschluss des Vorfalls gepostet. Wenn Sie weitere Fragen zu diesem Vorfall haben, wenden Sie sich an den Zendesk-Kundensupport.
Hinweis zur Übersetzung: Dieser Beitrag wurde mit automatischer Übersetzungssoftware übersetzt, um dem Leser ein grundlegendes Verständnis des Inhalts zu vermitteln. Trotz angemessener Bemühungen, eine akkurate Übersetzung bereitzustellen, kann Zendesk keine Garantie für die Genauigkeit übernehmen.
Sollten in Bezug auf die Genauigkeit der Informationen im übersetzten Beitrag Fragen auftreten, beziehen Sie sich bitte auf die englische Version des Beitrags, die als offizielle Version gilt.
0 Kommentare