まとめ
2024年7月2日、18:20~18:44(UTC)、予期しないトラフィックの増加により、Sunshine Conversationsサービスで大きな遅延が発生しました。このため、当社のシステムの速度が低下し、メッセージ処理に遅延が発生しています。
提供終了までのスケジュール
2024年7月2日 午後10時12分(UTC) | 2024年7月2日午後03時12分(PT)
ポッド13のAnswer Botのパフォーマンスに影響を与えていた問題は完全に解決されました。問題が引き続き発生する場合はお知らせください。
2024年7月2日 午後09時07分(UTC) | 2024年7月2日午後02時07分(PT)
ポッド13でAnswer Botのパフォーマンスに改善が見られ、今後もパフォーマンスを監視していきます。インシデントが解決したら、最終的な更新を提供します。
2024年7月2日 午後08時13分(UTC) | 2024年7月2日午後01時13分(PT)
Zendeskのエンジニアは、ポッド13でAnswer Botのパフォーマンス低下を引き起こす問題を調査しています。新しい情報を提供する場合は、更新情報を提供します。
2024年7月2日 午後07:47 UTC | 2024年7月2日午後12時47分(PT)
Zendeskでは、ポッド13でAnswer Botのパフォーマンス低下に関するレポートを調査しています。情報が増えたときに、またアップデートを提供します。
事後のメモ
このインシデントは、トラフィック量の大幅な増加によってトリガされました。これにより、Zendeskのシステム速度が低下し、遅延や一時的なサービスの中断が発生しました。当社は、増加した負荷に対処し、通常の業務を復旧させるために、ただちに対応いたしました。
根本原因分析
主な原因はトラフィック量の急増であり、通常の2倍のトラフィック量でデータベースの容量を不足させ、遅延につながりました。さらに、Answer Botサービスが増加した負荷に処理できず、さらなるサービス中断を発生させました。
解決策
この問題への対応として、データベースとAnswer Botサービスの規模を拡大し、急増するチケットに対応するキャパシティを増やしました。これにより、通常のオペレーションを復旧し、未解決のメッセージを処理できるようになりました。
改善策
1.自動スケーリングを有効にする:重要なサービスに自動スケーリングを実装し、トラフィック量の急増に対処します。
2.回路解析ツールの紹介:必要に応じてトラフィックを一時的に減らして、サービスの過負荷を防ぎます。
3.監視機能の改善:監視システムを強化し、同様の問題をより迅速に検出して対応できるようにします。
詳細情報を表示
Zendeskの現在のシステムステータスについては、 システムステータスページを参照してください。事後調査のまとめは、通常、インシデントが終了してから数日後にこちらに投稿されます。この事象についてさらにご質問がある場合は、Zendeskカスタマーサポートにお問い合わせください。
翻訳に関する免責事項:この記事は、お客様の利便性のために自動翻訳ソフ トウェアによって翻訳されたものです。Zendeskでは、翻訳の正確さを期すために相応の努力を払っておりますが、翻訳の正確性につ いては保証いたしません。
翻訳された記事の内容の正確性に関して疑問が生じた場合は、正式版である英語の記事 を参照してください。