まとめ
3月6日13時33分(UTC)から14:15(UTC)まで、カスタマーはExploreをロードできず、502の拒否ゲートウェイエラーを受けました。
提供終了までのスケジュール
15:02 UTC | 07:02(PT)
Exploreにアクセスしようとしたときにサーバーエラーが発生しなくなったとの確認を受け取り、バックエンドもエラーを表示しなくなるため、このインシデントは解決していると考えています。ご理解とご協力をよろしくお願いいたします。
14:24 UTC | 06:24 (PT)
ページの読み込み回数に改善が見られ、ページの更新後にExploreが正しくアクセス可能になり、読み込みができるようになったことが確認されています。Exploreを再度読み込んでいただくようお願いいたします。引き続き問題が発生する場合はお知らせください。ご理解とご協力をよろしくお願いいたします。
14:15 UTC | 06:15 (PT)
この時点で問題の影響を受けるのは、ポッド17、18、28、29のExploreユーザーだけです。アクセスの復元に引き続き取り組んでいます。30分以内に、または詳細な情報が入り次第、詳細な情報をお知らせします。
14:04 UTC | 06:04 (PT)
現在、複数のポッドでExploreが読み込めないという問題の報告を調査しています。調査中です。
事後のメモ
根本原因分析
2024年3月6日に、Exploreにアクセスしようとしたユーザーが、バックグラウンドでシステムを更新するためのプロセスを開始したため、エラーが発生しました。このプロセスにより、データベースに一時的な「ロック」の問題が発生し、ユーザーにエラーが発生しました。問題の発生は13:22(UTC)、14:07:00(UTC)までに解決されました。
エンジニアリングチームは、使用状況の統計情報をユーザーに提供するための新機能を開発していました。この機能を効率化するために、新しいプロセスを導入しました。この処理では、ダッシュボードにアクセスするたびにデータベース内のテーブルを更新し、繰り返しの計算を減らしました。このプロセスで既存のダッシュボードの履歴レコードの入力を開始したときに問題が発生しました。
このインシデントは、主に履歴レコードを入力するために開始されたプロセスによって発生しました。このプロセスにより、データベースに長時間「ロック」され、タイムアウトやエラーが発生していました。
解決策
停止したクエリがクリアされ、Railsアプリケーションを再起動すると、Exploreの通常の動作が再開されました。
改善策
- 確認プロセスを確認
- バックフィルプロセスのプレイブックを更新
- dashboard_viewsレコードを非同期で処理
詳細情報を表示
Zendeskの現在のシステムステータスについては、 システムステータスページを参照してください。事後調査のまとめは、通常、インシデントが終了してから数日後にこちらに投稿されます。この事象についてさらに ご質問がある場合は、ウィジェット内のZBotメッセージング経由でチケットを記録してください。
翻訳に関する免責事項:この記事は、お客様の利便性のために自動翻訳ソフ トウェアによって翻訳されたものです。Zendeskでは、翻訳の正確さを期すために相応の努力を払っておりますが、翻訳の正確性につ いては保証いたしません。
翻訳された記事の内容の正確性に関して疑問が生じた場合は、正式版である英語の記事 を参照してください。