概要
2024年12月11日23:39(UTC)から12日6:30(UTC)にかけて、高度なAI、Talk、AIエージェント、その他の生成AI機能などのZendesk AI機能をご利用のお客様に、サービスプロバイダーのサービス停止による機能停止が発生しました。
タイムライン
2024年12月12日04:05 AM UTC | 2024年12月11日08:05 PM PT
すべてのAI機能のリカバリを監視しており、完全なリカバリのために引き続きシステムを監視しています。システムが完全に安定したら、最終的なアップデートを提供できることを楽しみにしています。
2024年12月12日午前1時53分(UTC) | 2024年12月11日午後5時53分(PT)
当社のチームは、Zendesk AI機能に影響を与える問題について、サービス プロバイダーと協力してきました。影響は、高度なAI、Talk、AIエージェント、その他の生成AI機能を通じて確認できる場合があります。最初の試行で問題が解決できなかったため、チームはこの問題の解決を最優先事項として取り組み続けています。アップデートが利用可能になり次第、お知らせいたします。
POST-MORTEM
根本原因の分析
事象の根本原因は、大規模なクラスタ間でサービスプロバイダーのAPIに予期しない大量の負荷を発生させたテレメトリサービスの新しい設定にあります。この過負荷により、DNSベースのサービス検出が過負荷になり、当社のプロバイダーのサービスへのリクエストが失敗しました。
解決策
サービスプロバイダが問題を特定し、APIの負荷を軽減する是正措置を実施すれば、事象は解決しました。Zendeskは、インシデント発生後も当社のサービスプロバイダと連絡を取り合い、連携のとれた対応を確保しています。
是正項目
- LLMサービスチームとのサポートレベルアグリーメント:社内のカスタマーと協力して、パフォーマンスと可用性の期待を理解し、フォールバック戦略の提案や監視のしきい値の調整に役立ちます。
- 生成AI機能のフォールバック戦略:GenAI機能のフォールバック戦略を策定します。これには、プロキシシステムに機能を追加し、機能オーナーと協力して、それぞれのケースに最適な戦略を決定することが含まれます。
- サービスプロバイダのプレミアムサポート:インシデント発生時の迅速な解決とサポートを確保するために、サービスプロバイダーからの追加サポートを交渉します。
予防措置
今後、同様の事象が発生しないように、以下の対策を実施します。
- APIの異常な負荷をより適切に検出するために、監視およびアラートシステムを強化します。
- インシデント発生時に迅速に対応できるように、Zendeskのサービスプロバイダーとより明確なコミュニケーションチャネルとサポート契約を確立します。
- 重要なAI機能のフォールバック戦略を実装し、プロバイダーが停止している間もサービスの可用性を維持します。
詳細
Zendeskに関する現在のシステムステータス情報とアカウントへの具体的な影響については、システムステータスページをご覧ください。この記事をフォローして、事後レポートが公開されたときに通知を受け取ることができます。この事象についてさらにご質問がある場合は、Zendeskカスタマーサポート
翻訳に関する免責事項:この記事は、お客様の利便性のために自動翻訳ソフ トウェアによって翻訳されたものです。Zendeskでは、翻訳の正確さを期すために相応の努力を払っておりますが、翻訳の正確性につ いては保証いたしません。
翻訳された記事の内容の正確性に関して疑問が生じた場合は、正式版である英語の記事 を参照してください。
0件のコメント