概要
2025 年 1 月 13 日 11:07 UTC 至 12:07 UTC 之间,Pod 17 的客户遇到了消息传送触发器无法执行的问题。

时间线

UTC 时间 | 2025 年 1 月 13 日下午 12:24 2025 年 1 月 13 日上午 04:24(太平洋时间)
最近的消息传送问题已完全解决,我们的服务已完全恢复正常运行!感谢您的耐心等待!我们的团队将继续密切监测我们的系统,以确保一切顺利运行。感谢您的支持!如有任何问题或反馈,我们将竭诚为您服务!

UTC 时间 | 2025 年 1 月 13 日上午 11:51 2025 年 1 月 13 日上午 03:51(太平洋时间)
我们正在调查在 PID17 上为客户执行消息传送触发器的问题。


事后分析

根本原因分析

造成此事件的原因是消息传送工单日志活动日志服务使用者过早终止,而该服务仍在运行。因此,使用者无法处理新到的事件,从而导致 Pod 17 上消息传送触发器的评估和执行完全停止。

解决方案

为此,我们已修复将单个批次中可处理的最大记录数设置为 500 条(而不是预期的 250 条)的配置错误。我们旨在通过纠正此拼写错误并减小最大记录值来降低消费者由于超时问题而终止的可能性。

修复项目

  1. 实施运行状况检查以检测使用者是否过早终止。
  2. 创建一个监测功能以跟踪正在运行的使用者的数量。
  3. 建立一个监测功能,以监测工单日志事件使用者的停止分区。
  4. 将使用方延迟状态小组件添加到消息传送触发器服务面板。
  5. 创建一个新指标以衡量处理来自消息传送工单日志活动主题批量消息所需的时间。

这些修复措施旨在加强监测,防止今后类似事件发生,确保消息传送触发器服务的稳定性和可靠性。


如需更多信息

有关 Zendesk 当前系统状态信息以及对您帐户的具体影响,请访问我们的 系统状态页面。请关注此文章,以便在我们的事后分析报告发布时获得通知。如果您对此事件有其他疑问, 请联系 Zendesk 客户支持。

翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性

如对翻译准确性有任何疑问,请以文章的英语版本为准。

由 Zendesk 提供技术支持