概要
2023 年 11 月 9 日 14:00 UTC 至 16:34 UTC 之间,Pod 28 中部分 Support 客户在发送工单和系统生成的电邮通知时遇到了大约 2 小时的延迟。
时间线
15:24 UTC | 07:24 PT
目前,我们在 Pod 28 上注意到客户存在发送电邮延迟或失败的问题。等我们修复后,将重试所有电邮。调查正在进行中,如有更多信息,我们会尽快通知您。
15:41 UTC | 07:41 太平洋时间
我们已找到问题的根本原因,正在设法解决。我们将在 30 分钟后或掌握更多信息后尽快提供最新动态。
16:08 UTC | 08:08 太平洋时间
我们的团队将继续致力于为 Pod 28 客户解决电邮问题。我们将继续及时提供最新进展。
16:28 UTC | 08:28 太平洋时间
在 Pod 28 上,我们开始看到导致客户发送电邮延迟或失败的问题有所改善。我们的团队将继续监测事态发展,确保完全恢复。
17:56 UTC | 09:56 太平洋时间
造成 Pod 28 的出站电邮发送延迟和失败的问题仍在恢复中;但我们正在处理工单积压,预计仍会有一些延迟。我们的团队仍在监测事态发展,以确保服务完全恢复。
18:26 UTC | 10:26 PT
我们已从导致 Pod 28 客户的出站电邮发送延迟和失败的问题中完全恢复。感谢您耐心等待我们的调查。
事后分析
根本原因分析
此事件是由于某个特定帐户的电邮处理作业突然增加导致电邮发送延迟造成的,而系统当时没有足够的内存和 CPU 资源来处理该负载。
解决方案
为解决此问题,我们尝试增加系统内存和 CPU 资源,并减少可同时处理的电邮数量。这样系统可以处理增加的负载并处理排队的电邮。
修复项目
- 调整系统资源,确保其能够处理负载。
- 创建更多可分页警报进行监测。
如需更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问, 请通过小组件中的 ZBot Messaging 向我们提交工单。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。