概要
2024 年 5 月 2 日 13:35 至 14:25 UTC,部分客户在使用 Zendesk 服务时遇到问题。包括尝试在多个 Pod 中访问产品时性能降低、服务器偶尔出错。在此期间,Pod 23 的客户受到的影响尤其严重,用户在使用 Support 专员界面、Sunshine Conversations 消息传送、Chat、Talk、Explore、Sell 和 Guide 时可能会遇到延迟或故障。此外,所有 Pod 中的消息传送服务都受到了更广泛的影响。
时间线
UTC 时间 | 2024 年 5 月 2 日下午 02:20 2024 年 5 月 2 日上午 07:20(太平洋时间)
我们目前正在调查多个 Pod 中与 Sunshine Conversations、AW Messaging 和客户其他产品相关的多个问题。即将发布更多更新。
UTC 时间 | 2024 年 5 月 2 日下午 02:35 2024 年 5 月 2 日上午 07:35(太平洋时间)
我们正在积极努力解决由于这个持续的服务事件影响到所有 Pod 中的客户的普遍缓慢和内部服务器错误,这些错误影响到了多个产品。感谢您的耐心等待!30 分钟后更新
UTC 时间 | 2024 年 5 月 2 日下午 02:50 2024 年 5 月 2 日上午 07:50(太平洋时间)
我们已修复此问题,并注意到日志有所改善。现在应已恢复对所有产品的访问。请确保刷新浏览器,并在必要时清除缓存和 Cookie。感谢您的耐心等待!
UTC 时间 | 2024 年 5 月 2 日下午 03:30 2024 年 5 月 2 日上午 08:30(太平洋时间)
我们一直在监测此事务,实施修复后已不再发现相关问题。我们现将其标为完全解决。
事后分析
根本原因分析
此问题是由我们的服务更新流程中的故障引起的,该故障导致我们基础设施的某些部分尚未准备好处理流量,从而导致工作量减少。
解决方案
为解决此问题,我们的工程师重新路由了内部流量,以绕过受影响的基础设施,最终在 14:25 UTC 之前恢复全部服务。
修复项目
- 改进我们的基础架构更新流程,确保任何问题都能在客户影响之前得到检测和解决。
- 提高我们的系统在例行更新期间处理流量的能力。
- 添加新检查以更有效地监测服务的健康状况。
- 致力于更好地协调我们服务基础设施的不同组件。
- 查看对所有服务的影响,了解受影响的原因并避免今后出现类似问题。
如需更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问,请 联系 Zendesk 客户支持。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。