概要
在 2024 年 8 月 7 日 20:48 UTC 至 23:27 UTC 之间,所有 Pod 的 Support 客户都遇到了工单视图问题,包括已解决工单不消失、更新缓慢以及数字显示不正确。
时间线
UTC 时间 | 2024 年 8 月 7 日晚上 10:00 2024 年 8 月 7 日下午 03:00(太平洋时间)
我们正在调查关于 Support 工单视图未更新或显示不正确工单的报告。下次更新将于 30 分钟后,或当我们有新信息可分享时。
UTC 时间 | 2024 年 8 月 7 日晚上 10:08 2024 年 8 月 7 日下午 03:08(太平洋时间)
我们的工程师已进行了更改,现在我们看到所有 Pod 的性能都有所改进。下次更新将于 30 分钟后,或当我们有新信息可分享时。
UTC 时间 | 2024 年 8 月 7 日晚上 10:24 2024 年 8 月 7 日下午 03:24(太平洋时间)
所有 Pod 的性能继续保持稳定,我们将在接下来的一小时内继续监测性能。下次更新将于一小时后。
UTC 时间 | 2024 年 8 月 7 日晚上 11:29 2024 年 8 月 7 日下午 04:29(太平洋时间)
经过持续监测,结果呈稳定状态,并确认影响 Support 工单视图无法更新的问题已解决。感谢您的耐心等待。
事后分析
根本原因分析
此事件是由蓝/绿集群切换期间的流程崩溃引起的,具体来说是由于部署不完整,导致剩余生产 Pod 出现配置错误。
解决方案
为了解决此问题,工程团队手动扩容了活跃集群上的索引器,以处理累积的工单更新。然后他们使用正确的配置继续进行集群切换。
修复项目
- 需要审查用于集群切换的流程,以确保其中包含全面的部署后检查,以防忽视未完成的部署。
- 开发自行程序来处理集群切换流程,减少手动干预,并将发生人为错误的可能性降到最低。
如需更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问,请 联系 Zendesk 客户支持。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。