概要
2024 年 10 月 14 日 13:49 UTC 至 15:40 UTC 期间,美洲地区使用 Explore 的客户在尝试导出或计划面板和报告时遇到了“下载失败”错误。
时间线
UTC 时间 | 2024 年 10 月 14 日下午 4:17 2024 年 10 月 14 日上午 09:17(太平洋时间)
我们很高兴地报告,我们已经解决了影响 Explore 美洲客户的问题,该问题会在尝试导出或计划面板和报告时导致“下载失败”错误。感谢您耐心等待我们的调查。
UTC 时间 | 2024 年 10 月 14 日下午 04:01 2024 年 10 月 14 日上午 09:01(太平洋时间)
我们已找到导致美国 Explore 客户在尝试下载或计划面板或报告时出现“下载失败”错误的问题根本原因;但是,由于有积压的请求需要处理,可能会出现延迟。我们将进行监测,以确保完全解决。如果您继续遇到任何问题,请与我们联系。
UTC 时间 | 2024 年 10 月 14 日下午 03:40 2024 年 10 月 14 日上午 08:40(太平洋时间)
我们已确认一个影响美国 Explore 客户的问题,该问题会导致在尝试下载或计划面板或报告时出现“下载失败”错误。我们的团队正在调查,并会在 30 分钟内发布最新进展。
UTC 时间 | 2024 年 10 月 14 日下午 03:26 2024 年 10 月 14 日上午 08:26(太平洋时间)
我们收到了 US Explore 客户在尝试下载或计划面板或报告时出现“下载失败”错误的报告。我们将很快发布更多信息。
事后分析
根本原因分析
引发此事件的原因是无意中删除了 Explore 服务进行身份验证所需的密钥。此次删除是在 Explore 资源的清理过程中进行的,当时有人错误地认为不再需要该密钥,因为它在新版本的服务中可用。
解决方案
为了解决此问题,缺失的密钥已重新创建,以便服务再次成功启动。这涉及到通过代码库进行手动干预以重新应用密钥定义,确保所有必要组件按预期运行。
修复项目
- 将相关存储库所需的审阅者数量增加到两个,以加强对更改的监督。
- 记录验证以前版本密钥是否仍在用于其他服务的过程。
- 制定记录流程,使用过渡环境和端到端测试来验证风险基础设施更改。
- 建立将风险基础设施更改推行到生产环境的指南,包括适当的启动时间。
- 调查并解决与 Explore 服务相关的内存问题,以避免今后发生类似事件。
如需更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问,请 联系 Zendesk 客户支持。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。
0 条评论