概要
2024 年 8 月 1 日 12:10 UTC 至 12:33 UTC 之间,Pod 23 上的少数 Chat 客户遇到了在线交谈断连的问题,并且无法发起新的在线交谈。
时间线
UTC 时间 | 2024 年 8 月 1 日下午 12:40 2024 年 8 月 1 日上午 05:40(太平洋时间)
我们已知晓并正在调查 Pod 23 上的 Chat 问题和错误。即将提供更多信息。
UTC 时间 | 2024 年 8 月 1 日下午 12:58 2024 年 8 月 1 日上午 05:58(太平洋时间)
我们已重新启动服务器,特别是受到 Pod 23 中 Chat 服务的影响,我们已看到后端有所改进。然而,您可能会注意到,在此期间,对于正在进行的在线交谈,保存在线交谈数据会出现延迟。此外,专员工作区和服务器状态切换器显示的状态暂时不一致。因此,专员可能在专员工作区中显示为“在线”,但在服务器上显示为“离线”,这可能会影响在线交谈工单转接。
UTC 时间 | 2024 年 8 月 1 日下午 1:49 2024 年 8 月 1 日上午 06:49(太平洋时间)
再说一次,应该不会有数据丢失,但在此问题期间,受影响帐户的正在进行的在线交谈可能已过早中断。这些在线交谈将被恢复并保存,但会有一定的延迟。我们还咨询了基础设施合作伙伴,后者确认其终端存在根本问题。感谢您的耐心等待,我们正在努力彻底解决此问题。
事后分析
根本原因分析
此事件是由影响特定计算容量实例的意外 AWS 基础设施故障引起的。
解决方案
为解决此问题,我们重新启动了受影响的计算容量实例,随后该实例将服务迁移到了另一台稳定的 AWS 主机,有效解决了该问题。
修复项目
- 确保 LiveChat 服务器在 AWS 关闭后自动重启,使用该服务运行代码,而无需配置或管理服务器。
- 更新警报系统以获得更准确的通知。
- 缩短“在线交谈回填”机制的用时。
- 与负责的团队合作对修复进行恢复力测试。
如需更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问,请 联系 Zendesk 客户支持。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。
0 条评论