概要
在 2023 年 12 月 18 日 22:25 UTC 到 23:18 UTC 之间,所有 Pod 上的 Zendesk Chat 和 Support(消息传送)客户都可能遇到多种问题,包括在线交谈和消息传送错误、断开连接、登录问题以及无法更改专员状态。
时间线
23:03 UTC | 15:03 PT
我们正在调查 Chat 连接问题的报告。我们将在 15 分钟后提供最新进展。
23:20 UTC | 15:20 PT
我们的团队会跨多个 Pod 继续调查问题,这些问题会影响 Chat、社交 Chat 和消息传送(Support 专员工作区)中的多个功能。在线交谈/消息延迟、登录问题、消息和在线交谈路由以及其他功能可能会受到影响。下次更新将在 30 分钟后。
23:42 UTC | 15:42 PT
我们的工程师已重新启动运行状况不佳的 Chat 服务器,现可看到恢复情况。我们将继续监测业绩,如有更多信息可及时分享最新进展。
00:49 UTC | 16:49 PT
Chat 和消息传送现已从今天的服务器问题中完全恢复。我们的团队将继续监测性能,并努力恢复任何未自动恢复的可恢复的在线交谈记录。当这项工作在接下来的几个小时内完成时,我们将发送一条最终消息。
01:24 UTC | 17:24 PT
我们的团队已恢复在昨天的服务中断期间未恢复的所有可恢复的历史在线交谈。非常感谢您的耐心等待!对于由此问题造成的不便,我们深表歉意。
事后分析
根本原因分析
此事件是由我们托管提供商基础设施中的一个实时在线交谈主机故障引起的。这导致由此特定后端主机为客户提供在线交谈/消息传送服务中断。
解决方案
为了解决此问题,我们的团队已重新启动受影响的主机。服务恢复后,中断期间未送达消息的恢复已完成。
修复项目
- 更新 Runbook,提前启动电源关闭和恢复程序,以缩短实例发生故障时的恢复时间[计划内]
- 更新 on-call 工程师的工具访问权限 [计划内]
- 引入更多警报以检测实例故障[进行中]。
- 升级 Pod 帐户迁移的优先级以缩小影响半径[进行中]。
如需更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问, 请通过小组件中的 ZBot Messaging 向我们提交工单。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。
0 条评论