概要
2024 年 11 月 21 日 21:02 UTC 至 21:56 UTC 之间,一些使用托管在 Pod 17 上的Sunshine Conversations的客户遇到了速度缓慢和性能问题。
时间线
UTC 时间 | 2024 年 11 月 24 日晚上 10:23 2024 年 11 月 24 日下午 2:23(太平洋时间)
我们很高兴宣布,影响一些客户在 PID 17 上Sunshine Conversations的延迟问题现已解决。非常感谢您的耐心等待!
UTC 时间 | 2024 年 11 月 24 日晚上 10:09 2024 年 11 月 24 日下午 02:09(太平洋时间)
我们相信我们已经确定了 Pod17 上客户 SunCo 性能问题的根本原因。我们现已看到改进,将继续监测此行为。
UTC 时间 | 2024 年 11 月 24 日下午 09:53 2024 年 11 月 24 日下午 01:53(太平洋时间)
我们将继续调查 Pod 17 中的性能问题。这可能导致Sunshine Conversations运行缓慢。我们将尽快提供进一步的更新。
UTC 时间 | 2024 年 11 月 24 日下午 09:36 2024 年 11 月 24 日下午 1:36(太平洋时间)
我们正在调查 Pod 17 上托管的一些客户的潜在性能问题。我们将很快发布包含更多详情的更新。
事后分析
根本原因分析
此事件是由 Pod17 上的流量意外激增引起的,该流量在过去一周增加了一倍多,在事件发生当天几乎增加了三倍。客户使用的 Unity SDK 过度请求 SunCo API 来检索未读消息计数,导致系统负载增加。资源自动缩放程序已达到最大容量,导致无法添加更多资源以处理增加的流量。因此,过载导致响应时间减慢,并最终触发运行状况检查并重新启动,从而使问题更加复杂。
解决方案
为了解决性能问题,我们增加了 Pod17 上 SunCo API 的最大副本数量。此调整使系统能够更好地处理增加的流量,并使所有客户恢复正常的响应时间。
修复项目
- 研究 Unity SDK,了解其向 SunCo 发送过多请求的原因,并实施优化。
- 记录 embeddables 中的后端交互模式,以澄清用法并识别潜在的低效情况。
- 评估 SunCo 中 SDK API 缓存策略的实施,以减少请求数。
- 添加监测功能,以检测特定时段内的异常流量增长,主动解决潜在的过载问题。
如需更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问,请 联系 Zendesk 客户支持。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。
0 条评论