概要
2023 年 11 月 9 日上午 3:00 UTC 到 2023 年 11 月 10 日上午 10:00 UTC 期间,Explore 美国地区客户(多个 Pod)的历史数据集出现数据刷新延迟。
时间线
19:18 UTC | 11:18 PT(11 月 9 日)
美国地区的 Explore 帐户当前会遇到历史数据集的数据刷新延迟问题。Explore 查询和报告功能可正常使用,实时数据集不受影响。根本原因仍在调查中,因此我们无法预计解决延迟的时间。
11:27 UTC | 03:27 PT(11 月 10 日)
我们已针对 Explore 美国地区历史数据集的数据刷新延迟进行了修复,客户应该不会再遇到任何延迟。我们将此事务视为已解决。感谢您的合作。
事后分析
根本原因分析
此事件是因为帐户统计数据服务未能提供关于多个帐户的正确数据量信息,导致报告的帐户大小小于其实际大小。这反过来又导致 Explore ETL 系统为这些帐户分配的计算资源少于处理定期增量更新所需的资源,从而导致处理速度减慢,并出现数据管道失败或超时的情况。
解决
为了解决此问题,帐户统计数据服务已暂时切换到具有正确帐户数据的回退数据源。这样 Explore ETL 系统中的资源分配就恢复正确了。Explore 工程师还手动增加了资源,以取消阻止数据处理延迟较长的帐户。
修复项目
- 针对帐户大小分类更改峰值创建更多警报。
- 调查替换管道资源分配。
- 将验证阶段添加到数据管道中,以检测缺失或异常的源数据。
如需更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问, 请通过小组件中的 ZBot Messaging 向我们提交工单。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。
0 条评论