概要
2024 年 7 月 23 日 10:58 至 14:57 UTC,Pod 29 客户无法通过产品栏访问 Zendesk 产品(包括管理中心)。大约 1% 的客户请求在访问 Guide、Talk、Chat、Explore 和 Support 中已通过身份验证的功能时返回 503 错误,无法打开 Zendesk 产品栏在产品之间切换。产品栏和网络浏览器主页面中显示多个错误。
时间线
UTC 时间 | 2024 年 7 月 23 日上午 11:48 2024 年 7 月 23 日上午 04:48(太平洋时间)
我们已注意到 Pod 29 客户无法加载管理中心并收到“此页面无法正常工作”错误的问题,并正在着手缓解相关问题。产品栏中似乎也无法提供其他产品,提示“无法加载 Zendesk 产品。再试一次”错误。下次更新是在 30 分钟后,或者当我们有更多要分享时。
UTC 时间 | 2024 年 7 月 23 日下午 12:19 2024 年 7 月 23 日 上午 05:19(太平洋时间)
我们将继续努力为客户解决 Pod 29 上多个产品的访问问题。非常感谢您的耐心等待。
UTC 时间 | 2024 年 7 月 23 日下午 1:22 2024 年 7 月 23 日上午 06:22(太平洋时间)
我们正在继续寻找可能的解决方案,以解决影响 Pod 29 客户多个产品的访问问题。感谢您的耐心等待!
UTC 时间 | 2024 年 7 月 23 日下午 1:46 2024 年 7 月 23 日上午 06:46(太平洋时间)
我们已实施了一个潜在的修复程序,并注意到在 Pod 29 上加载测试帐户时错误减少了,同时也有了一些改进。请您清除缓存和 Cookie,然后再次尝试加载 Zendesk。
UTC 时间 | 2024 年 7 月 23 日下午 02:06 2024 年 7 月 23 日上午 07:06(太平洋时间)
尽管我们一直收到一些表明工作正常的肯定确认消息,但我们仍会继续监测错误是否出现新的峰值。感谢您的耐心等待,我们正在等待将此问题标为完全解决。
UTC 时间 | 2024 年 7 月 23 日下午 03:19 2024 年 7 月 23 日上午 08:19(太平洋时间)
我们已确定问题的根本原因,并已回滚更改,以避免进一步问题。经过进一步监测,我们已确认没有进一步错误,并将将此事务标为“完全解决”。
事后分析
根本原因分析
此事件是由推出新的“管理团队成员”权限引起的。此版本允许自定义用户角色的专员被授予查看和管理其他团队成员及其用户角色分配的权限(公告)。此次推出导致对基础内部权限服务的请求大幅增加,导致其数据库集群容量饱和。由于此流量,集群已达到其最大网络带宽容量,从而导致集群与我们服务的应用服务器之间出现网络故障。
解决方案
为解决此问题,我们团队最初增加了权限服务的数据库实例的容量,以提供短期恢复。确定根本原因后,我们的工程师即回滚了权限功能代码更改。
修复项目
- 通过权限检查减少网络流量 [进行中]
- 用于检测流量增加的更多监测功能和警报[计划内]
- 研究适当权限服务数据库容量[计划]
更多信息
如需了解您 Zendesk 当前的系统状态信息,请查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事件有其他疑问,请 联系 Zendesk 客户支持。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。