概要
2024 年 12 月 3 日 21:09 UTC 至 3:36 UTC 期间,部分使用移动 SDK 的客户在创建工单时遇到了 400 错误。由于一项更改,为新创建的OAuth密钥分配的默认过期时间为 8 小时。这一更改无意中破坏了旧版移动 SDK,因为如果现有密钥失效,后者将无法检索新密钥,从而影响用户体验。已通过恢复更改解决此问题。
时间线
UTC 时间 | 2024 年 12 月 6 日下午 6:20 2024 年 12 月 6 日上午 10:20(太平洋时间)
我们很高兴地报告,导致某些客户在通过 SDK 创建工单时遇到 400 错误的问题已得到解决。对于由此造成的任何服务中断,我们深表歉意。感谢您耐心等待我们的调查。
UTC 时间 | 2024 年 12 月 6 日下午 12:06 2024 年 12 月 6 日上午 04:06(太平洋时间)
对于使用我们的移动 SDK 通过 API 提交的工单,我们团队会继续进行处理,避免出现 400 错误。就目前而言,如果终端用户遇到此错误,可重新启动应用,工单将照常创建。
UTC 时间 | 2024 年 12 月 6 日上午 09:45 2024 年 12 月 6 日上午 01:45(太平洋时间)
我们注意到一些客户在尝试通过我们的移动 SDK 创建工单时可能会遇到 400 错误。如果遇到此错误,请重新启动应用以解决问题。
事后分析
根本原因分析
此事件起因于,在推出过期时间更改之前,我们未能评估身份验证密钥在不同产品中的使用情况。当现有密钥过期时,旧版 SDK 在设计上就无法获取新的OAuth密钥,但在规划和整合阶段并未充分考虑到这一点。加强协作并对密钥使用情况进行更全面的评估本来有助于避免这种中断。
解决
要解决此问题,身份验证团队首先禁用了会增加现有密钥过期时间的回填流程。随后,他们部署了一个拉取请求,以恢复新密钥的过期设置,并启动回填以消除现有密钥的过期情况。此操作已恢复大多数受影响客户的功能。
修复项目
- 在团队之间建立清晰的沟通协议,以确保在实施重大更改之前,正确记录和审查已知缺陷。
- 改进现有实施工具,以更好地管理身份验证工作流程,减少与旧版 SDK 相关的技术债务。
- 创建更多警报和监测系统,以便将来检测类似问题,特别是OAuth密钥失败。
- 对特定应用程序引入连接限制,以防止生成过多的密钥,并缓解数据库大小激增。
如需更多信息
有关您 Zendesk 当前的系统状态信息,查看我们的 系统状态页面。我们的事后调查概要通常会在事件结束几天后发布在这里。如果您对此事务有其他疑问, 联系 Zendesk 客户支持。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。
0 条评论