概要
2025 年 8 月 18 日 19:20 UTC 至 21:03 UTC 之间,我们收到 31 起客户报告,在Zendesk 质量保证服务中尝试访问 kibbles.klaus.com URL 时遇到 500 错误。
时间线
UTC 时间 | 2025 年 8 月 18 日13:44(太平洋时间)
我们陆续收到多个 pod 中关于质量保证产品出现访问问题和 5xx 级别错误的报告。更多信息将很快发布。
| 2025 年 8 月 18 日 22:04 UTC 14:04 PT
我们已确认一个问题,该问题导致 5xx 级别错误,并阻止访问Zendesk 质量保证产品。我们的团队正在调查。我们将在接下来的 30 分钟内提供最新进展。
| 2025 年 8 月 18 日 22:25 UTC 14:25(太平洋时间)
我们开始看到在进入Zendesk 质量保证产品时阻止访问并导致 5xx 级别错误的问题有所改善。如果您继续遇到任何问题,请与我们联系。
| 2025 年 8 月 18 日 23:26 UTC 15:26(太平洋时间)
我们发现Zendesk 质量保证中阻止访问并导致 5xx 级别错误的问题已得到显着改善,并将监测该问题以确保其可恢复。待问题完全解决后,我们将提供最新进展。
| 2025 年 8 月 19 日 14:43 UTC 2025 年 8 月 19 日上午 07:43(太平洋时间)
我们很高兴地通知您,导致访问 kibbles.klaus.com URL 时出现 500 错误的问题已解决。我们的工程师已解决此问题,客户应该不会再遇到这些错误了。
感谢您提供反馈意见,请我们帮助我们确认此服务现在在您这里是否工作正常。您的及时回复有助于我们根据需要提供进一步帮助。
根本原因分析
此事件是由于与重要安全管理服务的网关连接超时引起的,该连接影响了系统性能。
解决
为了解决这个问题,工程师们最初重启了网关协议,虽然得到了暂时的改善,但并没有完全解决问题。随后,该团队重新启动了 k8s pod,使Zendesk 质量保证服务从 5XX 错误中完全恢复。
修复项目
- 实施定期运行状况检查和自动重启,以便在检测到问题时保持系统平稳运行。
- 增加系统实例的数量以处理更高的流量,并减少一个部件出现故障的影响。
- 改进连接方法,使用多个链接而不是单一链接,确保更高的稳定性。
- 定期更新软件组件以使用最新版本,从而提高整体性能和可靠性。
如需更多信息
有关 Zendesk 当前系统状态信息以及对您帐户的具体影响,请访问我们的系统状态页面。请关注此文章,以便在我们的事后分析报告发布时获得通知。如果您对此事务有其他疑问,请联系 Zendesk 客户支持。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。