概要
从 2023 年 11 月 2 日 11:54 UTC 到 2023 年 11 月 6 日 19:00 UTC 期间,所有 Pod 中使用主机映射子域名的 Guide 客户可能会遇到无法加载帮助中心的问题。
根本原因分析
此次事件的根本原因是我们的主要 CDN 供应商发生故障,影响到了负责更新域名路由配置的内部服务。此事件持续了两天,即 2023 年 11 月 2 日至 3 日。
第二个影响因素是我们的域名路由配置服务在将自定义主机名标记为已正确配置之前没有检查其状态。由于我们的主要 CDN 供应商的中断,自定义主机名未及时验证,从而导致出错。
在此事件发生之初,CDN 的供应商 API 开始出现故障,导致我们的域名路由配置无法更新 TLS 证书。
现有的主机映射子域名不受影响,除非其 TLS 证书已过期,而新的子域名仍然可用,因为它们不是通过受影响的 CDN 路由的。11 月 3 日,CDN 供应商修复了 API 问题,但验证自定义主机名时出现错误(域名的唯一部分)。这导致新域名由于其自定义主机名未及时验证而面临错误。
解决方案
要解决此问题,需要完成以下步骤:
1.为避免进一步问题,域名路由配置已暂时禁用。
2.可能受此问题影响的域名已提前添加到 CDN 绕过列表,以避免受到影响。
3.已在 Zendesk 代理上部署修复程序,以验证自定义主机名。
4.域名路由配置已重新启用,并开始处理 的积压请求。
此错误已于 2023 年 11 月 6 日完全解决,我们的域名路由配置也恢复正常运行。
修复
- 在域名路由配置服务中实施额外检查,以确保主机映射的子域名配置正确。
- 审阅并更新内部文档,添加处理类似错误的详细步骤。
- 在发生此类事务时,改善与客户的沟通,让他们了解情况和预计解决时间。
翻译免责声明:本文章使用自动翻译软件翻译,以便您了解基本内容。 我们已采取合理措施提供准确翻译,但不保证翻译准确性
如对翻译准确性有任何疑问,请以文章的英语版本为准。