Resumo
De 2 de novembro de 2023, 11h54 UTC, a 6 de novembro de 2023, 19h UTC, um subconjunto de clientes do Guide em todos os pods, usando subdomínios com mapeamento do host, pode ter enfrentado a incapacidade de carregar suas Centrais de Ajuda.
Análise da causa raiz
A causa principal do incidente foi uma interrupção em nosso fornecedor principal de CDN, afetando um serviço interno encarregado de atualizar a configuração do encaminhamento de domínio. Esse incidente ocorreu durante dois dias, 2 e 3 de novembro de 2023.
Um fator secundário de influência foi que nosso serviço de configuração de encaminhamento de domínio não estava verificando o status de nomes de host personalizados antes de marcá-los como configurados corretamente. Isso gerava erros quando os nomes de host personalizados não eram validados em tempo hábil devido à interrupção de nosso fornecedor principal de CDN.
No início desse incidente, a API do fornecedor da CDN começou a funcionar mal, o que impediu que nossa configuração de encaminhamento de domínio atualizasse os certificados TLS.
Os subdomínios mapeados do host existentes não foram afetados, a menos que seus certificados TLS tivessem expirado, e os novos subdomínios ainda estavam funcionais, pois não foram encaminhados pela CDN afetada.Em 3 de novembro, o fornecedor de CDN corrigiu os problemas da API, mas ocorreram erros ao validar nomes de host personalizados ( a parte exclusiva de um nome de domínio). Isso resultava em novos domínios enfrentando erros, pois seus nomes de host personalizados não eram validados imediatamente.
Resolução
Para corrigir esse problema, várias etapas foram envolvidas:
1. A configuração do encaminhamento de domínio foi desativada temporariamente para evitar mais problemas.
2. Os domínios potencialmente afetados pelo problema foram adicionados preventivamente a uma lista de desvios de CDN para evitar que sejam afetados.
3. Uma correção foi implantada nos proxies do Zendesk para validar nomes de host personalizados.
4. A configuração de encaminhamento do domínio foi reativada e começou a processar a lista de pendências de solicitações.
Os erros foram totalmente resolvidos em 6 de novembro de 2023, com nossa configuração de encaminhamento de domínio retomando a operação normal.
Correções
- Implemente verificações adicionais no serviço de configuração de encaminhamento de domínio para garantir que os subdomínios mapeados por host estejam configurados corretamente.
- Revise e atualize a documentação interna para incluir etapas detalhadas para lidar com erros semelhantes.
- Melhore a comunicação com os clientes durante esses incidentes para mantê-los informados sobre a situação e o tempo de resolução esperado.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.