RESUMO
Em 8 de janeiro de 2024, das 17h38 às 17h56 UTC, os clientes do Support nos pods 13 e 20 podem ter experimentado latência, atrasos e erros de tela verde ao tentar carregar o Support e/ou os tickets.
Linha do tempo
18:07 UTC | 10:07 PT
Estamos investigando relatórios de lentidão e atrasos nos pods 13 e 20. Forneceremos atualizações adicionais em breve.
18:19 UTC | 10:19 PT
Confirmamos um problema que causa latência, atrasos, erros e, em alguns casos, incapacidade de entrar para clientes nos pods 13 e 20, e nossa equipe está investigando. Continuaremos a fornecer atualizações à medida que aprendermos mais.
18:29 UTC | 10:29 PT
Estamos trabalhando com nosso provedor de rede de distribuição de conteúdo (CDN) para mitigar a latência, os atrasos e os erros vistos pelos clientes nos pods 13 e 20. Forneceremos novas informações conforme a investigação avança.
18:44 UTC | 10:44 PT
Reencaminhamos grande parte do tráfego para os pods 13 e 20 e a taxa de erros diminuiu significativamente. Mitigamos o impacto imediato e continuamos trabalhando com nosso provedor de CDN para iniciar a recuperação. Entre em contato conosco se você continuar tendo problemas.
19:22 UTC | 11:22 PT
Nosso provedor de CDN implementou uma correção para o problema que causava latência, atrasos e erros para os clientes nos pods 13 e 20 e estamos monitorando os resultados. Entre em contato conosco se você tiver qualquer ressurgimento de atrasos ou problemas relacionados.
19:40 UTC | 11:40 PT
A correção implementada por nosso provedor de CDN provou ser eficaz e o problema que causava latência, atrasos e erros para os clientes nos pods 13 e 20 foi resolvido. Agradecemos sua paciência durante nossa investigação.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado porque nosso provedor de rede de distribuição de conteúdo (CDN) teve congestionamento de rede em vários locais nos EUA.
Resolução
Para corrigir esse problema, fizemos failover para um backup até que nosso provedor de CDN pudesse implementar uma correção para o congestionamento.
Itens de correção
- Investigue o mecanismo de resposta de failover automático para garantir que ele seja ativado em todas as localizações geográficas com problemas semelhantes.
- Explore possíveis ajustes nos limites de erro para uma resposta automática de failover.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, registre um ticket conosco por mensagens do ZBot no Widget.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.