RESUMO
Em 16 de setembro de 2024, das 03h55 UTC às 06h UTC, alguns clientes localizados na Índia ou nos arredores tiveram códigos de resposta 499 e 520 em suas solicitações. Os usuários relataram vários problemas com o Zendesk, como interrupções/erros de acesso e lentidão no carregamento, latência e erros operacionais do servidor. Esses problemas foram causados por uma interrupção regional de nosso provedor de entrega de conteúdo.
Linha do tempo
16 de setembro de 2024 10h37 UTC | 16 de setembro de 2024 03:37 PT
Temos o prazer de informar que a recente interrupção do serviço foi totalmente resolvida e todos os serviços afetados agora estão totalmente operacionais. Agradecemos sua paciência e compreensão durante esse incidente.
16 de setembro de 2024 06h36 UTC | 15 de setembro de 2024 23h36 PT
Nosso parceiro de entrega de conteúdo implementou uma correção e temos relatórios confirmando a recuperação de alguns clientes. Continuaremos a monitorar e forneceremos a próxima atualização após a recuperação completa.
16 de setembro de 2024 05:59 UTC | 15 de setembro de 2024 22h59 PT
Enquanto nosso provedor de entrega de conteúdo ainda está trabalhando na correção, não podemos mais reproduzir erros anteriores. Atualize sua instância do Zendesk e informe-nos se você estiver vendo melhorias. Continuamos a trabalhar com nosso provedor de CDN e forneceremos outra atualização em 30 minutos.
16 de setembro de 2024 05:33 UTC | 15 de setembro de 2024 22h33 PT
Nosso provedor de entrega de conteúdo identificou um problema que está causando erros elevados e está implementando uma correção. Continuamos a trabalhar com eles e forneceremos outra atualização em 30 minutos ou quando tivermos mais para compartilhar.
16 de setembro de 2024 05h12 UTC | 15 de setembro de 2024 22h12 PT
Estamos cientes de um problema que pode causar sintomas com clientes que não conseguem entrar, latências ao acessar várias partes do produto Zendesk ou falhas nas chamadas da API. Estamos entrando em contato com nosso provedor de entrega de conteúdo e trabalhando com ele. Mais informações nos próximos 30 minutos.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado quando várias Autorizações de Origem de Encaminhamento (ROA) para os prefixos de propriedade de nosso provedor de conteúdo, emitidos pelos American Registry Internet Numbers (ARIN), expiraram.
Os mecanismos de failover padrão não foram eficazes devido a restrições implementadas em nossos IPs de provedor de conteúdo na Índia.
Resolução
Para corrigir esse problema, nosso provedor de conteúdo atualizou o ROA e os erros diminuíram.
Itens de correção
Nas próximas semanas, implementaremos intervalos de IP totalmente novos e não bloqueados em nosso provedor de conteúdo, o que permitirá um failover totalmente automatizado, reduzindo significativamente a duração do impacto dessas interrupções.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários