RESUMO
Em 07 de agosto de 2024, das 20h48 UTC às 23h27 UTC, os clientes do Support em todos os pods tiveram problemas com as visualizações de tickets, incluindo tickets resolvidos que não desapareceram, atualizações lentas e exibição de números incorretos.
Linha do tempo
07 de agosto de 2024 22:00 UTC | 07 de agosto de 2024 15:00 PT
Estamos investigando relatórios de visualizações de tickets do Support que não são atualizadas ou que mostram tickets incorretos. Próxima atualização em 30 minutos ou quando tivermos novas informações para compartilhar.
07 de agosto de 2024 22h08 UTC | 07 de agosto de 2024 15:08 PT
Nossos engenheiros fizeram uma alteração e agora estamos vendo melhorias de desempenho em todos os pods. Próxima atualização em 30 minutos ou quando tivermos novas informações para compartilhar.
07 de agosto de 2024 22h24 UTC | 07 de agosto de 2024 15h24 PT
O desempenho continua estável em todos os pods e continuaremos monitorando o desempenho pela próxima hora. Próxima atualização em uma hora.
07 de agosto de 2024 23h29 UTC | 07 de agosto de 2024 16h29 PT
Após monitoramento contínuo, estamos vendo estabilidade e confirmamos que o problema que afetava as visualizações de tickets do Support que não eram atualizadas foi resolvido. Agradecemos sua paciência enquanto chegávamos a esse ponto.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado por uma falha no processo durante uma troca de cluster azul/verde, especificamente devido a uma implantação incompleta que levou a erros de configuração nos pods de produção restantes.
Resolução
Para corrigir esse problema, a equipe de engenharia aumentou manualmente os indexadores no cluster ativo para processar as atualizações de tickets acumuladas. Em seguida, ele retomou o procedimento de troca de cluster com a configuração correta.
Itens de correção
- A revisão do processo usado para a troca de cluster é necessária para garantir que ele inclua verificações pós-implantação completas para evitar que implantações incompletas passem despercebidas.
- Desenvolva automação para lidar com o processo de troca de cluster, reduzindo a necessidade de intervenção manual e minimizando as chances de erro humano.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.