RESUMO
Em 1º de fevereiro de 2025, das 00:13 UTC às 00:59 UTC, os clientes no POD 26 tiveram problemas ao acessar os tickets arquivados. Durante esse período, vários nós de leitura do banco de dados não puderam abrir uma tabela devido a um defeito no sistema do banco de dados. Isso resultava em consultas com falha para tickets arquivados.
LINHA DO TEMPO
01 de fevereiro de 2025 01h13 UTC | 31 de janeiro de 2025 17h13 PT
Temos o prazer de informar que o problema que causava erros que afetavam um grupo de nossos clientes do Support no POD 26 foi resolvido. Agradecemos sua paciência durante nossa investigação.
01 de fevereiro de 2025 12h57 UTC | 31 de janeiro de 2025 16:57 PT
Nossos engenheiros acreditam ter identificado a causa raiz dos erros que afetam um grupo de nossos clientes do Support no POD 26 e estão trabalhando para resolver o problema.
01 de fevereiro de 2025 12h57 UTC | 31 de janeiro de 2025 16:57 PT
Estamos investigando possíveis erros de nossos clientes do Support hospedados no POD 26.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado por um defeito no sistema de banco de dados que impediu que os nós de leitura do cluster acessassem uma tabela de tickets arquivada. O defeito foi confirmado pelo suporte técnico de nosso fornecedor e era específico para a versão do banco de dados instalada no momento.
Resolução
Para resolver esse problema, nossos engenheiros interromperam uma implantação em outros estilhaços e permitiram que as modificações em andamento fossem concluídas nos estilhaços afetados. Nesse ponto, a tabela do banco de dados estava acessível. Posteriormente, a equipe planeja atualizar para uma nova versão de nosso sistema de banco de dados, que inclui um patch para o defeito identificado.
Itens de correção
- Atualize para a versão corrigida ou posterior antes de retomar as alterações de esquema.
- Divida adições de colunas e quedas de índices em ações separadas para minimizar os riscos durante as implementações.
- Atualize o run-book para exigir que grandes migrações atinjam apenas um cluster inicialmente antes de expandir para outros.
- Implemente um processo de revisão regular (pelo menos uma vez por ano) dos patches do sistema de banco de dados e estabeleça uma cadência de atualização.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações sobre o status atual do sistema sobre o Zendesk e impactos específicos em sua conta, visite nossa página de status do sistema. Você pode seguir este artigo para ser notificado quando nosso relatório post mortem for publicado. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários