RESUMO
Em 26 de fevereiro de 2024, das 17h50 UTC às 20h52 UTC, um pequeno subconjunto de clientes no pod 29 teve um problema que fez com que os e-mails de ticket não fossem processados.
Linha do tempo
18:24 UTC | 10:24 PT
Estamos investigando um problema que está afetando um subconjunto de clientes no pod 29, causando problemas de acesso e impedindo o uso do produto. Faremos mais atualizações em breve.
18:38 UTC | 10:38 PT
Confirmamos um problema que afeta um subconjunto de clientes no pod 29, causando erros de acesso à tela verde e impedindo o uso de todos os produtos. Continuaremos a fornecer atualizações conforme a investigação avança.
19:03 UTC | 11:03 PT
Nossa equipe continua investigando um problema que afeta um subconjunto de clientes no pod 29, causando erros de tela verde e impedindo o acesso a todos os produtos. Publicaremos novas informações assim que as encontrarmos.
19:44 UTC | 11:44 PT
Nossa equipe ainda está trabalhando para encontrar a causa raiz do problema que afeta um subconjunto de clientes no pod 29, causando problemas de acesso e erros de tela verde. Outras atualizações serão publicadas assim que soubermos mais.
20:25 UTC | 12:25 PT
Nossos engenheiros continuam trabalhando com nosso provedor de serviços em nuvem para identificar a causa raiz e trabalhar para a recuperação. A próxima atualização será publicada em 1 hora ou assim que tivermos novas informações.
21:10 UTC | 13:10 PT
Estamos vendo a recuperação e continuaremos monitorando o desempenho até que o problema seja totalmente resolvido. Próxima atualização quando o problema estiver totalmente resolvido.
22:26 UTC | 14:26 PT
Temos o prazer de informar que o problema foi totalmente resolvido. Entre em contato conosco se você continuar tendo problemas.
POST-MORTEM
Análise da causa raiz
Um defeito em um recurso específico do sistema de armazenamento de banco de dados fez com que o cluster ficasse offline.
Resolução
O problema foi corrigido com a desativação do recurso com defeito, após o que o sistema de armazenamento recuperou seu estado operacional normal.
Itens de correção
- Configure alertas adicionais. [Programado]
- Aumento da janela de repetição em caso de falhas. [Programado]
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, registre um ticket conosco por mensagens do ZBot no Widget.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.