RESUMO
Em 6 de fevereiro de 2025, das 18h UTC às 10h25 UTC de 7 de fevereiro, alguns clientes do Explore nos EUA tiveram atrasos nos dados dos painéis do Explore.
LINHA DO TEMPO
07 de fevereiro de 2025 11h12 UTC | 07 de fevereiro de 2025 03:12 PT
Temos o prazer de informar que o problema com o painel do Explore foi resolvido às 10h25 UTC. Agradecemos sua paciência e compreensão!
07 de fevereiro de 2025 10h54 UTC | 07 de fevereiro de 2025 02:54 PT
Estamos enfrentando atrasos no painel do Explore desde ontem às 20:00 UTC. Nossa equipe de engenharia identificou o problema e aplicou uma correção. Estamos monitorando ativamente a situação para garantir uma experiência tranquila. Agradecemos sua paciência!
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado por capacidade insuficiente em um cluster de processamento, acionado por uma grande exportação de dados usando o novo serviço Exportador de dados. A consulta demorou muito para ser executada, resultando em várias tentativas, o que resultou em três execuções simultâneas da mesma consulta problemática. Essas consultas continuaram sendo executadas mesmo depois que o serviço que as iniciou foi interrompido, contribuindo para o pico de uso da CPU.
Resolução
Para resolver o problema, a equipe reiniciou manualmente o cluster de processamento, o que encerrou as consultas paradas e retornou o cluster à capacidade operacional normal. Essa ação restaurou a capacidade do cluster de processar outras consultas de maneira eficaz.
Itens de correção
- Implementar limites de tempo de consulta: Estabeleça limites de tempo nas consultas de exportação para evitar que execuções excessivamente longas afetem o desempenho do sistema.
- Melhorar o monitoramento: Aprimore os sistemas de monitoramento para disparar alertas de alto uso da CPU de maneira mais destacada e sensível, garantindo respostas mais rápidas a possíveis problemas.
- Analisar e otimizar consultas: Revise todas as consultas associadas ao Exportador de dados para identificar e otimizar aquelas que usam cláusulas JOIN com condições OR, que são problemáticas para o desempenho.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações sobre o status atual do sistema sobre o Zendesk e impactos específicos em sua conta, visite nossa página de status do sistema. Você pode seguir este artigo para ser notificado quando nosso relatório post mortem for publicado. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários