RESUMO

Entre 23h30 UTC em 12 de novembro de 2024 e 11h26 UTC em 15 de novembro de 2024, os clientes do Support que usam SLAs nos pods 25 e 30 tiveram cálculos de SLA atrasados e os selos de SLA em seus tickets não estavam aparecendo conforme o esperado após o período aplicável atualizações do ticket.

 

LINHA DO TEMPO

15 de novembro de 2024 13:00 UTC | 15 de novembro de 2024 05:00 PT
Temos o prazer de informar que os problemas que afetam o desempenho de SLA de métricas nos pods 25 e 30 foram resolvidos. Agradecemos sua paciência.

15 de novembro de 2024 12h16 UTC | 15 de novembro de 2024 04:16 PT
Estamos vendo melhorias no problema que afeta o desempenho de SLA de métricas nos pods 25 e 30. Continuamos monitorando e forneceremos mais atualizações assim que as tivermos.

 

POST-MORTEM

Análise da causa raiz

Esse incidente foi causado por um segredo configurado incorretamente para o serviço de evento de métrica. Isso significava que, quando o Zendesk implantava uma atualização com validação adicional, o serviço falhava ao inicializar para implantações na Ásia-Pacífico, causando atrasos no processamento.

Resolução

Para corrigir esse problema, um valor "padrão" foi adicionado ao segredo afetado em 15 de novembro de 2024. Isso permitiu que o serviço de evento de métrica fosse inicializado corretamente e retomasse as operações normais. A Zendesk também identificou e definiu um valor padrão para um segredo do serviço de transcrição de conversas para mitigar riscos futuros.

Itens de correção

  1. Conduza uma auditoria completa de todos os segredos para garantir que os valores sejam definidos para todas as localidades, especialmente nas regiões da Ásia-Pacífico.
  2. Melhore as ferramentas de implementação existentes para evitar configurações incorretas semelhantes no futuro.
  3. Crie alertas adicionais para notificar as equipes relevantes sobre falhas e problemas de inicialização.
  4. Investigue o rastreamento de métricas de falha para garantir que esses incidentes acionem alertas para resoluções oportunas.

Ao implementar essas correções, pretendemos melhorar a resiliência de nossos serviços e evitar incidentes semelhantes no futuro.

 

PARA OBTER MAIS INFORMAÇÕES

Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.

Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.

Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.

Powered by Zendesk