RESUMO
Entre 23h30 UTC em 12 de novembro de 2024 e 11h26 UTC em 15 de novembro de 2024, os clientes do Support que usam SLAs nos pods 25 e 30 tiveram cálculos de SLA atrasados e os selos de SLA em seus tickets não estavam aparecendo conforme o esperado após o período aplicável atualizações do ticket.
LINHA DO TEMPO
15 de novembro de 2024 13:00 UTC | 15 de novembro de 2024 05:00 PT
Temos o prazer de informar que os problemas que afetam o desempenho de SLA de métricas nos pods 25 e 30 foram resolvidos. Agradecemos sua paciência.
15 de novembro de 2024 12h16 UTC | 15 de novembro de 2024 04:16 PT
Estamos vendo melhorias no problema que afeta o desempenho de SLA de métricas nos pods 25 e 30. Continuamos monitorando e forneceremos mais atualizações assim que as tivermos.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado por um segredo configurado incorretamente para o serviço de evento de métrica. Isso significava que, quando o Zendesk implantava uma atualização com validação adicional, o serviço falhava ao inicializar para implantações na Ásia-Pacífico, causando atrasos no processamento.
Resolução
Para corrigir esse problema, um valor "padrão" foi adicionado ao segredo afetado em 15 de novembro de 2024. Isso permitiu que o serviço de evento de métrica fosse inicializado corretamente e retomasse as operações normais. A Zendesk também identificou e definiu um valor padrão para um segredo do serviço de transcrição de conversas para mitigar riscos futuros.
Itens de correção
- Conduza uma auditoria completa de todos os segredos para garantir que os valores sejam definidos para todas as localidades, especialmente nas regiões da Ásia-Pacífico.
- Melhore as ferramentas de implementação existentes para evitar configurações incorretas semelhantes no futuro.
- Crie alertas adicionais para notificar as equipes relevantes sobre falhas e problemas de inicialização.
- Investigue o rastreamento de métricas de falha para garantir que esses incidentes acionem alertas para resoluções oportunas.
Ao implementar essas correções, pretendemos melhorar a resiliência de nossos serviços e evitar incidentes semelhantes no futuro.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários