Resumo
Em 27 de junho de 2023, das 20:17 UTC até 28 de junho de 2023, às 17:20 UTC, os clientes do Pod 19 tiveram problemas com seus SLAs de ticket. Quando uma política de SLA foi atribuída a um ticket ou quando a meta de SLA era supostamente cumprida, o sistema não atualizou o crachá da meta como deveria. Isso significava que o ticket continuava medindo o tempo sem refletir corretamente se a meta de SLA tinha sido cumprida.
Linha do tempo
27 de junho de 2025 10:52 UTC | 27 de junho de 2025 03:52 PT
Estamos recebendo relatórios de SLAs não aplicados corretamente para clientes no Pod 19. Mais atualizações serão fornecidas em breve.
27 de junho de 2025 11:03 UTC | 27 de junho de 2025 04:03 PT
Confirmamos um problema no Pod 19 que faz com que metas de SLA e medalhas não sejam atualizadas quando uma política de SLA é aplicada ou uma meta é cumprida após uma atualização de ticket. Estamos investigando e forneceremos informações adicionais nos próximos 30 minutos.
27 de junho de 2025 11:22 PM UTC | 27 de junho de 2025 04:22 PM PT
Nossa equipe continua investigando um problema para clientes do Pod 19 que faz com que metas de SLA e medalhas não sejam atualizadas corretamente quando atualizações de ticket são enviadas. Forneceremos mais informações quando tivermos uma atualização substancial para compartilhar.
28 de junho de 2025 01:28 UTC | 27 de junho de 2025 06:28 PT
Nossos engenheiros continuam investigando problemas de SLA no Pod 19. Manteremos você informado sobre qualquer progresso em nossos esforços.
28 de junho de 2025 03:25 UTC | 27 de junho de 2025 08:25 PT
Identificamos e corrigimos o problema que faz com que metas de SLA e medalhas não sejam atualizadas no Pod 19. Todas as atualizações foram processadas e os SLAs devem aparecer corretamente no momento. Agradecemos sua paciência.
Análise de causa principal
Esse incidente foi causado por uma mensagem corrompida enviada para o sistema que lida com eventos de ticket, o que interrompeu o funcionamento de todos os processos. Um objeto de usuário foi codificado incorretamente no campo de descrição do evento, o que levou a uma falha no processamento de SLAs para eventos de ticket.
Resolução
Para corrigir esse problema, ignoramos as mensagens corrompidas ajustando a compensação de partição para ignorar as mensagens problemáticas. Em seguida, reiniciamos os consumidores para retomar o processamento normal de eventos.
Itens de reparação
Crie um plano no sistema de mensagens para gerenciar os erros que ocorrem ao ler os dados corretamente.
Melhore as ferramentas de implementação existentes para melhorar a resiliência contra mensagens corrompidas.
Crie alertas de monitoramento adicionais para melhorar a detecção de estados de serviço não saudáveis.
Estabeleça limites de conexão adequados em aplicativos específicos para evitar falhas em cascata.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações sobre o status atual do sistema sobre o Zendesk e impactos específicos em sua conta, visite nossa página de status do sistema. Você pode seguir este artigo para ser notificado quando nosso relatório pós-morte for publicado. Em caso de dúvidas adicionais sobre esse incidente, contate o Suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.