Resumo
Em 31 de janeiro de 2024, das 03h52 UTC às 06h52 UTC, os clientes do Zendesk Chat em vários pods podem ter enfrentado falhas com os gatilhos do Chat, afetando recursos como encaminhamento de chat, configuração de departamentos e mensagens offline.
Linha do tempo
06:19 UTC | 22:19 PT
Estamos investigando um problema que afeta a criação, atualização e execução de gatilhos do Chat em vários pods. Os clientes podem ter problemas com o encaminhamento do Chat, mensagens proativas, configuração de departamentos e outras ações relacionadas. Forneceremos uma atualização sobre esse problema assim que possível.
07:53 UTC | 23:53 PT
Corrigimos o problema com os gatilhos do Chat em todos os pods e estamos em recuperação. As ações do gatilho do Chat, como encaminhamento, configuração de departamentos e mensagens offline, devem funcionar para todos os novos chats. Uma atualização final será publicada após a resolução completa.
09:17 UTC | 01:17 PT
A correção implementada resolveu todos os problemas com os gatilhos do Chat em todos os pods. Agora, consideraremos esse incidente como concluído. Agradecemos sua paciência enquanto trabalhávamos.
Análise da causa raiz
Esse incidente foi causado pela introdução de uma nova configuração de autenticação interna no serviço do gatilho do Chat. Apesar de testarmos essa alteração de código em nosso ambiente de teste, o problema não foi revelado porque as credenciais de autenticação antigas permaneceram válidas por um longo período de tempo além de nossa fase de teste.
Resolução
Para corrigir esse problema, nossa equipe identificou a alteração incorreta no código e a reverteu.
Itens de correção
- Atualize o processo de implantação para com tempos de absorção mais longos em ambientes de pré-produção [Programado]
- Implementar alertas adicionais [Programado]
- Investigar o mecanismo para reinicializações paralelas de hosts [Programado]
- Atualizar runbooks internos [Programado]
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, registre um ticket conosco por mensagens do ZBot no Widget.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários