RESUMO
Em 1º de agosto de 2024, das 12h10 UTC às 12h33 UTC, um pequeno número de clientes do Chat no pod 23 teve chats desconectados e incapacidade de iniciar novos chats.
Linha do tempo
01 de agosto de 2024 12h40 UTC | 01 de agosto de 2024 05:40 PT
Estamos cientes e investigando os problemas e erros do Chat no pod 23. Mais informações em breve.
01 de agosto de 2024 12h58 UTC | 01 de agosto de 2024 05:58 PT
Reiniciamos o servidor que afeta especificamente o serviço de Chat no pod 23 e estamos vendo melhorias no back-end. No entanto, você pode notar um atraso no salvamento de dados de chats em andamento durante esse período. Além disso, há uma discrepância temporária entre o status mostrado no seletor de status no Espaço de trabalho do agente e o servidor. Como resultado, um agente pode aparecer ONLINE no Espaço de trabalho do agente, mas estar OFFLINE no servidor, o que pode afetar o encaminhamento de tickets do chat.
01 de agosto de 2024 13h49 UTC | 01 de agosto de 2024 06:49 PT
Reiteramos que não deve haver perda de dados, mas os chats em andamento para as contas afetadas durante esse problema podem ter sido abandonados prematuramente. Esses chats serão recuperados e salvos, embora com um atraso. Também consultamos nosso parceiro de infraestrutura, que confirmou que havia um problema subjacente. Agradecemos sua paciência enquanto trabalhávamos para resolver esse problema.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado por uma falha inesperada na infraestrutura da AWS que afetou uma instância de capacidade de computação específica.
Resolução
Para resolver esse problema, reiniciamos a instância de capacidade de computação afetada, que posteriormente migrou o serviço para outro host estável da AWS, resolvendo o problema de maneira eficaz.
Itens de correção
- Garanta a reinicialização automática do servidor do LiveChat se ele for desligado pela AWS, usando o serviço que nos permite executar o código sem provisionar ou gerenciar servidores.
- Atualize o sistema de alertas para notificações mais precisas.
- Reduza o tempo para o mecanismo de preenchimento do chat.
- Conduza testes de resiliência nas correções em parceria com a equipe responsável.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários