Resumo
De 7 de outubro de 2024, às 22h30 UTC, até 8 de outubro de 2024, às 06h UTC, alguns clientes que usam bots Ultimate não conseguiram criar tickets. Isso afetou as conversas por mensagem com os usuários finais.
Linha do tempo
08 de outubro de 2024 03:52 UTC | 07 de outubro de 2024 20:52 PT
Nossas equipes de engenharia estão cientes dos problemas enfrentados por um pequeno subconjunto de clientes que usam os bots de chat do Ultimate nas últimas 5 horas. Devido a algumas complexidades, as investigações têm sido lentas. Faremos outra atualização em 2 horas. Agradecemos sua paciência enquanto resolvemos esse problema.
08 de outubro de 2024 05:52 UTC | 07 de outubro de 2024 22h52 PT
Nossa equipe de engenharia identificou a causa raiz do problema que afeta alguns bots de chat do Ultimate. Estamos testando algumas opções para corrigir esse problema. Esta será a atualização final publicada na página de status do Zendesk. Consulte a página de status Ultimate para atualizações futuras: https://status.ultimate.ai/incidents/hkttfhfgrplq.
Análise da causa raiz
O incidente foi causado porque nosso cache Redis para o Sunshine Automation atingiu seu limite de memória. O Redis, que atua como um cache para armazenar dados acessados com frequência, teve uso excessivo de memória devido à expiração inadequada de chaves, o que impediu que os bots integrados ao Sunshine Automation processassem as mensagens de maneira eficaz. Nossos sistemas de alerta falharam ao notificar a equipe de plantão, atrasando o início da investigação até por volta das 05:00 UTC. Após a investigação, a equipe aumentou a memória do Redis, resolvendo o incidente às 06:00 UTC. Como acompanhamento, abordaremos o problema de validade da chave do Redis e melhoraremos nosso sistema de alerta para o uso da memória do Redis, a fim de garantir tempos de resposta mais rápidos no futuro.
Itens de correção
- Resolver o problema de validade da chave do Redis
- Melhore o monitoramento e os alertas de uso de memória do Redis
- Atualize os processos internos de encaminhamento para melhorar os tempos de resposta a incidentes do bot do Ultimate
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários