RESUMO
Em 15 de dezembro de 2023, entre 14h10 e 15h30 UTC, os clientes relataram um aumento nas quedas de chamadas e problemas para atender chamadas, além de dificuldades em colocar chamadas em espera e fazer chamadas. Esses problemas atingiram o pico por volta das 14h e 15h UTC.
Linha do tempo
16:33 UTC | 08:33 PT (15 de dezembro)
Estamos investigando os relatórios de queda de chamadas no Talk e a degradação de outros recursos do Talk em vários pods. Em breve, publicaremos informações adicionais.
16:49 UTC | 08:49 PT (15 de dezembro)
Confirmamos um problema que está causando quedas de chamadas e degradação de outros recursos do Talk em vários pods. Nossa equipe está investigando e forneceremos mais atualizações assim que soubermos mais.
17:16 UTC | 09:16 PT (15 de dezembro)
Nossa equipe continua investigando o problema do Talk que está causando a queda de chamadas e a degradação geral dos recursos do Talk em vários pods. Forneceremos novas informações conforme a investigação avança.
17:49 UTC | 09:49 PT (15 de dezembro)
Estamos trabalhando com nosso provedor para continuar investigando o problema do Talk que está causando quedas de chamadas e degradação geral do recurso Talk em vários pods. Continuaremos a publicar atualizações à medida que nos aprofundarmos.
18:51 UTC | 10:51 PT (15 de dezembro)
Ainda estamos trabalhando com nosso provedor do Talk para ajudar a resolver a degradação do recurso Talk do lado do agente vista hoje. Os agentes podem ter problemas para se conectar às chamadas; no entanto, o volume total de chamadas abandonadas é relativamente baixo e as chamadas ainda devem chegar a outros agentes disponíveis. Nossa investigação continua e forneceremos mais atualizações assim que soubermos mais.
20:01 UTC | 12:01 PT (15 de dezembro)
Continuamos a trabalhar com nosso provedor do Talk para resolver a degradação do recurso Talk do lado do agente que alguns agentes viram hoje. Enviaremos mais atualizações até o final do dia ou quando tivermos novas informações para compartilhar.
19:51 UTC | 11:51 PT (18 de dezembro)
Após o monitoramento durante o fim de semana, não estamos vendo nenhum erro na funcionalidade relacionada ao Talk do lado do agente. A investigação contínua com nosso provedor não descobriu uma causa raiz comum entre os relatórios e as descobertas indicam que o momento dos relatórios pode ter sido coincidência. Como tal, não prevemos a conclusão de um RCA formal para esse evento. Se você estiver tendo problemas, entre em contato com nossa equipe de suporte para ajudar na solução de problemas.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado por um problema em nosso provedor de serviços do Talk. Foi só em 16 de dezembro que eles reconheceram publicamente e compartilharam detalhes sobre a interrupção em seus Serviços de Voz Programáveis do dia anterior. Infelizmente, essas informações não chegaram ao Zendesk até 21 de dezembro. A linha do tempo dos problemas que nossos clientes enfrentaram está alinhada com o período de problemas divulgados por nosso provedor de serviços do Talk. As complicações enfrentadas pelo provedor de serviços do Talk levaram a uma transição para a operação no modo sem radar de nosso console de chamadas, um modo ativado em resposta a uma conectividade de rede ruim. Isso estava diretamente relacionado às falhas de dimensionamento automático do provedor de serviços do Talk, que começaram às 12h05 UTC em 15 de dezembro.
Resolução
Para corrigir esse problema, os engenheiros do nosso provedor de serviços Talk atualizaram sua frota de processamento de voz para empregar as configurações mais recentes, evitando assim a incompatibilidade com os novos dados que estão sendo processados. Nenhuma ação adicional foi necessária por parte do Zendesk.
Itens de correção
Do Zendesk
- Exiba uma mensagem de erro no console de chamadas se a conexão do provedor de serviços do Talk não estiver ativa ou, pelo menos, um ícone de conexão que indique problemas de conexão.
- Revise e melhore as mensagens de erro atuais/no produto para aumentar a clareza.
- Melhore as ferramentas de implementação existentes.
- Explore o desenvolvimento de sistemas de alerta adicionais para melhorar a detecção de incidentes.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, registre um ticket conosco por mensagens do ZBot no Widget.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.