RESUMO
Em 16/07/2024, das 10:47 UTC às 13:13 UTC e 17/07/2024, das 03:40 UTC às 17/07/2024 14:50 UTC, alguns clientes experimentaram lentidão e erros ao usar o Zendesk Workforce Management ( WFM) devido à utilização excessiva das capacidades de comunicação alocadas por nosso provedor de rede. Isso afetava os usuários que tentavam se conectar aos principais serviços, como o Rastreador de atividade do agente, resultando em problemas de desempenho.
Linha do tempo
17 de julho de 2024 12h28 UTC | 17 de julho de 2024 05:28 PT
Infelizmente, tivemos problemas semelhantes novamente hoje, resultando em outro pico de erros com alguns dos mesmos sintomas. Limpar o cache ou usar uma janela anônima deve resolver o problema. Monitoraremos os erros pelas próximas 24 horas e, se não houver mais ocorrências, o novo incidente será fundido a este. Agradecemos sua paciência e compreensão.
16 de julho de 2024 16h32 UTC | 16 de julho de 2024 09:32 PT
Recebemos várias confirmações de clientes de que a limpeza do cache e dos cookies restaurou o acesso ao Zendesk WFM e marcaremos esse incidente como totalmente resolvido.
16 de julho de 2024 14h38 UTC | 16 de julho de 2024 07:38 PT
Observamos que os erros no back-end diminuíram. Solicitamos que você limpe seu cache e cookies e confirme se as coisas estão funcionando conforme o esperado.
16 de julho de 2024 13h59 UTC | 16 de julho de 2024 06:59 PT
Além dos erros gerais de plataforma mencionados anteriormente, alguns clientes também não conseguem carregar o widget do WFM corretamente no Support e na extensão do Chrome em vários pods.
16 de julho de 2024 13h42 UTC | 16 de julho de 2024 06:42 PT
Ao recebermos uma confirmação negativa dos clientes em relação à resolução dos problemas, continuamos a investigar o problema com o Zendesk WFM (antigo Tymeshift). Um subconjunto de clientes ainda está vendo os erros "Você não tem acesso a esse recurso" e "Algo não funcionou / Aguarde um momento e tente novamente" ao tentar acessar a estrutura da organização. Forneceremos mais informações em 1 hora ou assim que tivermos detalhes adicionais para compartilhar.
16 de julho de 2024 13h06 UTC | 16 de julho de 2024 06:06 PT
No momento, estamos vendo melhorias no gerenciamento de tráfego de back-end para as contas afetadas e essas contas agora devem poder começar a carregar o Zendesk WFM dentro do Zendesk.
16 de julho de 2024 12h39 UTC | 16 de julho de 2024 05:39 PT
No momento, estamos investigando relatórios de lentidão ou incapacidade de carregar o Zendesk WFM (anteriormente conhecido como Tymeshift) para alguns clientes em vários pods. Faremos mais atualizações em 30 minutos ou assim que tivermos mais detalhes.
POST-MORTEM
Devido a um limite de configuração, parte do tráfego de nossa rede excedeu o uso máximo permitido durante os horários de pico. Isso não era visível imediatamente e os atrasos resultantes afetavam a experiência do cliente. Assim que percebemos, trabalhamos rapidamente para aumentar esse limite e ajustar nossa configuração para lidar melhor com o tráfego.
Análise da causa raiz
A causa principal era uma configuração padrão que limitava o número de canais de comunicação disponíveis, que excedemos conforme nossa base de clientes e tráfego cresciam.
Resolução
Ao aumentar a capacidade e redefinir as configurações apropriadas, resolvemos o problema subjacente. Outras etapas foram tomadas para garantir a estabilidade contínua.
Correção
Para evitar problemas semelhantes no futuro, estamos implementando as seguintes medidas:
1. Monitoramento da capacidade: Estamos adicionando monitoramento proativo para nos alertar quando nos aproximarmos dos limites de capacidade.
2. Revisões de configuração: Estamos revisando e ajustando nossas configurações em todas as regiões para garantir que elas estejam preparadas para o aumento do tráfego.
3. Planos de resposta aprimorados: Estamos fortalecendo nossos procedimentos de resposta a incidentes para diagnosticar e resolver problemas futuros rapidamente.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.