RESUMO
Em 21 de novembro de 2024, das 21h02 UTC às 21h56 UTC, alguns clientes que usam o Sunshine Conversations hospedado no pod 17 tiveram problemas de lentidão e desempenho.
LINHA DO TEMPO
24 de novembro de 2024 22h23 UTC | 24 de novembro de 2024 14h23 PT
Temos o prazer de anunciar que os problemas de latência que afetam o Sunshine Conversations para alguns de nossos clientes no POD 17 foram resolvidos. Muito obrigado por sua paciência!
24 de novembro de 2024 22h09 UTC | 24 de novembro de 2024 14h09 PT
Acreditamos ter identificado a causa raiz dos problemas de desempenho que afetam a SunCo para nosso cliente no Pod17. Estamos vendo melhorias e continuaremos monitorando o comportamento.
24 de novembro de 2024 21:53 UTC | 24 de novembro de 2024 13h53 PT
Continuamos investigando os problemas de desempenho do pod 17. Isso pode causar lentidão no Sunshine Conversations. Forneceremos mais atualizações em breve.
24 de novembro de 2024 21h36 UTC | 24 de novembro de 2024 13h36 PT
Estamos investigando possíveis problemas de desempenho que afetam alguns de nossos clientes hospedados no pod 17. Publicaremos uma atualização com mais detalhes em breve.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado por um aumento inesperado no tráfego no Pod17, que mais que dobrou na semana anterior e quase triplicou no dia do incidente. O SDK da Unity utilizado por um cliente estava fazendo solicitações excessivas à API da SunCo para recuperar contagens de mensagens não lidas, aumentando a carga no sistema. O dimensionador automático de recursos já estava na capacidade máxima, impedindo a adição de mais recursos para lidar com o aumento do tráfego. Consequentemente, essa sobrecarga resultava em tempos de resposta mais lentos e, por fim, acionava verificações de integridade que iniciavam reinicializações, agravando o problema.
Resolução
Para resolver os problemas de desempenho, aumentamos o número máximo de réplicas da API do SunCo no Pod17. Esse ajuste permitiu que o sistema lidasse melhor com o aumento do tráfego e restaurou os tempos de resposta normais para todos os clientes.
Itens de correção
- Investigue o SDK da Unity para entender por que ele está enviando um número excessivo de solicitações para a SunCo e implemente otimizações.
- Documente padrões de interação de back-end em embeddables para esclarecer o uso e identificar possíveis ineficiências.
- Avalie a implementação de uma estratégia de cache para APIs de SDK na SunCo para reduzir o número de solicitações feitas.
- Adicione monitoramento para detectar o crescimento anormal do tráfego em períodos específicos e abordar proativamente possíveis sobrecargas.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários