RESUMO
Em 16 de dezembro de 2024, das 13h16 UTC às 4h44 UTC, alguns clientes do Tymeshift e do Workforce Management tiveram erros e problemas de acesso.
LINHA DO TEMPO
16 de dezembro de 2024 05h25 UTC | 15 de dezembro de 2024 21h25 PT
Temos o prazer de informar que o problema de acesso ao Tymeshift e ao gerenciamento da força de trabalho foi resolvido. Agradecemos sua paciência enquanto solucionávamos esse problema hoje.
16 de dezembro de 2024 04h51 UTC | 15 de dezembro de 2024 20:51 PT
Identificamos a causa potencial do problema que afeta o Tymeshift/Gerenciamento da força de trabalho e implementamos uma correção. No momento, estamos monitorando a recuperação de nossos sistemas. Se você tiver um ticket com nossa equipe de suporte, responda a ele relatando as melhorias que você pode estar vendo.
16 de dezembro de 2024 03h44 UTC | 15 de dezembro de 2024 19h44 PT
Continuamos investigando os erros de acesso que afetam o Tymeshift e o gerenciamento da força de trabalho em vários pods. Faremos a próxima atualização quando tivermos novas informações para compartilhar. Agradecemos sua paciência enquanto resolvemos esse problema.
16 de dezembro de 2024 03:01 UTC | 15 de dezembro de 2024 19:01 PT
Recebemos relatórios de erros e problemas de acesso no Tymeshift e no gerenciamento da força de trabalho. Nossa equipe está analisando esse problema com a mais alta prioridade. Mais informações em breve.
POST-MORTEM
Análise da causa raiz
A causa raiz do incidente foi identificada como uma falha ao fechar ou desalocar adequadamente as instruções preparadas em um serviço interno. Em casos específicos, que ainda estão sob investigação, as instruções preparadas se acumularam até o ponto em que o banco de dados atingiu seu limite, fazendo com que ele parasse de responder.
Resolução
Para resolver o incidente, a equipe implementou uma solução temporária programando reimplantações diárias do serviço afetado para evitar que o problema se repita até que uma correção permanente possa ser implementada. Essa abordagem permitiu que o sistema recuperasse a funcionalidade enquanto uma investigação completa da causa raiz era conduzida.
Itens de correção
- Investigar instruções preparadas: Conduza uma investigação detalhada para determinar por que as instruções preparadas não estavam sendo fechadas ou desalocadas adequadamente e implemente uma correção.
- Implementar monitoramento e alertas: Desenvolva e implemente monitores e alertas para detectar quando o número de instruções preparadas se aproxima do limite.
- Revisar os limites do monitor de erro: Revise e ajuste os limites de monitoramento de erros para garantir a detecção oportuna de problemas semelhantes no futuro.
- Prevenir recorrência: Programe reimplantações diárias do serviço até que uma correção permanente seja implementada para evitar que o problema ocorra novamente.
- Aumentar a alocação de recursos: Aumente a alocação de CPU e memória para a instância de produção US1 Tymeapp TymeShift para lidar com cargas mais altas.
Medidas preventivas
Para evitar incidentes semelhantes no futuro, vamos:
- Aprimore as revisões de código para garantir o gerenciamento adequado de instruções preparadas.
- Implemente sistemas de monitoramento robustos que possam detectar e alertar a equipe sobre possíveis problemas antes que eles gerem interrupções de serviço.
- Conduza auditorias regulares do desempenho do banco de dados e da utilização de recursos.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações sobre o status atual do sistema sobre o Zendesk e impactos específicos em sua conta, visite nossa página de status do sistema. Você pode seguir este artigo para ser notificado quando nosso relatório post mortem for publicado. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários