RESUMO
Em 14 de outubro de 2024, das 13h49 UTC às 15h40 UTC, os clientes que usam o Explore na região AMER tiveram erros de "falha no download" ao tentar exportar ou programar painéis e relatórios.
LINHA DO TEMPO
14 de outubro de 2024 16h17 UTC | 14 de outubro de 2024 09:17 PT
Temos o prazer de informar que resolvemos o problema que afeta os clientes do Explore nas Américas, causando erros de "falha no download" ao tentar exportar ou programar painéis e relatórios. Agradecemos sua paciência durante nossa investigação.
14 de outubro de 2024 16h01 UTC | 14 de outubro de 2024 09:01 PT
Encontramos uma causa raiz para o problema que afeta os clientes do US Explore, causando erros de "falha no download" ao tentar baixar ou programar painéis ou relatórios; no entanto, há uma lista de pendências de solicitações que precisam ser processadas e alguns atrasos podem ocorrer. Monitoraremos para garantir a resolução total. Entre em contato conosco se você continuar tendo problemas.
14 de outubro de 2024 15h40 UTC | 14 de outubro de 2024 08:40 PT
Confirmamos um problema que afeta os clientes do US Explore, causando erros de "falha no download" ao tentar baixar ou programar painéis ou relatórios. Nossa equipe está investigando e publicaremos mais atualizações nos próximos 30 minutos.
14 de outubro de 2024 15h26 UTC | 14 de outubro de 2024 08:26 PT
Estamos recebendo relatórios de erros de "falha no download" para clientes do US Explore ao tentar baixar ou programar painéis ou relatórios. Em breve, publicaremos informações adicionais.
POST-MORTEM
Análise da causa raiz
Esse incidente foi causado pela exclusão inadvertida de um segredo que era necessário para a autenticação dos serviços no Explore. A exclusão ocorreu durante o processo de limpeza dos recursos do Explore, no qual foi assumido erroneamente que o segredo não era mais necessário, pois estava disponível em uma nova versão do serviço.
Resolução
Para corrigir esse problema, o segredo ausente foi recriado, permitindo que o serviço fosse reiniciado com êxito. Isso envolveu uma intervenção manual para reaplicar as definições de segredo por meio da base de código, garantindo que todos os componentes necessários estivessem funcionando conforme o esperado.
Itens de correção
- Aumente o número necessário de revisores para dois no repositório relevante para aprimorar a supervisão das alterações.
- Documente o processo para validar se um segredo em nossa versão anterior ainda está em uso por outros serviços.
- Desenvolva um processo documentado para validar alterações na infraestrutura de risco usando o ambiente de teste e testes de ponta a ponta.
- Estabeleça diretrizes para a implementação de alterações na infraestrutura de risco na produção, incluindo o tempo de absorção adequado.
- Investigue e resolva problemas de memória relacionados aos serviços do Explore para evitar ocorrências futuras de incidentes semelhantes.
PARA OBTER MAIS INFORMAÇÕES
Para obter informações atuais sobre o status do sistema do seu Zendesk, consulte nossa página de status do sistema. O resumo de nossa investigação post mortem geralmente é publicado aqui alguns dias após o término do incidente. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.
Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.
Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.
0 comentários