Pesquisas recentes


Sem pesquisas recentes

Dan Beirouty's Avatar

Dan Beirouty

Entrou em 14 de abr. de 2021

·

Última atividade em 07 de jan. de 2025

Zendesk Employee

Seguindo

0

Seguidores

6

Atividade total

218

Votos

14

Assinaturas

161

VISÃO GERAL DA ATIVIDADE

Atividade mais recente por Dan Beirouty

Dan Beirouty comentou,

ComentárioService notifications

Postmortem published January 7, 2025.

Exibir comentário · Publicado 07 de jan. de 2025 · Dan Beirouty

0

Seguidores

0

Votos

0

Comentários


Dan Beirouty comentou,

ComentárioService notifications

Post-mortem published December 19, 2024.

Exibir comentário · Publicado 19 de dez. de 2024 · Dan Beirouty

0

Seguidores

0

Votos

0

Comentários


Dan Beirouty criou um artigo,

ArtigoNotificações de serviço

RESUMO
Em 16 de dezembro de 2024, das 13h16 UTC às 4h44 UTC, alguns clientes do Tymeshift e do Workforce Management tiveram erros e problemas de acesso.

LINHA DO TEMPO

16 de dezembro de 2024 05h25 UTC | 15 de dezembro de 2024 21h25 PT
Temos o prazer de informar que o problema de acesso ao Tymeshift e ao gerenciamento da força de trabalho foi resolvido. Agradecemos sua paciência enquanto solucionávamos esse problema hoje.

16 de dezembro de 2024 04h51 UTC | 15 de dezembro de 2024 20:51 PT
Identificamos a causa potencial do problema que afeta o Tymeshift/Gerenciamento da força de trabalho e implementamos uma correção. No momento, estamos monitorando a recuperação de nossos sistemas. Se você tiver um ticket com nossa equipe de suporte, responda a ele relatando as melhorias que você pode estar vendo.

16 de dezembro de 2024 03h44 UTC | 15 de dezembro de 2024 19h44 PT
Continuamos investigando os erros de acesso que afetam o Tymeshift e o gerenciamento da força de trabalho em vários pods. Faremos a próxima atualização quando tivermos novas informações para compartilhar. Agradecemos sua paciência enquanto resolvemos esse problema.

16 de dezembro de 2024 03:01 UTC | 15 de dezembro de 2024 19:01 PT
Recebemos relatórios de erros e problemas de acesso no Tymeshift e no gerenciamento da força de trabalho. Nossa equipe está analisando esse problema com a mais alta prioridade. Mais informações em breve.


POST-MORTEM

Análise da causa raiz

A causa raiz do incidente foi identificada como uma falha ao fechar ou desalocar adequadamente as instruções preparadas em um serviço interno. Em casos específicos, que ainda estão sob investigação, as instruções preparadas se acumularam até o ponto em que o banco de dados atingiu seu limite, fazendo com que ele parasse de responder.

Resolução

Para resolver o incidente, a equipe implementou uma solução temporária programando reimplantações diárias do serviço afetado para evitar que o problema se repita até que uma correção permanente possa ser implementada. Essa abordagem permitiu que o sistema recuperasse a funcionalidade enquanto uma investigação completa da causa raiz era conduzida.

Itens de correção

  1. Investigar instruções preparadas: Conduza uma investigação detalhada para determinar por que as instruções preparadas não estavam sendo fechadas ou desalocadas adequadamente e implemente uma correção.
  2. Implementar monitoramento e alertas: Desenvolva e implemente monitores e alertas para detectar quando o número de instruções preparadas se aproxima do limite.
  3. Revisar os limites do monitor de erro: Revise e ajuste os limites de monitoramento de erros para garantir a detecção oportuna de problemas semelhantes no futuro.
  4. Prevenir recorrência: Programe reimplantações diárias do serviço até que uma correção permanente seja implementada para evitar que o problema ocorra novamente.
  5. Aumentar a alocação de recursos: Aumente a alocação de CPU e memória para a instância de produção US1 Tymeapp TymeShift para lidar com cargas mais altas.


Medidas preventivas

Para evitar incidentes semelhantes no futuro, vamos:

  1. Aprimore as revisões de código para garantir o gerenciamento adequado de instruções preparadas.
  2. Implemente sistemas de monitoramento robustos que possam detectar e alertar a equipe sobre possíveis problemas antes que eles gerem interrupções de serviço.
  3. Conduza auditorias regulares do desempenho do banco de dados e da utilização de recursos.


PARA OBTER MAIS INFORMAÇÕES

Para obter informações sobre o status atual do sistema sobre o Zendesk e impactos específicos em sua conta, visite nossa página de status do sistema. Você pode seguir este artigo para ser notificado quando nosso relatório post mortem for publicado. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.

Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.

Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.

Editado 20 de dez. de 2024 · Dan Beirouty

0

Seguidores

1

Votos

0

Comentários


Dan Beirouty criou um artigo,

ArtigoNotificações de serviço

RESUMO
Em 11 de dezembro de 2024, das 23h39 UTC às 6h30 UTC de 12 de dezembro, os clientes que usam os recursos de IA do Zendesk, como IA avançada, Talk, Agentes de IA e outros recursos de IA generativa, tiveram interrupções na funcionalidade devido à interrupção do provedor de serviços.

LINHA DO TEMPO

12 de dezembro de 2024 04h05 UTC | 11 de dezembro de 2024 20h05 PT
Estamos observando a recuperação de todos os recursos de IA e continuamos monitorando nossos sistemas para uma recuperação completa. Estamos ansiosos para fornecer uma atualização final quando os sistemas estiverem totalmente estáveis.

12 de dezembro de 2024 01h53 UTC | 11 de dezembro de 2024 17:53 PT
Nossa equipe está trabalhando com nosso provedor de serviços em um problema que afeta os recursos de IA do Zendesk. O impacto pode ser visível por IA avançada, Talk, Agentes de IA e outros recursos de IA generativa. Devido a tentativas iniciais malsucedidas de resolver o problema, as equipes continuam avançando com a prioridade mais alta para resolver esse problema. Transmitiremos as atualizações quando elas estiverem disponíveis.


POST-MORTEM

Análise da causa raiz

A causa principal do incidente foi uma nova configuração para um serviço de telemetria que gerou inesperadamente uma carga massiva na API de um provedor de serviços em grandes clusters. Essa carga excessiva sobrecarregou e interrompeu a descoberta de serviços baseados em DNS, resultando em solicitações com falha para os serviços de nosso provedor.

Resolução

O incidente foi resolvido depois que o provedor de serviços identificou o problema e implementou medidas corretivas para aliviar a carga na API. A Zendesk manteve comunicação com nosso provedor de serviços durante todo o incidente para garantir uma resposta coordenada.

Itens de correção

  1. Support Level Agreement (Contrato de nível de suporte) com as equipes de serviço do LLM: Trabalhe com clientes internos para entender suas expectativas de desempenho e disponibilidade, o que ajudará a propor estratégias de fallback e ajustar os limites de monitoramento.
  2. Estratégias de fallback para recursos de IA generativa : Desenvolva estratégias de fallback para os recursos do GenAI, o que envolverá a adição de recursos aos sistemas de proxy e a colaboração com os responsáveis pelos recursos para determinar as melhores estratégias para seus respectivos casos.
  3. Suporte Premium do nosso provedor de serviços: Negocie suporte adicional do provedor de serviços para garantir uma resolução e assistência mais rápidas durante incidentes.

Medidas preventivas

Para evitar incidentes semelhantes no futuro, as seguintes ações serão tomadas:

  • Aprimore os sistemas de monitoramento e alerta para detectar melhor cargas anormais na API.
  • Estabeleça canais de comunicação mais claros e acordos de suporte com nosso provedor de serviços para garantir uma resposta rápida durante incidentes.
  • Implemente estratégias de fallback para recursos críticos de IA a fim de manter a disponibilidade do serviço mesmo durante interrupções do provedor.

PARA OBTER MAIS INFORMAÇÕES

Para obter informações sobre o status atual do sistema sobre o Zendesk e impactos específicos em sua conta, visite nossa página de status do sistema. Você pode seguir este artigo para ser notificado quando nosso relatório post mortem for publicado. Se você tiver mais perguntas sobre esse incidente, entre em contato com o suporte ao cliente Zendesk.

Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.

Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.

Editado 20 de dez. de 2024 · Dan Beirouty

0

Seguidores

1

Votos

0

Comentários


Dan Beirouty comentou,

ComentárioService notifications

Post-mortem published November 21. 2024.

Exibir comentário · Publicado 21 de nov. de 2024 · Dan Beirouty

0

Seguidores

0

Votos

0

Comentários


Dan Beirouty comentou,

ComentárioService notifications

Post-mortem published November 18, 2024.

Exibir comentário · Publicado 18 de nov. de 2024 · Dan Beirouty

0

Seguidores

0

Votos

0

Comentários


Dan Beirouty comentou,

ComentárioService notifications

Post-mortem published November 14, 2024.

Exibir comentário · Publicado 14 de nov. de 2024 · Dan Beirouty

0

Seguidores

0

Votos

0

Comentários


Dan Beirouty comentou,

ComentárioService notifications

Post-mortem published November 1, 2024.

Exibir comentário · Publicado 01 de nov. de 2024 · Dan Beirouty

0

Seguidores

0

Votos

0

Comentários


Dan Beirouty criou um artigo,

ArtigoNotificações de serviço

A Zendesk realizará uma manutenção crítica que afetará o desempenho dos clientes que usam as integrações do Zendesk com o Twitter em todos os pods na quinta-feira, 14 de novembro de 2024, durante os horários listados abaixo.

Produtos afetados: Integração com o Twitter e canal de mensagem direta do Twitter do Sunshine Conversations

Importante: Apenas os clientes com as integrações do Twitter ativadas serão afetados.
Clientes afetados: Os clientes do Zendesk Twitter em todos os pods terão uma interrupção do serviço de pelo menos 2 horas em algum momento dentro da janela de manutenção de 8 horas.

Data

Pod

Hora de início

Hora de término

14 de novembro de 2024

Todos

21:00 UTC /
13:00 PST

05:00 UTC (15 de novembro) /
21:00 PST

Comportamento esperado

Os seguintes recursos estarão indisponíveis durante a janela de manutenção:

  • Mensagens diretas do Twitter 
  • Publicações e comentários do Twitter
  • Os administradores não podem adicionar ou gerenciar contas existentes do Twitter.
  • O gatilho configurado com a ação Alvo do Twitter não publicará mensagens no Twitter.

Comentários, publicações e mensagens diretas do Twitter não serão recebidos durante o período de manutenção, e os administradores não poderão atualizar ou adicionar contas do Twitter no Zendesk.

Quando a janela de manutenção terminar, o Zendesk buscará todas as publicações e mensagens durante a janela de manutenção e as trará para as contas.

A janela de menor tráfego para clientes foi escolhida para este exercício e não pode ser alterada ou especificada. Agradecemos sua compreensão.

Por que estamos fazendo isso: A equipe de integrações do Zendesk está fazendo alterações para melhorar a segurança da integração com o Twitter.

Aviso sobre a tradução: este artigo foi traduzido por um software de tradução automática para oferecer a você uma compreensão básica do conteúdo. Medidas razoáveis foram tomadas para fornecer uma tradução precisa, no entanto, a Zendesk não garante a precisão da tradução.

Em caso de dúvidas relacionadas à precisão das informações contidas no artigo traduzido, consulte a versão oficial do artigo em inglês.

Editado 31 de out. de 2024 · Dan Beirouty

0

Seguidores

1

Votos

0

Comentários


Dan Beirouty comentou,

ComentárioService notifications

Post-mortem published October 25, 2024.

Exibir comentário · Publicado 25 de out. de 2024 · Dan Beirouty

0

Seguidores

0

Votos

0

Comentários