RESUMEN
El 16 de diciembre de 2024, de 1:16 UTC a 4:44 UTC, algunos clientes de Tymeshift y Workforce Management experimentaron errores y problemas de acceso.
CRONOGRAMA
16 de diciembre de 2024 05:25 a.m. UTC | 15 de diciembre de 2024 09:25 p.m. PT
Nos complace informar que el problema de acceso a Tymeshift y Workforce Management ya está resuelto. Gracias por su paciencia mientras resolvíamos este problema hoy.
16 de diciembre de 2024 04:51 a.m. UTC | 15 de diciembre de 2024 08:51 p.m. PT
Hemos identificado la posible causa del problema que afecta a Tymeshift / Workforce Management y hemos implementado una solución. Actualmente estamos monitoreando nuestros sistemas para la recuperación. Si tiene un ticket con nuestro equipo de soporte, responda al ticket para informar cualquier mejora que pueda estar observando.
16 de diciembre de 2024 03:44 a.m. UTC | 15 de diciembre de 2024 07:44 p.m. PT
Seguimos investigando los errores de acceso que afectan a Tymeshift y Workforce Management en varios pods. Proporcionaremos la próxima actualización cuando tengamos nueva información para compartir. Gracias por su paciencia mientras resolvemos este problema.
16 de diciembre de 2024 03:01 a.m. UTC | 15 de diciembre de 2024 07:01 p.m. PT
Hemos recibido informes de errores y problemas de acceso en Tymeshift y Workforce Management. Nuestro equipo está investigando este asunto con máxima prioridad. Próximamente habrá más información.
POST-MORTEM
Análisis de causa raíz
La causa raíz del incidente se identificó como una falla al cerrar o desasignar correctamente las declaraciones preparadas en un servicio interno. En casos específicos, que aún están bajo investigación, las declaraciones preparadas se acumularon hasta el punto en que la base de datos llegó a su límite, lo que provocó que dejara de responder.
Resolución
Para resolver el incidente, el equipo implementó una solución temporal al programar redespliegues diarios del servicio afectado para evitar que el problema se repitiera hasta que se pudiera implementar una solución permanente. Este enfoque permitió que el sistema recuperara la funcionalidad mientras se realizaba una investigación exhaustiva de la causa raíz.
Elementos de corrección
- Investigar declaraciones preparadas: Realice una investigación detallada para determinar por qué las declaraciones preparadas no se cerraron o desasignaron correctamente e implemente una corrección.
- Implementar monitoreo y alertas: Desarrolle e implemente monitores y alertas para detectar cuándo el número de declaraciones preparadas se acerca al límite.
- Revisar los umbrales del monitor de errores: Revise y ajuste los umbrales para el monitoreo de errores para garantizar la detección oportuna de problemas similares en el futuro.
- Prevent Recurrence: Programe redespliegues diarios del servicio hasta que se implemente una solución permanente para evitar que el problema vuelva a ocurrir.
- Aumentar asignación de recursos: Aumente la asignación de CPU y memoria para la instancia de producción US1 Tymeapp TymeShift para manejar cargas más altas.
Medidas preventivas
Para evitar incidentes similares en el futuro, haremos lo siguiente:
- Mejore las revisiones de código para garantizar una administración adecuada de las declaraciones preparadas.
- Implemente sistemas de monitoreo sólidos que puedan detectar y alertar al equipo sobre posibles problemas antes de que provoquen interrupciones del servicio.
- Realizar auditorías periódicas del rendimiento de la base de datos y la utilización de los recursos.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de Zendesk y los impactos específicos en su cuenta, visite nuestra página de estado del sistema. Puede seguir este artículo para recibir una notificación cuando se publique nuestro informe post-mortem. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
0 comentarios