RESUMEN
Entre las 23:30 UTC del 12 de noviembre de 2024 y las 11:26 UTC del 15 de noviembre de 2024, los clientes de Support que usaban SLA en los pods 25 y 30 experimentaron cálculos de SLA retrasados, y las insignias de SLA en sus tickets no aparecían como se esperaba después de aplicable actualizaciones de tickets.
CRONOGRAMA
15 de noviembre de 2024 13:00 UTC | 15 de noviembre de 2024 05:00 a.m. PT
Nos complace informar que ya se han resuelto los problemas que afectan el rendimiento de los SLA de métricas en los pods 25 y 30. Gracias por su paciencia.
15 de noviembre de 2024 12:16 p.m. UTC | 15 de noviembre de 2024 04:16 a.m. PT
Ahora estamos viendo mejoras en el problema que afecta el rendimiento de los SLA de métricas en los pods 25 y 30. Seguimos monitoreando y proporcionaremos más actualizaciones tan pronto como las tengamos.
POST-MORTEM
Análisis de causa raíz
Este incidente fue causado por un secreto mal configurado para el servicio de eventos de métricas. Esto significaba que cuando Zendesk implementaba una actualización con validación adicional, el servicio no se inicializaba para las implementaciones de Asia-Pacífico, lo que generaba demoras en el procesamiento.
Resolución
Para solucionar este problema, se agregó un valor "predeterminado" para el secreto afectado el 15 de noviembre de 2024. Esto permitió que el servicio de eventos de métricas se inicializara correctamente y reanudara las operaciones normales. Zendesk también identificó y estableció un valor predeterminado para un secreto del servicio de transcripción de conversaciones para mitigar cualquier riesgo futuro.
Elementos de corrección
- Realice una auditoría exhaustiva de todos los secretos para asegurarse de que los valores estén establecidos para todas las localidades, especialmente en las regiones de Asia y el Pacífico.
- Mejore las herramientas de implementación existentes para evitar errores de configuración similares en el futuro.
- Cree alertas adicionales para notificar a los equipos pertinentes sobre fallas y problemas de inicialización.
- Investigue el seguimiento de las métricas de fallas para asegurarse de que dichos incidentes activen alertas para resoluciones oportunas.
Al implementar estas soluciones, nuestro objetivo es mejorar la resiliencia de nuestros servicios y evitar incidentes similares en el futuro.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de su cuenta de Zendesk, consulte nuestra página de estado del sistema. El resumen de la investigación post-mortem se suele publicar aquí unos días después de que finaliza el incidente. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
0 comentarios