RESUMEN
El 6 de febrero de 2025 desde las 18:00 UTC hasta el 7 de febrero a las 10:25 UTC, algunos clientes de Explore en EE. UU. experimentaron retrasos en los datos de los paneles de Explore.
CRONOGRAMA
7 de febrero de 2025 11:12 a.m. UTC | 7 de febrero de 2025 03:12 a.m. PT
Nos complace informarle que el problema con el panel de Explore se resolvió a las 10:25 UTC. Gracias por su paciencia y comprensión.
7 de febrero de 2025 10:54 a.m. UTC | 7 de febrero de 2025 02:54 a.m. PT
Estamos experimentando retrasos en el panel de Explore desde ayer a las 20:00 UTC. Nuestro equipo de ingeniería identificó el problema y aplicó una solución. Estamos monitoreando activamente la situación para garantizar una experiencia fluida. Gracias por su paciencia.
POST-MORTEM
Análisis de causa raíz
Este incidente fue causado por una capacidad insuficiente en un clúster de procesamiento, desencadenado por una gran exportación de datos usando el nuevo servicio Exportador de datos. La consulta tardó demasiado en ejecutarse, lo que provocó varios reintentos, lo que resultó en tres ejecuciones simultáneas de la misma consulta problemática. Estas consultas continuaron ejecutándose incluso después de que se detuvo el servicio que las inició, lo que contribuyó al aumento del uso de la CPU.
Resolución
Para resolver el problema, el equipo reinició manualmente el clúster de procesamiento, lo que terminó con las consultas atascadas y devolvió el clúster a su capacidad operativa normal. Esta acción restauró la capacidad del clúster para procesar otras consultas de manera eficaz.
Elementos de corrección
- Implementar límites de tiempo de consulta: Establezca límites de tiempo en las consultas de exportación para evitar que las ejecuciones demasiado largas afecten el rendimiento del sistema.
- Mejorar el monitoreo: Mejore los sistemas de monitoreo para activar alertas de uso elevado de la CPU de manera más prominente y sensible, lo que garantiza respuestas más rápidas a posibles problemas.
- Revisar y optimizar consultas: Revise todas las consultas asociadas con el Exportador de datos para identificar y optimizar aquellas que usan cláusulas JOIN con condiciones OR, que son problemáticas para el rendimiento.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de Zendesk y los impactos específicos en su cuenta, visite nuestra página de estado del sistema. Puede seguir este artículo para recibir una notificación cuando se publique nuestro informe post-mortem. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
0 comentarios