RESUMEN
El 7 de agosto de 2024 desde las 17:00 UTC hasta el 8 de agosto de 2024 a las 16:45 UTC, algunos clientes de los pods 17, 18, 28 y 29 experimentaron errores al intentar crear nuevos informes con la función Explore. Esto afectó su capacidad para generar información valiosa y acceder a informes de datos críticos.
Cronograma
8 de agosto de 2024 03:35 p.m. UTC | 8 de agosto de 2024 08:35 a.m. PT
Estamos investigando informes de clientes de Explore con una gran cantidad de conjuntos de datos que no pueden crear nuevos informes y conjuntos de datos. Como solución alternativa, puede crear un nuevo informe clonando un informe existente y editándolo, sin embargo, no podrá crear nuevos conjuntos de datos. Próxima actualización en 30 minutos o cuando tengamos nueva información.
8 de agosto de 2024 04:00 p.m. UTC | 8 de agosto de 2024 09:00 a.m. PT
Nuestros ingenieros continúan investigando un problema que afecta la capacidad de crear nuevos informes y conjuntos de datos de Explore. Hemos reducido el alcance del impacto a los pods 17, 18, 28, 29 y 31. Próxima actualización en una hora o cuando tengamos nueva información para compartir.
8 de agosto de 2024 04:54 p.m. UTC | 8 de agosto de 2024 09:54 a.m. PT
Nuestros ingenieros siguen enfocados en resolver el problema que afecta la creación de nuevos informes y conjuntos de datos de Explore. Proporcionaremos la próxima actualización en 2 horas o cuando tengamos nueva información para compartir.
8 de agosto de 2024 17:21 UTC | 8 de agosto de 2024 10:21 a.m. PT
Nuestros ingenieros han implementado una corrección y hemos confirmado que ahora se pueden crear nuevos informes y conjuntos de datos. El problema ya está completamente resuelto. Háganos saber si sigue teniendo problemas.
POST-MORTEM
Análisis de causa raíz
Este incidente fue causado por una degradación del rendimiento después de una actualización de la infraestructura de nuestra base de datos proporcionada por nuestro socio. La actualización eliminó el almacenamiento en caché de consultas en el que anteriormente dependía nuestro sistema, lo que ralentizó significativamente ciertas consultas cruciales para la función Explore.
Resolución
Para solucionar este problema, analizamos las consultas problemáticas e implementamos estrategias de indexación eficaces. Esta acción inmediata restauró el rendimiento de las consultas a los niveles esperados, resolviendo así los errores que estaban experimentando los clientes.
Elementos de corrección
- Mejore el sistema de monitoreo con alertas específicas centradas en las latencias de las consultas SQL para detectar problemas de rendimiento a tiempo.
- Comunicó la desactivación de la caché de consultas a otros equipos, para asegurarse de que estén al tanto de los posibles impactos y puedan tomar medidas preventivas.
- Investigue la optimización de las consultas reemplazando las declaraciones "not in" con valores booleanos para alinearlas con las nuevas versiones de la base de datos.
- Investigue la implementación de soluciones de almacenamiento en caché usando caché elástica o ProxySQL para resultados de consultas repetidos para evitar problemas similares en el futuro.
- Asegúrese de que todos los cambios, las mejoras y los procesos estén completamente documentados en Confluence para compartir conocimientos y prepararse para eventos futuros similares.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de su cuenta de Zendesk, consulte nuestra página de estado del sistema. El resumen de la investigación post-mortem se suele publicar aquí unos días después de que finaliza el incidente. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.