RESUMEN
Entre el 9 de noviembre de 2023 a las 3:00 a.m. UTC y el 10 de noviembre de 2023 a las 10:00 a.m. UTC, los clientes de Explore dentro de la región de EE. UU. (varios pods) experimentaron demoras en la actualización de datos para los conjuntos de datos históricos.
Cronograma
19:18 UTC | 11:18 PT (9 de noviembre)
Las cuentas de Explore en la región de EE. UU. están experimentando retrasos en la actualización de datos para los conjuntos de datos históricos. Las funciones de consultas e informes de Explore están disponibles normalmente, y los conjuntos de datos en tiempo real no se ven afectados. La investigación sobre la causa principal aún está en curso, por lo que no tenemos una hora estimada de llegada para resolver el retraso.
11:27 UTC | 03:27 PT (10 de noviembre)
Hemos implementado una corrección para los retrasos en la actualización de datos para los conjuntos de datos históricos en la región de Explore US y los clientes ya no deberían experimentar ningún retraso. Ahora consideraremos este incidente como resuelto. Gracias por su colaboración.
POST-MORTEM
Análisis de causa raíz
El incidente fue causado por la falla del servicio de estadísticas de la cuenta para proporcionar información correcta sobre los volúmenes de datos de la cuenta para varias cuentas, de modo que las cuentas se informaron como más pequeñas que su tamaño real. Esto, a su vez, hizo que los sistemas ETL de Explore asignaran menos recursos de cómputo de los necesarios para procesar las actualizaciones delta regulares para estas cuentas, lo que resultó en un procesamiento más lento y en algunos casos de pipelines de datos fallidos o con tiempo de espera agotado.
Resolución
Para solucionar este problema, el servicio de estadísticas de la cuenta se cambió temporalmente a una fuente de datos alternativa con los datos de la cuenta correctos. Esto restauró la asignación correcta de recursos en los sistemas ETL de Explore. Los ingenieros de Explore también aumentaron manualmente los recursos para desbloquear las cuentas con largas demoras en el procesamiento de datos.
Elementos de corrección
- Cree alertas adicionales para picos en los cambios de clasificación del tamaño de la cuenta.
- Investigar el reemplazo de la asignación de recursos del pipeline.
- Agregue una fase de validación a los pipelines de datos para detectar datos de origen faltantes o anómalos.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de su cuenta de Zendesk, consulte nuestra página de estado del sistema. El resumen de la investigación post-mortem se suele publicar aquí unos días después de que finaliza el incidente. Si tiene más preguntas sobre este incidente, registre un ticket con nosotros a través de la mensajería de ZBot dentro del widget.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
0 comentarios