RESUMEN
El 13 de enero de 2025 de 11:07 UTC a 12:07 UTC, los clientes del pod 17 experimentaron problemas con los disparadores de mensajería que no se ejecutaban.
CRONOGRAMA
13 de enero de 2025 12:24 p.m. UTC | 13 de enero de 2025 04:24 a.m. PT
El problema reciente de mensajería se ha resuelto por completo y nuestros servicios han vuelto a funcionar por completo. Gracias por su paciencia durante este tiempo. Nuestro equipo seguirá monitoreando de cerca nuestros sistemas para garantizar que todo funcione sin problemas. Agradecemos su apoyo y estamos aquí para cualquier pregunta o comentario que pueda tener.
13 de enero de 2025 11:51 a.m. UTC | 13 de enero de 2025 03:51 a.m. PT
Estamos investigando problemas con la ejecución de disparadores de mensajería para nuestros clientes en POD17.
POST-MORTEM
Análisis de causa raíz
Este incidente fue causado por las terminaciones prematuras de los consumidores para el servicio de eventos de registro de tickets de mensajería, que ocurrieron mientras el servicio aún estaba en ejecución. Como resultado, los consumidores no pudieron procesar los eventos entrantes, lo que detuvo por completo la evaluación y la ejecución de los disparadores de mensajería en el pod 17.
Resolución
Para resolver este problema, identificamos el error de configuración que establecía el número máximo de registros que se podían procesar en un solo lote en 500 en lugar de los 250 previstos. Al corregir este error tipográfico y reducir el valor máximo de registros, nuestro objetivo era disminuir la probabilidad de que los clientes terminaran debido a problemas de tiempo de espera.
Elementos de corrección
- Implemente una verificación de estado para detectar las terminaciones prematuras de los consumidores.
- Cree un monitor para hacer seguimiento del número de consumidores activos.
- Establecer un monitor para monitorear las particiones detenidas para el consumidor de eventos del registro de tickets de Tessaging.
- Agregue un widget de estado de retraso del consumidor al panel Servicio de disparadores de mensajería.
- Cree una nueva métrica para medir el tiempo que se tarda en procesar un lote de mensajes del tema Eventos del registro de tickets de mensajería.
Estas correcciones están diseñadas para mejorar el monitoreo y evitar incidentes similares en el futuro, lo que garantiza la estabilidad y confiabilidad del servicio Messaging Trigger.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de Zendesk y los impactos específicos en su cuenta, visite nuestra página de estado del sistema. Puede seguir este artículo para recibir una notificación cuando se publique nuestro informe post-mortem. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
0 comentarios