Resumen
Desde el 7 de octubre de 2024 a las 22:30 UTC hasta el 8 de octubre de 2024 a las 06:00 UTC, algunos clientes que usaban los bots de Ultimate no pudieron crear tickets. Esto afectó las conversaciones de mensajería con los usuarios finales.
Cronograma
8 de octubre de 2024 03:52 a.m. UTC | 7 de octubre de 2024 08:52 p.m. PT
Nuestros equipos de ingeniería están al tanto de los problemas experimentados por un pequeño subconjunto de clientes que usan los bots de chat de Ultimate en las últimas 5 horas. Debido a algunas complejidades, las investigaciones han sido lentas. Proporcionaremos otra actualización en 2 horas. Gracias por su paciencia mientras resolvemos este problema.
8 de octubre de 2024 05:52 a.m. UTC | 7 de octubre de 2024 10:52 p.m. PT
Nuestro equipo de ingeniería ha identificado la causa raíz del problema que afecta a algunos bots de chat de Ultimate. Actualmente estamos probando algunas opciones para solucionar este problema. Esta será la última actualización publicada en la página de estado de Zendesk. Consulte la página de estado de Ultimate para ver actualizaciones futuras: https://status.ultimate.ai/incidents/hkttfhfgrplq.
Análisis de causa raíz
El incidente se debió a que la memoria caché de Redis para Sunshine Automation alcanzó su límite de memoria. Redis, que actúa como un caché para almacenar los datos a los que se accede con frecuencia, experimentó un uso excesivo de la memoria debido a la caducidad incorrecta de la clave, lo que impidió que los bots integrados con Sunshine Automation procesaran los mensajes de manera efectiva. Nuestros sistemas de alerta no notificaron al equipo de guardia, lo que retrasó el inicio de la investigación hasta alrededor de las 05:00 UTC. Después de la investigación, el equipo aumentó la memoria de Redis y resolvió el incidente a las 06:00 UTC. Como seguimiento, abordaremos el problema de vencimiento de la clave de Redis y mejoraremos nuestro sistema de alertas para el uso de la memoria de Redis para garantizar tiempos de respuesta más rápidos en el futuro.
Elementos de corrección
- Abordar el problema de vencimiento de la clave de Redis
- Mejorar el monitoreo y las alertas del uso de la memoria de Redis
- Actualizar los procesos internos de derivación para mejorar los tiempos de respuesta a incidentes de Ultimate bot
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de su cuenta de Zendesk, consulte nuestra página de estado del sistema. El resumen de la investigación post-mortem se suele publicar aquí unos días después de que finaliza el incidente. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
0 comentarios