RESUMEN
El 7 de agosto de 2024, de 20:48 UTC a 23:27 UTC, los clientes de Support en todos los pods experimentaron problemas con las visualizaciones de tickets, incluidos los tickets resueltos que no desaparecían, actualizaciones lentas y números incorrectos que se mostraban.
Cronograma
7 de agosto de 2024 22:00 UTC | 7 de agosto de 2024 03:00 p.m. PT
Estamos investigando informes de que las vistas de tickets de Support no se actualizan o muestran tickets incorrectos. Próxima actualización en 30 minutos o cuando tengamos nueva información para compartir.
7 de agosto de 2024 22:08 UTC | 7 de agosto de 2024 03:08 p.m. PT
Nuestros ingenieros han hecho un cambio y ahora estamos viendo mejoras en el rendimiento en todos los pods. Próxima actualización en 30 minutos o cuando tengamos nueva información para compartir.
7 de agosto de 2024 22:24 UTC | 7 de agosto de 2024 03:24 p.m. PT
El rendimiento sigue siendo estable en todos los pods y seguiremos monitoreando el rendimiento durante la próxima hora. Próxima actualización en una hora.
7 de agosto de 2024 23:29 UTC | 7 de agosto de 2024 04:29 p.m. PT
Después de un monitoreo continuo, observamos estabilidad y tenemos confirmación de que el problema que afectaba a las vistas de tickets de Support que no se actualizaban ha sido resuelto. Gracias por su paciencia mientras llegamos a este punto.
POST-MORTEM
Análisis de causa raíz
Este incidente fue causado por una interrupción del proceso durante un cambio de clúster azul/verde, específicamente debido a una implementación incompleta que provocó errores de configuración en los pods de producción restantes.
Resolución
Para solucionar este problema, el equipo de ingeniería amplió manualmente los indexadores en el clúster activo para procesar las actualizaciones de tickets acumuladas. Luego reanudaron el procedimiento de cambio de clúster con la configuración correcta.
Elementos de corrección
- Es necesario revisar el proceso que se usa para el cambio de clúster para asegurarse de que incluya verificaciones exhaustivas posteriores a la implementación para evitar que las implementaciones incompletas pasen desapercibidas.
- Desarrolle la automatización para manejar el proceso de cambio de clúster, reduciendo la necesidad de intervención manual y minimizando las posibilidades de error humano.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de su cuenta de Zendesk, consulte nuestra página de estado del sistema. El resumen de la investigación post-mortem se suele publicar aquí unos días después de que finaliza el incidente. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.