RESUMEN
El 2 de mayo de 2024, de 13:35 UTC a 14:25 UTC, algunos clientes tuvieron dificultades para usar los servicios de Zendesk. Estos incluían un rendimiento lento y errores internos ocasionales del servidor al intentar acceder a nuestros productos en varios pods. Durante este tiempo, el impacto fue particularmente significativo para los clientes del pod 23, donde los usuarios podrían haber experimentado demoras o problemas al usar la interfaz de agente de Support, la mensajería de Sunshine Conversations, Chat, Talk, Explore, Sell y Guide. Además, hubo un impacto más amplio en los servicios de mensajería en todos los pods.
Cronograma
02 de mayo de 2024 02:20 p.m. UTC | 2 de mayo de 2024 07:20 a.m. PT
Actualmente estamos investigando varios problemas con Sunshine Conversations, AW Messaging y otros productos para clientes en varios pods. Próximamente más actualizaciones.
02 de mayo de 2024 02:35 p.m. UTC | 2 de mayo de 2024 07:35 a.m. PT
Estamos trabajando activamente para abordar la lentitud general y los errores internos del servidor que afectan a varios productos debido a este incidente de servicio en curso, que afecta a los clientes en todos los pods. Agradecemos su paciencia. Próxima actualización en 30 min.
02 de mayo de 2024 02:50 p.m. UTC | 2 de mayo de 2024 07:50 a.m. PT
Hemos implementado una solución para el problema y estamos observando mejoras en los registros. Ahora se debe restaurar el acceso a todos los productos. Asegúrese de actualizar el navegador y borre la memoria caché y las cookies si es necesario. Gracias por su paciencia.
02 de mayo de 2024 03:30 p.m. UTC | 2 de mayo de 2024 08:30 a.m. PT
Hemos estado monitoreando este incidente y ya no vemos problemas relacionados con él después de que se implementó la corrección. Estamos marcando esto como totalmente resuelto ahora.
POST-MORTEM
Análisis de causa raíz
El problema se debió a un error en el proceso de actualización de nuestro servicio que provocó que algunas partes de nuestra infraestructura no estuvieran listas para manejar el tráfico, lo que resultó en una capacidad reducida.
Resolución
Para solucionar este problema, nuestros ingenieros desviaron el tráfico interno para evitar la infraestructura afectada, lo que nos permitió restaurar el servicio completo a las 14:25 UTC.
Elementos de corrección
- Mejorar nuestro proceso de actualización de la infraestructura para garantizar que los problemas se detecten y aborden antes de que afecten a los clientes.
- Mejorar la capacidad de nuestro sistema para manejar el tráfico durante las actualizaciones de rutina.
- Agregue nuevas comprobaciones para monitorear el estado de nuestros servicios de manera más eficaz.
- Trabajar para mejorar la coordinación entre los distintos componentes de nuestra infraestructura de servicio.
- Revise el impacto en todos los servicios para comprender por qué se vieron afectados y para evitar problemas similares en el futuro.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de su cuenta de Zendesk, consulte nuestra página de estado del sistema. El resumen de la investigación post-mortem se suele publicar aquí unos días después de que finaliza el incidente. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.