RESUMEN
El 11 de marzo de 2025, de 5:50 UTC a 23:18 UTC, los clientes de Talk en todos los pods experimentaron índices elevados de llamadas interrumpidas.
CRONOGRAMA
11 de marzo de 2025 23:26 UTC | 11 de marzo de 2025 04:26 p.m. PT
Nos complace informar que el problema de llamadas interrumpidas intermitentes en Talk ya está resuelto. Gracias por su paciencia mientras trabajábamos con nuestro proveedor en este asunto.
11 de marzo de 2025 03:22 p.m. UTC | 11 de marzo de 2025 08:22 a.m. PT
Estamos monitoreando la situación con nuestro socio de telefonía y, lamentablemente, estamos viendo picos intermitentes en las caídas de llamadas. Nos disculpamos por la molestia. Tenga la seguridad de que seguiremos monitoreando la situación y actualizaremos a medida que sepamos más.
11 de marzo de 2025 09:23 a.m. UTC | 11 de marzo de 2025 02:23 a.m. PT
Nos complace informarle que nuestro socio de Talk ha confirmado que los problemas con las llamadas interrumpidas se han resuelto por completo a las 08:46 UTC.
11 de marzo de 2025 07:32 a.m. UTC | 11 de marzo de 2025 12:32 a.m. PT
Nuestro socio de Talk ha resuelto el problema que podría causar llamadas interrumpidas para nuestros clientes. Continuaremos monitoreando la situación y le proporcionaremos más actualizaciones a medida que estén disponibles.
11 de marzo de 2025 06:59 a.m. UTC | 10 de marzo de 2025 11:59 p.m. PT
Nuestro proveedor de servicios ha informado índices elevados de llamadas abandonadas en Talk en todos los pods. Han implementado una corrección y están monitoreando la recuperación completa. Proporcionaremos la próxima actualización cuando tengamos más para compartir.
POST-MORTEM
Análisis de causa raíz
Este incidente fue causado por un problema de falta de memoria en un servicio ascendente, lo que desencadenó una falla en cascada. Los breves tiempos de espera iniciales se convirtieron en errores significativos, lo que provocó una investigación por parte de los ingenieros de nuestro socio de Talk.
Resolución
Para solucionar este problema, los ingenieros de nuestro socio de Talk implementaron medidas correctivas, como el reemplazo de los hosts afectados y la reversión de las funciones beta que dependían del servicio upstream problemático. Estas acciones ayudaron a restaurar el servicio normal y mitigar el impacto en los clientes.
Elementos de corrección
- Mejore los sistemas de monitoreo y alerta para detectar problemas de servicio upstream de manera más eficaz.
- Mejorar la resiliencia de la plataforma para evitar fallas en cascada en el futuro.
- Realice una revisión exhaustiva de las dependencias en los servicios upstream para identificar los riesgos potenciales.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de Zendesk y los impactos específicos en su cuenta, visite nuestra página de estado del sistema. Puede seguir este artículo para recibir una notificación cuando se publique nuestro informe post-mortem. Si tiene más preguntas sobre este incidente, comuníquese con soporte al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.