Incidente de servicio - 1 de febrero de 2025 - Pod 26 | Support - Problemas de acceso para tickets archivados

RESUMEN

El 1 de febrero de 2025, de 00:13 UTC a 00:59 UTC, los clientes del POD 26 tuvieron problemas para acceder a los tickets archivados. Durante este tiempo, varios nodos lectores de bases de datos no pudieron abrir una tabla debido a un defecto en el sistema de la base de datos. Esto resultó en consultas fallidas para los tickets archivados.

CRONOGRAMA

1 de febrero de 2025 01:13 a.m. UTC | 31 de enero de 2025 05:13 p.m. PT
Nos complace informar que el problema que causaba errores que afectaban a un grupo de nuestros clientes de Support en el POD 26 ya ha sido resuelto. Gracias por su paciencia durante nuestra investigación.

1 de febrero de 2025 12:57 a.m. UTC | 31 de enero de 2025 04:57 p.m. PT
Nuestros ingenieros creen que han identificado la causa raíz de los errores que afectan a un grupo de nuestros clientes de Support en el POD 26 y están trabajando para resolver el problema.

1 de febrero de 2025 12:57 a.m. UTC | 31 de enero de 2025 04:57 p.m. PT
Estamos investigando posibles errores para nuestros clientes de Support alojados en el POD 26.

POST-MORTEM

Análisis de causa raíz

Este incidente fue causado por un defecto en el sistema de la base de datos que impedía que los nodos lectores del clúster accedieran a una tabla de tickets archivados. El defecto fue confirmado por el soporte técnico de nuestro proveedor y era específico de la versión de la base de datos instalada en ese momento.

Resolución

Para resolver este problema, nuestros ingenieros detuvieron una implementación en otros fragmentos y permitieron que las modificaciones en curso se completaran en los fragmentos afectados. En ese momento, se podía acceder a la tabla de la base de datos. Posteriormente, el equipo planea actualizar a una nueva versión de nuestro sistema de base de datos, que incluye un parche para el defecto identificado.

Elementos de corrección

Actualice a la versión con parches o una versión posterior antes de reanudar los cambios de esquema.
Divida las adiciones de columnas y las eliminaciones de índices en acciones separadas para minimizar el riesgo durante las implementaciones.
Actualice el run-book para exigir que las migraciones grandes lleguen solo a un clúster inicialmente antes de expandirse a otros.
Implemente un proceso de revisión regular (por lo menos una vez al año) de los parches del sistema de base de datos y establezca un ritmo de actualización.

PARA MÁS INFORMACIÓN

Si desea información sobre el estado actual del sistema de Zendesk y los impactos específicos en su cuenta, visite nuestra página de estado del sistema. Puede seguir este artículo para recibir una notificación cuando se publique nuestro informe post-mortem. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.

Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.

Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.