Búsquedas recientes
No hay búsquedas recientes

Dan Beirouty
Incorporación 14 abr 2021
·
Última actividad 07 ene 2025
Seguimientos
0
Seguidores
6
Actividad total
218
Votos
14
Suscripciones
161
RESUMEN DE LA ACTIVIDAD
INSIGNIAS
ARTÍCULOS
PUBLICACIONES
COMENTARIOS DE LA COMUNIDAD
COMENTARIOS DE ARTÍCULOS
RESUMEN DE LA ACTIVIDAD
Última actividad de Dan Beirouty
Dan Beirouty hizo un comentario,
Postmortem published January 7, 2025.
Ver comentario · Publicado 07 ene 2025 · Dan Beirouty
0
Seguidores
0
Votos
0
Comentarios
Dan Beirouty hizo un comentario,
Post-mortem published December 19, 2024.
Ver comentario · Publicado 19 dic 2024 · Dan Beirouty
0
Seguidores
0
Votos
0
Comentarios
Dan Beirouty creó un artículo,
RESUMEN
El 16 de diciembre de 2024, de 1:16 UTC a 4:44 UTC, algunos clientes de Tymeshift y Workforce Management experimentaron errores y problemas de acceso.
CRONOGRAMA
16 de diciembre de 2024 05:25 a.m. UTC | 15 de diciembre de 2024 09:25 p.m. PT
Nos complace informar que el problema de acceso a Tymeshift y Workforce Management ya está resuelto. Gracias por su paciencia mientras resolvíamos este problema hoy.
16 de diciembre de 2024 04:51 a.m. UTC | 15 de diciembre de 2024 08:51 p.m. PT
Hemos identificado la posible causa del problema que afecta a Tymeshift / Workforce Management y hemos implementado una solución. Actualmente estamos monitoreando nuestros sistemas para la recuperación. Si tiene un ticket con nuestro equipo de soporte, responda al ticket para informar cualquier mejora que pueda estar observando.
16 de diciembre de 2024 03:44 a.m. UTC | 15 de diciembre de 2024 07:44 p.m. PT
Seguimos investigando los errores de acceso que afectan a Tymeshift y Workforce Management en varios pods. Proporcionaremos la próxima actualización cuando tengamos nueva información para compartir. Gracias por su paciencia mientras resolvemos este problema.
16 de diciembre de 2024 03:01 a.m. UTC | 15 de diciembre de 2024 07:01 p.m. PT
Hemos recibido informes de errores y problemas de acceso en Tymeshift y Workforce Management. Nuestro equipo está investigando este asunto con máxima prioridad. Próximamente habrá más información.
POST-MORTEM
Análisis de causa raíz
La causa raíz del incidente se identificó como una falla al cerrar o desasignar correctamente las declaraciones preparadas en un servicio interno. En casos específicos, que aún están bajo investigación, las declaraciones preparadas se acumularon hasta el punto en que la base de datos llegó a su límite, lo que provocó que dejara de responder.
Resolución
Para resolver el incidente, el equipo implementó una solución temporal al programar redespliegues diarios del servicio afectado para evitar que el problema se repitiera hasta que se pudiera implementar una solución permanente. Este enfoque permitió que el sistema recuperara la funcionalidad mientras se realizaba una investigación exhaustiva de la causa raíz.
Elementos de corrección
- Investigar declaraciones preparadas: Realice una investigación detallada para determinar por qué las declaraciones preparadas no se cerraron o desasignaron correctamente e implemente una corrección.
- Implementar monitoreo y alertas: Desarrolle e implemente monitores y alertas para detectar cuándo el número de declaraciones preparadas se acerca al límite.
- Revisar los umbrales del monitor de errores: Revise y ajuste los umbrales para el monitoreo de errores para garantizar la detección oportuna de problemas similares en el futuro.
- Prevent Recurrence: Programe redespliegues diarios del servicio hasta que se implemente una solución permanente para evitar que el problema vuelva a ocurrir.
- Aumentar asignación de recursos: Aumente la asignación de CPU y memoria para la instancia de producción US1 Tymeapp TymeShift para manejar cargas más altas.
Medidas preventivas
Para evitar incidentes similares en el futuro, haremos lo siguiente:
- Mejore las revisiones de código para garantizar una administración adecuada de las declaraciones preparadas.
- Implemente sistemas de monitoreo sólidos que puedan detectar y alertar al equipo sobre posibles problemas antes de que provoquen interrupciones del servicio.
- Realizar auditorías periódicas del rendimiento de la base de datos y la utilización de los recursos.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de Zendesk y los impactos específicos en su cuenta, visite nuestra página de estado del sistema. Puede seguir este artículo para recibir una notificación cuando se publique nuestro informe post-mortem. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
Editado 20 dic 2024 · Dan Beirouty
0
Seguidores
1
Voto
0
Comentarios
Dan Beirouty creó un artículo,
RESUMEN
El 11 de diciembre de 2024 desde las 23:39 UTC hasta las 6:30 UTC del 12 de diciembre, los clientes que usaban las funciones de IA de Zendesk como IA avanzada, Talk, agentes de IA y otras funciones de IA generativa experimentaron interrupciones en la funcionalidad debido a una interrupción del servicio del proveedor de servicios.
CRONOGRAMA
12 de diciembre de 2024 04:05 a.m. UTC | 11 de diciembre de 2024 08:05 p.m. PT
Estamos observando la recuperación de todas las funciones de IA y seguimos monitoreando nuestros sistemas para una recuperación completa. Esperamos proporcionar una actualización final cuando los sistemas estén completamente estables.
12 de diciembre de 2024 01:53 a.m. UTC | 11 de diciembre de 2024 05:53 p.m. PT
Nuestro equipo ha estado trabajando con nuestro proveedor de servicios en un problema que afecta las funciones de IA de Zendesk. El impacto puede ser visible a través de IA avanzada, Talk, agentes de IA y otras funciones de IA generativa. Debido a que los intentos iniciales no lograron resolver el problema, los equipos continúan trabajando con la máxima prioridad para resolver este problema. Enviaremos actualizaciones cuando estén disponibles.
POST-MORTEM
Análisis de causa raíz
La causa raíz del incidente fue una nueva configuración para un servicio de telemetría que inesperadamente generó una carga masiva en la API de un proveedor de servicios en clústeres grandes. Esta carga excesiva abrumó e interrumpió el descubrimiento de servicios basado en DNS, lo que provocó fallas en las solicitudes a los servicios de nuestro proveedor.
Resolución
El incidente se resolvió una vez que el proveedor de servicios identificó el problema e implementó medidas correctivas para aliviar la carga en la API. Zendesk se mantuvo en comunicación con nuestro proveedor de servicios durante todo el incidente para garantizar una respuesta coordinada.
Elementos de corrección
- Acuerdo de nivel de soporte con equipos de servicio de LLM: Trabaje con los clientes internos para comprender sus expectativas de rendimiento y disponibilidad, lo que ayudará a proponer estrategias alternativas y ajustar los umbrales de monitoreo.
- Estrategias alternativas para las funciones de IA generativa : Desarrolle estrategias alternativas para las funciones de GenAI, lo que implicará agregar funciones a los sistemas proxy y colaborar con los propietarios de las funciones para determinar las mejores estrategias para sus respectivos casos.
- Soporte Premium de nuestro proveedor de servicios: Negociar soporte adicional del proveedor de servicios para garantizar una resolución y asistencia más rápidas durante los incidentes.
Medidas preventivas
Para evitar incidentes similares en el futuro, se tomarán las siguientes medidas:
- Mejorar los sistemas de monitoreo y alerta para detectar mejor las cargas anormales en la API.
- Establezca canales de comunicación más claros y acuerdos de soporte con nuestro proveedor de servicios para garantizar una respuesta rápida durante los incidentes.
- Implemente estrategias alternativas para las funciones críticas de IA para mantener la disponibilidad del servicio incluso durante las interrupciones del proveedor.
PARA MÁS INFORMACIÓN
Si desea información sobre el estado actual del sistema de Zendesk y los impactos específicos en su cuenta, visite nuestra página de estado del sistema. Puede seguir este artículo para recibir una notificación cuando se publique nuestro informe post-mortem. Si tiene más preguntas sobre este incidente, comuníquese con Atención al cliente de Zendesk.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
Editado 20 dic 2024 · Dan Beirouty
0
Seguidores
1
Voto
0
Comentarios
Dan Beirouty hizo un comentario,
Post-mortem published November 21. 2024.
Ver comentario · Publicado 21 nov 2024 · Dan Beirouty
0
Seguidores
0
Votos
0
Comentarios
Dan Beirouty hizo un comentario,
Post-mortem published November 18, 2024.
Ver comentario · Publicado 18 nov 2024 · Dan Beirouty
0
Seguidores
0
Votos
0
Comentarios
Dan Beirouty hizo un comentario,
Post-mortem published November 14, 2024.
Ver comentario · Publicado 14 nov 2024 · Dan Beirouty
0
Seguidores
0
Votos
0
Comentarios
Dan Beirouty hizo un comentario,
Post-mortem published November 1, 2024.
Ver comentario · Publicado 01 nov 2024 · Dan Beirouty
0
Seguidores
0
Votos
0
Comentarios
Dan Beirouty creó un artículo,
Zendesk realizará un mantenimiento crítico que afectará el rendimiento de los clientes que usan las integraciones de Zendesk con Twitter en todos los pods el jueves 14 de noviembre de 2024, en los horarios que se detallan a continuación.
Productos afectados: Integración de Twitter y canal de Mensaje directo de Twitter de Sunshine Conversations
Fecha |
Hora de inicio |
Hora de finalización |
|
14 de noviembre de 2024 |
Todo |
21:00 UTC / |
05:00 UTC (15 de noviembre) / |
Comportamiento esperado
Las siguientes funciones no estarán disponibles durante el periodo de mantenimiento:
- Mensajes directos de Twitter
- Publicaciones y comentarios de Twitter
- Los administradores no pueden agregar ni administrar cuentas de Twitter existentes.
- El disparador configurado con la acción de destino de Twitter no publicará mensajes en Twitter.
No se recibirán comentarios, publicaciones ni mensajes directos de Twitter durante el periodo de mantenimiento, y los administradores tampoco podrán actualizar ni agregar cuentas de Twitter en Zendesk.
Una vez finalizado el periodo de mantenimiento, Zendesk obtendrá todas las publicaciones y mensajes durante el periodo de mantenimiento y los transferirá a las cuentas.
La ventana de tráfico más bajo para los clientes ha sido elegida para este ejercicio y no se puede cambiar ni especificar. Agradecemos su comprensión.
Por qué estamos haciendo esto: El equipo de integraciones de Zendesk está haciendo cambios para mejorar la seguridad de la integración de Twitter.
Descargo de responsabilidad de la traducción: Este artículo ha sido traducido usando software de traducción automática para proporcionar una idea básica del contenido. Se han realizado esfuerzos razonables para proporcionar una traducción exacta, sin embargo, Zendesk no garantiza la exactitud de la traducción.
Si surge alguna pregunta relacionada con la exactitud de la información incluida en el artículo traducido, consulte la versión en inglés del artículo, que es la versión oficial.
Editado 31 oct 2024 · Dan Beirouty
0
Seguidores
1
Voto
0
Comentarios
Dan Beirouty hizo un comentario,
Post-mortem published October 25, 2024.
Ver comentario · Publicado 25 oct 2024 · Dan Beirouty
0
Seguidores
0
Votos
0
Comentarios