SOMMAIRE
Le 02 juillet 2024, de 8h10 UTC à 16h30 UTC, les clients des Pods 17 et 18 ont rencontré un problème : le bouton « Accepter le chat » ne répondait pas. Le problème s’est ensuite essaimé et les clients de plusieurs autres Pods ont rencontré une erreur « Impossible de se connecter au serveur » quand ils ont essayé d’ouvrir un ticket. Cela perturbait considérablement les capacités de communication et de gestion des tâches au sein de l’espace de travail d’agent.
Chronologie
02 juillet 2024 12h12 UTC | 02 juillet 2024 5h12 (heure du Pacifique)
Nous sommes en train d’enquêter sur le bouton d’acceptation de chat pour certains clients des Pods 17 et 18. Nous effectuerons une autre mise à jour lorsque nous aurons plus d’informations.
02 juillet 2024 14h01 UTC | 02 juillet 2024 07h01 (heure du Pacifique)
Nous traitons actuellement différents problèmes de Chat/Messagerie/Espace de travail d’agent et continuons d’enquêter sur tous les problèmes. Nous vous remercions de votre patience.
02 juillet 2024 14h51 UTC | 02 juillet 2024 07h51 (heure du Pacifique)
Nous continuons de traiter les problèmes affectant l’acceptation de Chat et de messagerie dans l’espace de travail d’agent pour les clients des Pods 17 et 18 qui rencontrent le bouton Accepter de Chat qui ne fonctionne pas. Nous travaillons sur des solutions et testons des options pour résoudre complètement ce problème.
02 juillet 2024 15h28 UTC | 02 juillet 2024 08h28 (heure du Pacifique)
Nous cherchons toujours la cause du problème qui empêche les clients utilisant les Pods 17 et 18 d’utiliser le bouton « Accepter le chat » et qui empêche l’acceptation de Chat et de la messagerie dans l’espace de travail d’agent. Nous publierons des informations supplémentaires dans une heure ou lorsque nous aurons de nouvelles informations à partager.
02 juillet 2024 16h28 UTC | 02 juillet 2024 09:28 (heure du Pacifique)
Notre équipe continue d’enquêter sur le problème qui empêche les clients des Pods 17 et 18 d’utiliser le bouton « Accepter le chat » afin d’empêcher l’acceptation de Chat et de la messagerie dans l’espace de travail d’agent. Nous vous ferons part d’autres mises à jour dans une heure ou quand nous aurons de nouvelles informations à partager.
02 juillet 2024 17h48 UTC | 02 juillet 2024 10h48 (heure du Pacifique)
Nous avons augmenté la capacité des services de messagerie dans les Pods 17 et 18 et surveillons de suite à tout impact supplémentaire. Notre équipe veillera à ce qu’il n’y ait plus de problèmes lors de l’acceptation des chats et nous fournirons des mises à jour supplémentaires au fur et à mesure de la récupération. Merci de nous prévenir si vous rencontrez toujours des problèmes pour accepter les chats.
03 juillet 2024 05h05 UTC | 02 juillet 2024 22h05 (heure du Pacifique)
Après un contrôle approfondi, nous avons confirmation que le problème affectant l’acceptation de Chat et de Messagerie a été résolu. Nous vous remercions de votre patience jusqu’à ce que nous arrivions à ce stade.
APRÈS LE TEMPS DE
Analyse de la cause
Lors d’une mise à niveau vers notre système de stockage mis à jour, nous avons rencontré des problèmes de performances inattendus, se traduire par un retard dans la livraison des mises à jour. Ces difficultés étaient en grande partie dues à des problèmes de traitement des requêtes pour les cycles de vie de la connexion et des abonnements, qui produisaient des blocages dans les systèmes de stockage et des transactions bloquées. Ces complications ont nui aux performances de notre composante système, chargée de gérer les données et de fournir les mises à jour de l’interface utilisateur en temps réel. Quand nous avons essayé d’optimiser notre processus en nous concentrant uniquement sur la mise à jour du système de stockage, une hausse inattendue de la consommation de puissance de traitement a mis nos ressources à l’épreuve.
Résolution
Pour résoudre ce problème, nous avons implémenté une approche à plusieurs facteurs. Nous avons augmenté la taille des clusters de bases de données pour tous les Pods et avons identifié que les verrouillages de base de données et les transactions bloquées étaient à l’origine des problèmes de performances. En réponse, nous avons appliqué un correctif rapide pour éliminer ces verrous, alors qu’ils pouvaient déboucher sur des objets de base de données orphelins. Enfin, nous avons procédé à un rétablissement progressif, ce qui a débouché sur une stabilité du service d’abonnement.
Éléments de correction
- La suppression des verrouillages de base de données et le nettoyage des abonnements orphelins sont terminés.
- D’autres mesures incluent l’ajout d’objectifs de niveau de service (SLO) pour les points de terminaison de création de connexion et d’abonnement. Cela permet de surveiller et de garantir des performances système fiables à l’avenir.
- Discussion sur le temps d’incorporation dans le premier pod de production après le pod canari pour repérer les problèmes similaires plus tôt.
- Pour garantir un fonctionnement optimal du système, nous vous conseillons d’adopter des tests de chargement et des pratiques de maintenance impliquant le nettoyage et la régénération de clusters.
POUR EN SAVOIR PLUS
Pour des informations sur le statut actuel de votre Zendesk, consultez notre page de statut du système. Le résumé de notre enquête rétrospective est généralement affiché ici quelques jours après la fin de l’incident. Si vous avez d’autres questions au sujet de cet incident, contactez l’assistance client Zendesk.
Traduction - exonération : cet article a été traduit par un logiciel de traduction automatisée pour permettre une compréhension élémentaire de son contenu. Des efforts raisonnables ont été faits pour fournir une traduction correcte, mais Zendesk ne garantit pas l’exactitude de la traduction.
Si vous avez des questions quant à l’exactitude des informations contenues dans l’article traduit, consultez la version anglaise de l’article, qui représente la version officielle.
0 commentaire