SOMMAIRE
Pendant cet incident, certains clients Explore dans plusieurs pods et régions ont rencontré des retards et des informations obsolètes dans le jeu de données Tickets d’Explore.
Chronologie
10:38 UTC | 02:38 HEURE DU PACIFIQUE
Après la restauration, toutes les tâches de synchronisation retraitées sont terminées et les synchronisations des données Explore sont revenus à la normale. Cet incident est donc résolu. Nous vous remercions de votre patience pendant notre enquête.
00:18 UTC | 16:18 (HEURE DU PACIFIQUE)
Nous continuons de traiter à nouveau les tâches de synchronisation manuellement pour les clients concernés et fournirons une autre mise à jour lorsque nous aurons des informations conséquentes à partager.
20:58 UTC | 12:58 (HEURE DU PACIFIQUE)
Nous avons terminé l’annulation d’une mise à jour Explore qui avait provoqué le retard des mises à jour du jeu de données Tickets. Nous retraiterons manuellement les tâches de synchronisation. Nous publierons une autre mise à jour lorsque nous aurons de nouvelles informations à partager.
20:11 UTC | 12:11 HEURE DU PACIFIQUE
Nous avons trouvé une cause potentielle des retards et erreurs de synchronisation vus aujourd’hui dans le jeu de données Tickets de certains clients Explore dans une mise à jour récemment publiée. Nous nous efforçons d’annuler cette mise à jour et nous surveillons les résultats. Nous vous ferons part d’autres mises à jour dès que nous aurons de nouveaux résultats à partager.
19:06 UTC | 11H06 (HEURE DU PACIFIQUE)
Nous l’étudions encore sur les problèmes qui provoquent des retards et des erreurs de synchronisation pour le jeu de données Tickets dans Explore dans plusieurs Pods et régions. Nos équipes ont progressé, mais il y a encore des retards pour certains comptes. Nous continuerons de publier les nouvelles informations.
18:10 UTC | 10:10 (HEURE DU PACIFIQUE)
Notre équipe continue d’enquêter sur le problème responsable des retards et des erreurs de synchronisation dans le jeu de données Tickets pour certains clients Explore dans plusieurs Pods et régions. Nous vous fournirons d’autres mises à jour au fil de l’enquête.
17:40 UTC | 9H40 HEURE DU PACIFIQUE
Nous avons confirmé un problème qui provoque des retards et des erreurs de synchronisation dans le jeu de données Tickets d’Explore pour plusieurs Pods et régions. Notre équipe est en train d’enquêter et nous publierons des informations supplémentaires dès que nous en saurons plus.
17:29 UTC | 9H29 HEURE DU PACIFIQUE
Nous étudions les rapports sur les retards de synchronisation Explore dans le jeu de données Tickets dans plusieurs pods et régions. Nous reviendrons vers vous bientôt.
APRÈS LE TEMPS DE
Analyse de la cause
Contexte : Nous avons un système (Explore ETL) qui recueille régulièrement des données pour nos clients. Ce système gère le processus de collecte des données. Les données recueillies sont stockées et traitées. Un problème est survenu lors de la collecte des données pour un compte avec une quantité considérable de données par ticket. Cette quantité importante d'informations saturait la mémoire, ce qui provoquait des erreurs et ralentissait le traitement des données.
En outre, une mise à niveau de maintenance du serveur récente a changé la façon de s’exécuter le vidage de la mémoire, ce qui a débouché sur une augmentation de la consommation de la mémoire, ce qui a encore accentué le problème.
Résolution
Une fois les problèmes identifiés, nous avons essayé de gérer la surcharge de travail en hiérarchisant les tâches et en redémarrant les serveurs. Après des recherches plus approfondies et avec l’aide d’autres équipes, nous avons identifié le problème de mise à niveau du serveur comme responsable et avons rétabli la version précédente. Le traitement de la tâche est ensuite revenu à la normale.
Éléments de correction
Nous allons donc prendre des mesures pour éviter ce genre d’incidents :
1. Limitez la taille de la charge pour les données de ticket.
2. Réévaluez la mise à niveau de maintenance du serveur, en prenant en compte l’utilisation de la mémoire accrue avec la nouvelle opération de nettoyage des informations.
3. Améliorer notre environnement de test pour imiter la charge de production mieux et tester avec précision des scénarios comme celui-ci.
POUR EN SAVOIR PLUS
Pour des informations sur le statut actuel de votre Zendesk, consultez notre page de statut du système. Le résumé de notre enquête rétrospective est généralement affiché ici quelques jours après la fin de l’incident. Si vous avez d’autres questions au sujet de cet incident, envoyez un ticket via la messagerie ZBot au sein du Web Widget.
Traduction - exonération : cet article a été traduit par un logiciel de traduction automatisée pour permettre une compréhension élémentaire de son contenu. Des efforts raisonnables ont été faits pour fournir une traduction correcte, mais Zendesk ne garantit pas l’exactitude de la traduction.
Si vous avez des questions quant à l’exactitude des informations contenues dans l’article traduit, consultez la version anglaise de l’article, qui représente la version officielle.
0 commentaire