SOMMAIRE
Le 6 mars, de 13h33 UTC à 14h15 UTC, les clients n’ont pas pu charger Explore et ont reçu 502 erreurs de passerelle.
Chronologie
15:02 UTC | 07:02 (HEURE DU PACIFIQUE)
Comme nous avons reçu des confirmations que les clients ne reçoivent plus d’erreurs de serveur quand ils essaient d’accéder à Explore et que notre système ne présente plus d’erreurs, nous considérons cet incident comme résolu. Nous vous remercions de votre patience pendant cette perturbation.
14:24 UTC | 06:24 (HEURE DU PACIFIQUE)
Nous constatons des améliorations du nombre de chargements de pages et obtenons une confirmation qu’Explore est désormais correctement accessible et se charge après une actualisation de la page. Nous vous prions de recharger Explore et de nous contacter si vous rencontrez toujours des problèmes. Nous vous remercions de votre patience et de votre aide.
14:15 UTC | 06:15 (HEURE DU PACIFIQUE)
À ce stade, les clients Explore dans les Pods 17, 18, 28 et 29 devraient être les seuls affectés par les problèmes. Nous continuons de travailler sur le rétablissement de l’accès. Plus de mises à jour dans 30 min ou quand nous aurons plus de détails.
14:04 UTC | 06:04 (HEURE DU PACIFIQUE)
Nous étudions actuellement les problèmes d’Explore qui ne se chargent pas pour les clients dans plusieurs Pods. Une enquête est en cours.
APRÈS LE TEMPS DE
Analyse de la cause
Le 6 mars 2024, les utilisateurs essayant d’accéder à Explore ont rencontré des erreurs dues à un processus lancé pour mettre le système à jour en arrière-plan. Ce processus provoque des problèmes de verrouillage temporaires dans notre base de données, des erreurs pour nos utilisateurs. Le problème a commencé à 13h22 UTC et a été résolu à 14h07 UTC.
Notre équipe d’ingénierie travaillait sur une nouvelle fonctionnalité, conçue pour fournir des statistiques d’utilisation. Pour rendre cette fonctionnalité plus efficace, un nouveau processus a été introduit. Ce processus nécessitait la mise à jour d’un tableau dans notre base de données à chaque accès au tableau de bord, ce qui réduit le nombre de calculs répétés. Le problème est survenu lorsque ce processus a commencé à remplir les enregistrements historiques pour les tableaux de bord existants.
L’incident est essentiellement dû au processus initié pour remplir les enregistrements historiques. Ce processus provoquait des « verrouilleurs » prolongés dans notre base de données, entraînant des dépassements de délai et des erreurs.
Résolution
Une fois les requêtes bloquées résolues et un redémarrage de l’application Rails, les opérations normales d’Explore ont repris.
Éléments de correction
- Examiner le processus de remplacement
- Guide de mise à jour du processus de remplacement
- Traiter les enregistrements dashboard_views de façon asynchrone
POUR EN SAVOIR PLUS
Pour des informations sur le statut actuel de votre Zendesk, consultez notre page de statut du système. Le résumé de notre enquête rétrospective est généralement affiché ici quelques jours après la fin de l’incident. Si vous avez d’autres questions au sujet de cet incident, envoyez un ticket via la messagerie ZBot au sein du Web Widget.
Traduction - exonération : cet article a été traduit par un logiciel de traduction automatisée pour permettre une compréhension élémentaire de son contenu. Des efforts raisonnables ont été faits pour fournir une traduction correcte, mais Zendesk ne garantit pas l’exactitude de la traduction.
Si vous avez des questions quant à l’exactitude des informations contenues dans l’article traduit, consultez la version anglaise de l’article, qui représente la version officielle.