Récapitulatif
Le 23 juillet 2024, de 10 h 58 UTC à 14 h 57 UTC, les clients du Pod 29 ont rencontré des difficultés d’accès aux produits Zendesk (y compris le Centre d’administration) via le panel de produits. Environ 1 % des demandes des clients ont renvoyé une erreur 503 lors de l’accès aux fonctionnalités authentifiées dans Guide, Talk, Chat, Explore et Support, et les clients n’ont pas pu ouvrir la barre de produits Zendesk pour passer d’un produit à un autre. Plusieurs erreurs ont été présentées dans le panel de produits, ainsi que dans la page principale du navigateur Web.
Chronologie
23 juillet 2024 11h48 UTC | 23 juillet 2024 04:48 (heure du Pacifique)
Nous avons conscience des problèmes rencontrés par les clients du Pod 29 qui ne parviennent pas à charger le Centre d’administration et reçoivent l’erreur « La page ne fonctionne pas » et nous travaillons à les résoudre. Les autres produits semblent également indisponibles dans le panel de produits avec « Impossible de charger les produits Zendesk. Réessayez ». Prochaine mise à jour dans 30 minutes, ou quand nous aurons d’autres choses à partager.
23 juillet 2024 12h19 UTC | 23 juillet 2024 5h19 (heure du Pacifique)
Nous continuons de travailler à la résolution des problèmes d’accès liés à plusieurs produits pour les clients utilisant le Pod 29. Nous vous remercions de votre patience.
23 juillet 2024 13h22 UTC | 23 juillet 2024 06:22 (heure du Pacifique)
Nous continuons de travailler sur les solutions possibles pour les problèmes d’accès affectant plusieurs produits pour les clients sur le Pod 29. Merci de votre patience avec nous pendant ce temps.
23 juillet 2024 13h46 UTC | 23 juillet 2024 06:46 (heure du Pacifique)
Nous avons implémenté un correctif potentiel et nous remarquons une baisse du nombre d'erreurs, ainsi que des améliorations lors du chargement des comptes tests dans le Pod 29. Nous vous prions de vider votre cache et vos cookies, puis de réessayer de charger Zendesk.
23 juillet 2024 14h06 UTC | 23 juillet 2024 07h06 (heure du Pacifique)
Bien que nous ayons reçu des confirmations positives, nous continuons de surveiller l’apparition de nouveaux pics d’erreurs. Nous vous remercions de votre patience pendant que nous attendons de marquer ce problème comme complètement résolu.
23 juillet 2024 15h19 UTC | 23 juillet 2024 08h19 (heure du Pacifique)
Nous avons identifié la cause de ce problème et avons annulé la modification pour éviter d’autres problèmes. Après vérifications supplémentaires, nous n’avons pas confirmé d’autres erreurs et marquons cet incident comme complètement résolu.
APRÈS LE TEMPS DE
Analyse de la cause
Cet incident est dû au déploiement de la nouvelle permission de gestion des membres de l’équipe. Cette version permet d’accorder aux agents avec des rôles personnalisés la permission de consulter et de gérer les autres membres de l’équipe et leurs rôles qui leur sont affectés en tant que permission autonome (annonce). Ce déploiement a provoqué une augmentation importante des demandes au service de permissions internes sous-jacent, ce qui a débouché sur une saturation de la capacité de son cluster de bases de données. Par conséquent, le cluster a atteint sa capacité de bande passante réseau maximale, ce qui provoque un échec de réseau entre le cluster et les serveurs d’applications de notre service.
Résolution
Pour résoudre ce problème, notre équipe a initialement augmenté la capacité de l’instance de base de données du service des permissions afin de fournir une récupération à court terme. Une fois la cause de la suppression supprimée, nos ingénieurs ont annulé la modification du code de la fonctionnalité de permissions.
Éléments de correction
- Réduction du trafic réseau à partir des contrôles des permissions [En cours]
- Surveillances et alertes supplémentaires pour détecter les augmentations de trafic
- Enquêter sur la capacité de la base de données du service de permissions [planifié]
Pour en savoir plus
Pour des informations sur le statut actuel de votre Zendesk, consultez notre page de statut du système. Le résumé de notre enquête rétrospective est généralement affiché ici quelques jours après la fin de l’incident. Si vous avez d’autres questions au sujet de cet incident, contactez l’assistance client Zendesk.
Traduction - exonération : cet article a été traduit par un logiciel de traduction automatisée pour permettre une compréhension élémentaire de son contenu. Des efforts raisonnables ont été faits pour fournir une traduction correcte, mais Zendesk ne garantit pas l’exactitude de la traduction.
Si vous avez des questions quant à l’exactitude des informations contenues dans l’article traduit, consultez la version anglaise de l’article, qui représente la version officielle.