요약
2025년 2월 6일 18:00(UTC)부터 2월 7일 10:25(UTC)까지 일부 미국 Explore 고객의 경우 Explore 대시보드 데이터가 지연되는 문제가 발생했습니다.
타임라인
2025년 2월 7일 오전 11:12(UTC) | 2025년 2월 7일 오전 3시 12분(태평양 표준시)
10:25(UTC) 현재 Explore 대시보드의 문제가 해결되었음을 알려드리게 되어 기쁩니다. 양해해 주셔서 감사합니다!
2025년 2월 7일 오전 10:54(UTC) | 2025년 2월 7일 오전 2시 54분(태평양 표준시)
어제 20:00(UTC) 이후 현재 Explore 대시보드에서 지연이 발생하고 있습니다. Zendesk 엔지니어링 팀에서 문제를 파악하여 수정 사항을 적용했습니다. 원활한 사용 환경을 위해 상황을 적극적으로 모니터링하고 있습니다. 기다려 주셔서 감사합니다!
사후
근본 원인 분석
이 인시던트는 새로운 데이터 내보내기 서비스를 사용한 대량 데이터 내보내기로 트리거된 처리 클러스터의 용량 부족으로 인해 발생했습니다. 쿼리를 실행하는 데 시간이 너무 오래 걸려 여러 번 재시도하여 동일한 문제가 있는 쿼리가 3번 동시에 실행되었습니다. 이러한 쿼리는 쿼리를 시작한 서비스가 중지된 후에도 계속 실행되어 CPU 사용량이 급증했습니다.
해결
이 문제를 해결하기 위해 팀은 처리 중인 클러스터를 수동으로 다시 시작하여 중단된 쿼리를 종료하고 클러스터를 정상 운영 능력으로 되돌렸습니다. 이 작업으로 클러스터가 다른 쿼리를 효과적으로 처리할 수 있는 능력을 복원했습니다.
수정 항목
- 쿼리 시간 제한 구현: 너무 긴 실행이 시스템 성능에 영향을 미치지 않도록 내보내기 쿼리에 시간 제한을 설정하세요.
- 모니터링 개선: 모니터링 시스템을 개선하여 높은 CPU 사용량에 대한 알림을 더 눈에 잘 띄고 민감하게 트리거하여 잠재적인 문제에 더 신속하게 대응할 수 있습니다.
- 쿼리 검토 및 최적화: 데이터 내보내기와 연결된 모든 쿼리를 검토하여 성능에 문제가 되는 OR 조건과 함께 JOIN 절을 사용하는 쿼리를 식별하고 최적화하세요.
자세한 정보
Zendesk에 대한 현재 시스템 상태 정보와 계정에 미치는 구체적인 영향은시스템 상태 페이지를참조하세요. 이 문서에 따라 사후 보고서가 게시될 때 알림을 받을 수 있습니다. 이 인시던트에 대한 추가 질문이 있으면Zendesk 고객 지원팀에 문의하세요.
번역 고지 사항: 본 문서는 콘텐츠에 대한 기본적인 이해를 제공하기 위해 자동 번역 소프트웨어를 사용하여 번역되었습니다. 정확한 번역을 제공하고자 합당한 노력을 기울였으나 Zendesk는 번역의 정확성을 보장하지 않습니다.
번역된 문서에 포함된 정보의 정확성과 관련하여 질문이 있으시면 문서의 공식 버전인 영문 버전을 참조하시기 바랍니다.
댓글 0개