요약
2024년 7월 2일 18:20~18:44(UTC)에 예기치 않은 트래픽 증가로 인해 Sunshine Conversations 서비스에 높은 지연 시간이 발생했습니다. 이로 인해 시스템 속도가 느려지고 메시지 처리가 지연되었습니다.
일정
2024년 7월 2일 오후 10:12(UTC) | 2024년 7월 2일 오후 3:12(태평양 표준시)
Pod 13의 Answer Bot 성능에 영향을 미치는 문제가 이제 완전히 해결되었습니다. 문제가 계속 발생하면 알려주세요.
2024년 7월 2일 오후 9시 07분(UTC) | 2024년 7월 2일 오후 2:07(태평양 표준시)
Pod 13에서 Answer Bot 성능이 개선되고 있으며 계속해서 성능을 모니터링할 것입니다. 인시던트가 해결되면 최종 업데이트를 제공합니다.
2024년 7월 2일 오후 8시 13분(UTC) | 2024년 7월 2일 오후 1:13(태평양 표준시)
Zendesk 엔지니어들이 Pod 13에서 Answer Bot 성능 저하의 원인이 되는 문제를 조사 중입니다. 공유할 새 정보가 있으면 또 다른 업데이트를 제공하겠습니다.
2024년 7월 2일 오후 7시 47분(UTC) | 2024년 7월 2일 오후 12:47(태평양 표준시)
Pod 13에서 Answer Bot 성능 저하에 대한 보고서를 조사 중입니다. 자세한 정보가 나오면 또 다른 업데이트를 제공하겠습니다.
사후
트래픽이 크게 증가하여 사건이 트리거되었습니다. 이로 인해 시스템 속도가 느려지고 지연 및 일시적인 서비스 중단이 발생했습니다. Zendesk는 증가된 로드를 관리하고 정상 운영을 복원하기 위한 즉각적인 조치를 취했습니다.
근본 원인 분석
주요 원인은 갑작스러운 트래픽 급증으로 평소 트래픽이 두 배로 증가하고 데이터베이스가 포화되어 지연이 발생했습니다. 또한 AnswerBot 서비스가 증가된 로드를 처리할 수 없어 추가 중단이 발생했습니다.
해결
이 문제를 완화하기 위해 데이터베이스와 AnswerBot 서비스를 확장하여 급증을 처리할 수 있는 수용 능력을 늘렸습니다. 이로써 정상적인 운영을 복원하고 메시지 백로그를 처리할 수 있었습니다.
수정 항목
1. Auto-Scaling 사용: 중요한 서비스에 대한 자동 확장을 구현하여 갑작스러운 트래픽 급증을 처리하세요.
2. 회로 차단기 소개: 필요할 때 일시적으로 트래픽을 줄여 서비스 과부하를 방지합니다.
3. 모니터링 개선: 모니터링 시스템을 개선하여 유사한 문제를 보다 신속하게 감지하고 대응하세요.
자세한 정보
Zendesk에 대한 현재 시스템 상태 정보는시스템 상태 페이지를 참조하세요. 사후 조사 요약은 보통 인시던트가 종료되고 며칠 후 여기에 게시됩니다. 이 인시던트에 대한 추가 질문이있으면 Zendesk 고객 지원팀에 문의하세요.
번역 고지 사항: 본 문서는 콘텐츠에 대한 기본적인 이해를 제공하기 위해 자동 번역 소프트웨어를 사용하여 번역되었습니다. 정확한 번역을 제공하고자 합당한 노력을 기울였으나 Zendesk는 번역의 정확성을 보장하지 않습니다.
번역된 문서에 포함된 정보의 정확성과 관련하여 질문이 있으시면 문서의 공식 버전인 영문 버전을 참조하시기 바랍니다.