요약
2024년 8월 9일 15:46(UTC)부터 15:57(UTC)까지 Pod 17의 Support 고객은 오류 코드, 느린 로드 시간, 제품 UI 내에서 티켓을 열거나 메시지를 볼 수 없음 등의 다양한 문제를 경험했습니다.
일정
2024년 8월 9일 오후 4시 13분(UTC) | 2024년 8월 9일 오전 9시 13분(태평양 표준시)
사용자가 Pod 17에서 Support 티켓을 볼 수 없다는 보고를 조사 중이며 이미 복구되고 있습니다. 30분 이내에 완전한 안정성이 확인되는 대로 추가 업데이트를 제공하겠습니다.
2024년 8월 9일 오후 4시 32분(UTC) | 2024년 8월 9일 오전 9시 32분(태평양 표준시)
15:46(UTC)부터 15:57(UTC)까지 Pod 17의 Support 고객이 티켓을 로드하는 데 문제가 발생했습니다. 성능이 안정화되었으며 계속해서 성능을 모니터링할 것입니다. 1시간 후 또는 새 정보가 있을 때 다음 업데이트를 제공합니다.
2024년 8월 9일 오후 4시 51분(UTC) | 2024년 8월 9일 오전 9시 51분(태평양 표준시)
Pod 17에서 15:46(UTC)부터 15:57(UTC)까지 발생한 Support 성능 문제가 이제 완전히 해결되었습니다. 불편을 끼쳐 드려 죄송하며 양해해 주셔서 감사합니다.
사후
근본 원인 분석
이 사건은 메모리에 정보를 캐싱하여 데이터 검색 속도를 높이는 시스템의 예기치 않은 재부팅으로 인해 발생했습니다. 이 실패에 대한 부적절한 응답으로 인해 상담사 그래프 구성 요소가 응답을 위해 최대 60초까지 계속 대기하여 시간 초과 오류가 발생하여 503 서비스 오류가 발생했습니다. 기여 요인으로는 시스템이 제때 대체 데이터 소스로 전환하지 않았으며, 임계값에 도달하기 전에 문제가 해결되었기 때문에 적절한 모니터가 경고를 트리거하지 않았다는 것입니다.
해결
이 문제를 해결하기 위해 메모리 캐싱 시스템이 다시 온라인 상태가 되었을 때 시스템이 자동으로 복구되었습니다. 이 시스템의 재부팅으로 인해 지연이 발생했음을 확인했으며 서비스를 복원하기 위해 즉각적인 수동 개입이 필요하지 않은 문제가 스스로 해결되는 것으로 확인되었습니다.
수정 항목
- 사용자 캐시 검색을 위한 제한 시간이 단축되었습니다.
- 통제된 환경에서 그러한 실패를 시뮬레이션하기 위해 혼돈 테스트를 수행하는 것을 고려하세요.
- 알림 임계값을 검토하고 조정하여 더 빨리 감지하고 응답할 수 있도록 하세요.
- AWS에 연락하여 메모리 캐싱 시스템의 예기치 않은 재부팅에 대해 조사하여 향후 유사한 일이 발생하지 않도록 하세요.
자세한 정보
Zendesk에 대한 현재 시스템 상태 정보는시스템 상태 페이지를 참조하세요. 사후 조사 요약은 보통 인시던트가 종료되고 며칠 후 여기에 게시됩니다. 이 인시던트에 대한 추가 질문이있으면 Zendesk 고객 지원팀에 문의하세요.
번역 고지 사항: 본 문서는 콘텐츠에 대한 기본적인 이해를 제공하기 위해 자동 번역 소프트웨어를 사용하여 번역되었습니다. 정확한 번역을 제공하고자 합당한 노력을 기울였으나 Zendesk는 번역의 정확성을 보장하지 않습니다.
번역된 문서에 포함된 정보의 정확성과 관련하여 질문이 있으시면 문서의 공식 버전인 영문 버전을 참조하시기 바랍니다.
댓글 0개