요약
2025년 1월 13일 11:07(UTC)부터 12:07(UTC)까지 Pod 17의 고객에게 메시징 트리거가 실행되지 않는 문제가 발생했습니다.
타임라인
2025년 1월 13일 오후 12:24(UTC) | 2025년 1월 13일 오전 4시 24분(태평양 표준시)
최근 메시징 문제가 완전히 해결되어 서비스가 다시 완전히 작동할 수 있게 되었습니다! 그동안 기다려 주셔서 감사합니다. 저희 팀은 모든 것이 순조롭게 진행되도록 저희 시스템을 계속 면밀히 모니터링할 것입니다. 고객님의 성원에 감사드리며 질문이나 피드백이 있으시면 언제든지 연락주세요!
2025년 1월 13일 오전 11:51(UTC) | 2025년 1월 13일 오전 3시 51분(태평양 표준시)
POD17에서 고객에 대해 실행되는 메시징 트리거 관련 문제를 조사 중입니다.
사후
근본 원인 분석
이 사건은 메시징 티켓 로그 이벤트 서비스에 대한 소비자의 조기 종료로 인해 발생했으며, 이는 서비스가 아직 실행 중일 때 발생했습니다. 그 결과 소비자가 수신 이벤트를 처리할 수 없어 Pod 17에서 메시징 트리거의 평가 및 실행이 완전히 중단되었습니다.
해결
이 문제를 해결하기 위해 단일 배치에서 처리될 최대 레코드 수를 의도된 250개가 아닌 500개로 설정하는 구성 오류를 확인했습니다. 이 오타를 수정하고 최대 레코드 값을 줄임으로써 시간 제한 문제로 인한 소비자 종료 가능성을 줄이는 것이 목표였습니다.
수정 항목
- 상태 확인을 구현하여 소비자의 조기 종료를 감지합니다.
- 실행 중인 소비자 수를 추적하는 모니터를 만듭니다.
- Tessaging 티켓 로그 이벤트 소비자를 위해 중지된 파티션을 모니터링하는 모니터를 설정합니다.
- 메시징 트리거 서비스 대시보드에 소비자 지연 상태 위젯을 추가합니다.
- 메시징 티켓 로그 이벤트 주제에서 일괄 메시지를 처리하는 데 걸린 시간을 측정하는 새 메트릭을 만듭니다.
이러한 수정 조치는 모니터링을 강화하고 향후 유사한 인시던트를 방지하여 메시징 트리거 서비스의 안정성과 신뢰성을 보장하도록 디자인되었습니다.
자세한 정보
Zendesk에 대한 현재 시스템 상태 정보와 계정에 미치는 구체적인 영향은시스템 상태 페이지를참조하세요. 이 문서에 따라 사후 보고서가 게시될 때 알림을 받을 수 있습니다. 이 인시던트에 대한 추가 질문이 있으면Zendesk 고객 지원팀에 문의하세요.
번역 고지 사항: 본 문서는 콘텐츠에 대한 기본적인 이해를 제공하기 위해 자동 번역 소프트웨어를 사용하여 번역되었습니다. 정확한 번역을 제공하고자 합당한 노력을 기울였으나 Zendesk는 번역의 정확성을 보장하지 않습니다.
번역된 문서에 포함된 정보의 정확성과 관련하여 질문이 있으시면 문서의 공식 버전인 영문 버전을 참조하시기 바랍니다.
댓글 0개