로캘은 헬프 센터 콘텐츠의 언어 및 해당 언어의 지역 변형(예를 들어 미국 영어의 en-US 또는 영국 영어의 en-GB)을 지정하는 표준입니다. 다국어를 지원하도록 헬프 센터를 구성한 경우에는 헬프 센터를 번역하여 콘텐츠의 번역된 버전을 추가하거나 특정 언어로만 콘텐츠를 추가할 수 있습니다.
검색 크롤러는 콘텐츠를 인덱싱할 때 외부 콘텐츠의 로캘과 언어를 결정하여 그 로캘에 해당하는 헬프 센터에 콘텐츠를 맵핑할 수 있습니다.
이 문서는 다음 섹션으로 구성되어 있습니다.
헬프 센터의 로캘
헬프 센터는 페이지 URL의 로캘 코드(예: ".../hc/en-us")에 따라 다양한 언어로 페이지를 표시합니다. 번역된 문서에는 같은 언어로 번역된 상위 페이지(섹션 및 카테고리)가 있어야 합니다.
다음 도표는 콘텐츠의 언어 및 지역 변형을 지정하는 데 사용되는 로캘 태그를 보여줍니다. 헬프 센터에 있는 각 문서의 URL에 이 태그가 나타납니다(예: https://helpcenter.zendesk.com/hc/en-us/articles/4408827609882).
검색 크롤러가 로캘을 감지하는 방식
검색 크롤러는 지역 변형을 포함한 외부 콘텐츠의 로캘 및 언어를 결정한 후 감지된 로캘로 콘텐츠를 인덱싱하여 해당 헬프 센터에 맵핑될 수 있게 함으로써 헬프 센터가 여러 언어 및 로캘을 처리할 수 있도록 돕습니다.
검색 크롤러는 로캘이나 언어를 결정하기 위해 먼저 <html>
태그의 lang
속성에서 로캘을 추출하여 계정의 헬프 센터에 있는 로캘이 정확히 일치하는지 확인합니다. 일치하는 항목이 있으면 감지된 로캘로 레코드를 인덱싱합니다. 로캘이 감지되지 않거나 정확히 일치하지 않는 경우 크롤러는 먼저 Content-Language header
에서 로켈을 추출한 다음
<meta>
태그에서 로캘을 추출하려고 시도합니다.
lang
, Content-Language
header
또는 meta
태그 중 어떤 것에 대해서도 정확히 일치하는 것이 없으면 크롤러가 html lang
의 언어 하위 태그와 일치하는 헬프 센터 로캘을 찾으려 시도합니다(lang
태그의 지역 부분이 있으면 무시됩니다). 예를 들어 <html lang="en">
페이지의 경우, 계정에 미국 영어(en-us)와 영국 영어(en-gb)가 사용 설정되어 있으면 미국 영어 로캘과 영국 영어 로캘 둘 다에 대해 레코드가 인덱싱됩니다.
lang
, Content-Language
header
또는 <meta>
태그가 정의되어 있지 않으면 크롤러가 CLD(Compact Language Detection)를 사용하여 콘텐츠에 대한 텍스트 분석을 수행하여 언어를 감지합니다. 언어가 감지되면 해당 언어와 일치하는 사용 설정된 로캘로 레코드가 인덱싱됩니다. 예를 들어 영어(en)가 감지되고 계정에 미국 영어(en-us)와 영국 영어(en-gb)가 사용 설정되어 있으면 미국 영어 로캘과 영국 영어 로캘 둘 다에 대해 레코드가 인덱싱됩니다.
감지된 로캘이 없거나 감지된 로캘과 계정에 있는 헬프 센터 번역이 일치하지 않는 경우 크롤러는 "로캘이 감지되지 않음" 오류를 생성합니다. 이 오류는 오류 보고서에 포함되어 검색 크롤러 설정 중 식별된 크롤러 소유자에게 전송됩니다.