요약: ◀ ▼
소스별로 결과를 필터링하여 헬프 센터 검색을 위한 외부 웹사이트 콘텐츠를 인덱싱하도록 여러 웹 크롤러를 설정할 수 있습니다. 크롤러는 사이트맵이나 특정 URL을 사용하여 JavaScript로 렌더링된 페이지를 포함한 공개 콘텐츠를 수집합니다. 주기적으로 업데이트되어 관련 외부 콘텐츠가 검색 결과에 나타나도록 합니다. 크롤링할 사이트나 페이지를 제어하여 개발자의 개입 없이 검색 가능한 리소스를 확장할 수 있습니다.
웹 크롤러를 사용하면 개발자 리소스 없이 Zendesk 계정에서 외부 콘텐츠를 사용할 때마다 외부 콘텐츠를 크롤링하고 색인화할 수 있습니다. 여러 크롤러를 설정하여 같은 웹사이트나 다른 웹사이트의 서로 다른 콘텐츠를 크롤링하고 인덱싱할 수 있습니다. 전체 사이트를 크롤링하지 않고도 특정 URL 목록을 크롤링할 수도 있습니다.
사용자가 헬프 센터에서 검색을 수행할 때 크롤러가 발견하는 관련 외부 콘텐츠에 순위가 매겨져 검색 결과 페이지에 제시됩니다. 여기에서 사용자는 결과를 필터링하고 링크를 클릭하여 다른 브라우저 탭에서 외부 콘텐츠 링크를 볼 수 있습니다.
웹 크롤러에 대한 정보
최대 20개의 웹 크롤러를 만들어 동일하거나 다른 웹사이트에서 외부 콘텐츠를 크롤링하고 인덱싱할 수 있습니다. 크롤링된 웹사이트의 콘텐츠와 웹사이트 내의 페이지는 Zendesk 계정에서 외부 콘텐츠를 사용할 때마다 사용할 수 있습니다. 크롤링하려는 외부 사이트에 웹 크롤러를 위한 페이지를 나열하는 사이트맵이 있어야 합니다. 또한 크롤링하려는 페이지가 인증되지 않는 공개 페이지여야 합니다.
- 전체 사이트를 크롤링하면 크롤러가 지정한 시작 URL이나 사이트맵과 연결된 사이트맵을 자동으로 찾은 다음 이를 사용하여 해당 사이트 내의 모든 페이지를 크롤링합니다.
- 개별 페이지로 크롤링을 제한하면 크롤링하려는 URL을 최대 5개까지 지정할 수 있습니다. 두 개 이상의 URL을 입력하면 해당 URL로 크롤링 제한 옵션이 자동으로 선택됩니다. 하지만 시작 URL을 하나만 입력하는 경우에도 이 옵션을 수동으로 선택하여 단일 페이지로 크롤링을 제한할 수 있습니다. 사이트맵을 입력하면 크롤러가 사이트맵 내의 모든 페이지를 크롤링해야 하므로 이 옵션이 선택 취소되어 사용 중지됩니다.
새 크롤러를 만들 때 크롤러에 배정하는 이름이 소스 값을 만드는 데 사용됩니다. 소스 값은 헬프 센터 검색에서 필터로 사용됩니다. 나중에 이름을 변경하려면 언제든지 다른 소스 이름을 편집하거나 배정할 수 있습니다. 웹 크롤러 관리하기를 참조하세요.
크롤러를 구성한 후에 주기적으로 실행되도록 스케줄되어 사이트맵의 페이지를 방문하여 그러한 소스의 콘텐츠를 헬프 센터 검색 색인에 수집합니다. 사이트맵을 사용할 수 없는 경우에는 크롤러가 최상위 페이지의 링크를 따라 보조 페이지를 방문하여 콘텐츠를 수집합니다. 크롤러는 이러한 방식으로 계속해서 연결된 각 페이지를 방문한 후 사이트 계층 구조의 다음 페이지로 연결되는 링크를 따라갑니다. 크롤러가 4개 수준 깊이의 모든 연결된 콘텐츠를 크롤링하거나 전체 사이트를 크롤링할 때까지 계속됩니다. 크롤러는 사이트 도메인 내의 페이지로 연결되는 링크만 따라갑니다. 외부 페이지를 방문하지 않습니다.
웹 크롤러는 아코디언 등 UI 요소에 의해 콘텐츠가 숨겨져 있더라도 초기 페이지 로드 시 페이지 소스에 있는 콘텐츠를 인덱싱합니다. 웹 크롤러는 적응형 크롤링을 사용하여 렌더링에 JavaScript가 필요한 콘텐츠를 캡처할 수도 있습니다. 웹사이트의 각 섹션을 처리하기 전에 크롤러는 자동으로 적은 수의 페이지를 샘플링하여 표준 가져오기와 전체 브라우저 렌더링 간의 결과를 비교합니다. 브라우저 렌더링이 훨씬 더 많은 콘텐츠를 캡처하면 크롤러가 사이트의 해당 섹션에 대한 브라우저 모드로 전환합니다. 즉, 동일한 웹사이트의 서로 다른 부분이 서로 다른 모드에서 크롤링될 수 있습니다. 예를 들어 정적 블로그 섹션은 표준 가져오기를 사용하는 반면 동적 앱 섹션은 브라우저 렌더링을 사용할 수 있습니다. 이 프로세스는 구성할 필요 없이 자동으로 수행됩니다.
웹 크롤러는 방문하는 페이지의 링크를 크롤링하지 않고 사용하도록 구성된 사이트맵의 페이지만 방문합니다. 크롤러가 정기적으로 스케줄된 크롤링 중에 웹사이트에서 정보를 수집하지 못하면(예를 들어 웹사이트 작동이 중단되거나 네트워크 문제가 있는 경우), 헬프 센터는 이전 크롤링의 결과를 유지하며, 헬프 센터에서 계속 검색할 수 있습니다.
웹 크롤러 설정하기
- 웹 크롤러는 gzip 파일 압축 인코딩을 사용하는 웹사이트에서는 작동하지 않습니다. 그러한 사이트의 검색 결과는 표시되지 않습니다.
- 외부 사이트 robots.txt 레코드에 크롤링 지연이 설정되어 있으면 웹 크롤러가 이를 지키지 않습니다.
- changefreq 태그는 웹 크롤러에 어떤 영향도 미치지 않습니다.
웹 크롤러를 설정하려면 다음과 같이 하세요.
-
지식 관리자의 사이드바에서 설정(
)을 클릭합니다.
- 검색 설정을 클릭합니다.
-
크롤러에서 관리를 클릭합니다.

-
크롤러 추가를 클릭합니다.

-
계속을 클릭합니다.

-
웹사이트의 콘텐츠 동기화에서 다음을 입력합니다.
- 크롤러에 배정하려는 크롤러 이름. 이 이름은 크롤러 관리 목록에서 웹 크롤러를 식별하며 헬프 센터 검색에서 필터로 사용되는 검색 소스 값을 만드는 데 사용됩니다.
-
크롤링하려는 사이트 또는 페이지의 시작 URL. 다음과 같은 작업을 수행할 수 있습니다.
- 전체 웹사이트를 크롤링한 다음 기본 도메인(예: zendesk.com) 또는 사이트맵 경로(예: zendesk.com/sitemap.xml)를 입력합니다.
-
개별 페이지로 크롤링을 제한하여 이 필드에 도메인/페이지 값(예: test.com/faq.htm)을 입력합니다. 다른 항목 추가(+)하기를 클릭하여 최대 5개의 URL을 추가합니다.
이 옵션을 선택하면 크롤러가 설정 중 지정된 시작 URL만 크롤링하고 색인화합니다.
-
동기화를 클릭합니다. 웹 크롤러가 크롤러 페이지에 추가됩니다. 24시간 내에 크롤러가 지정된 사이트맵을 가져와 구문 분석합니다. 사이트맵 처리가 성공하면 크롤러가 페이지를 크롤링하여 콘텐츠를 색인화하기 시작합니다. 크롤러가 실패하면 크롤러 소유자가 문제 해결에 도움이 되는 팁이 포함된 이메일 알림을 받습니다. 크롤러가 주기적으로 다시 시도합니다.참고: Zendesk/External-Content는 웹 크롤러의 사용자 에이전트입니다. 크롤러가 방화벽 차단 요청으로 인해 실패하는 것을 방지하려면 Zendesk/External-Content를 허용 목록에 추가하세요.

- 헬프 센터 검색을 위한 것라면 헬프 센터 검색 결과에 포함 및 제외하려는 콘텐츠를 선택해야 합니다. 헬프 센터 검색 결과에 외부 콘텐츠 포함하기를 참조하세요.
- 상담사를 위한 컨텍스트 패널의 지식 섹션을 위한 것이라면 컨텍스트 패널에서 지식 구성하기를 참조하세요.
번역 고지 사항: 본 문서는 콘텐츠에 대한 기본적인 이해를 제공하기 위해 자동 번역 소프트웨어를 사용하여 번역되었습니다. 정확한 번역을 제공하고자 합당한 노력을 기울였으나 Zendesk는 번역의 정확성을 보장하지 않습니다.
번역된 문서에 포함된 정보의 정확성과 관련하여 질문이 있으시면 문서의 공식 버전인 영문 버전을 참조하시기 바랍니다.