지식 소스는 고급 AI 상담사 고객의 질문에 대한 AI 생성 답변을 만드는 데 사용하는 정보입니다. AI 상담사 에게 지식 소스를 추가하면 모든 응답을 스크립팅할 필요 없이 고객을 돕기 위한 답변을 생성할 수 있습니다.

사용 중인 플랜
추가 기능 AI 상담사 - 어드밴스드

지식 소스는 고급 AI 상담사 고객의 질문에 대한 AI 생성 답변을 만드는 데 사용하는 정보입니다. AI 상담사 에게 지식 소스를 추가하면 모든 응답을 스크립팅할 필요 없이 고객을 돕기 위한 답변을 생성할 수 있습니다.

이 문서에서는 다음과 같은 주제를 다룹니다.

  • 지식 소스에 대한 정보
  • Zendesk 헬프 센터 고급 AI 상담사 에 연결하기
  • 외부 지식 소스를 고급 AI 상담사 에 연결하기
  • 지식 소스 연결 해제하기
  • 지식 소스 가져오기(레거시)
  • 연결된 모든 지식 소스 보기

관련 문서:

  • 고급 AI 상담사를 위한 지식 소스에 대한 검색 규칙 구성하기

지식 소스에 대한 정보

다음 유형의 지식 소스를 고급 AI 상담사 에 연결할 수 있습니다.

  • Zendesk 헬프 센터 : Zendesk 계정(또는 여러 브랜드를 설정한 경우에는 특정 브랜드)과 연결된 헬프 센터 .
  • 외부 지식 소스 : 웹 크롤러 나 지식 커넥터를 통해 Zendesk 계정으로 가져오는 외부 소스의 콘텐츠입니다.

여러 지식 소스를 단일 AI 상담사 에 연결할 수 있습니다. 예를 들어 여러 개의 Zendesk 헬프 센터, 여러 개의 외부 소스 또는 이 둘의 조합을 연결할 수 있습니다. 하지만 전체 지식 소스 수를 합당한 한도 이내로 유지하는 것이 좋습니다. 소스가 너무 많으면 경우에 따라 정확성이 떨어지고 지연 시간이 늘어날 수 있습니다.

AI 상담사 연결된 헬프 센터 검색할 때 검색이 수행될 때 헬프 센터 의 현재 콘텐츠를 검색합니다. 하지만 AI 상담사 연결된 외부 지식 소스를 검색할 때에는 보통 24시간마다 마지막 동기화 시점에 사용할 수 있었던 정보를 검색합니다.

제한형 헬프 센터 콘텐츠를 사용하는 경우에는 AI 상담사 응답이 다음과 같이 설정된 문서 보기 권한을 따릅니다.

  • 고객이 인증된 경우에는 AI 상담사가 관련 제한형 문서를 사용하여 응답을 생성할 수 있습니다.
  • 고객이 인증되지 않는 경우에는 AI 상담사가 공개 문서만 사용하여 응답을 생성할 수 있습니다.

자세한 내용은 AI 상담사 응답에서 제한된 헬프 센터 콘텐츠 사용하기를 참조하세요.

Zendesk 헬프 센터 고급 AI 상담사 에 연결하기

참고: 이 섹션은 2026년 3월 10일 이후에 Zendesk 계정을 만든 경우에만 적용됩니다. 그렇지 않은 경우에는 지식 소스 가져오기(레거시)를 참조하세요.

Zendesk 헬프 센터 를 고급 AI 상담사 에 연결하여 AI 상담사 헬프 센터 콘텐츠를 사용하여 고객 질문에 대한 답변을 생성할 수 있도록 할 수 있습니다.

헬프 센터 활성화 해야 고급 AI 상담사 에 연결할 수 있습니다.

Zendesk 헬프 센터 연결하려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  3. 소스 편집을 클릭합니다.

    지식 소스 대화 상자가 나타납니다.

  4. 위쪽 필드에서 헬프 센터를 선택합니다.
  5. 목록에서 고급 AI 상담사 에 연결하려는 Zendesk 헬프 센터 선택합니다.

    팁: 헬프 센터 보이지 않으면 활성화 했는지 확인하세요.
  6. 저장을 클릭합니다.

    헬프 센터 가 지식 소스 목록에 나타납니다.

외부 지식 소스를 고급 AI 상담사 에 연결하기

참고: 이 섹션은 2026년 3월 10일 이후에 Zendesk 계정을 만든 경우에만 적용됩니다. 그렇지 않은 경우에는 지식 소스 가져오기(레거시)를 참조하세요.

외부 지식 소스를 고급 AI 상담사 에 연결하여 AI 상담사 고객 질문에 대한 답변을 생성할 때 해당 소스의 정보를 사용할 수도 있습니다.

외부 지식 소스를 연결하려면 다음과 같이 하세요.

  1. 외부 지식 소스를 Zendesk 계정에 아직 연결 하지 않았다면 연결하세요.
  2. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  3. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  4. 소스 편집을 클릭합니다.

    지식 소스 대화 상자가 나타납니다.

  5. 위쪽 필드에서 외부 콘텐츠를 선택합니다.
  6. 목록에서 필요한 경우 외부 지식 소스의 유형을 확장한 다음 고급 AI 상담사 에 연결하려는 소스를 선택합니다.

  7. 저장을 클릭합니다.

    외부 지식 소스가 지식 소스 목록에 나타납니다.

지식 소스 연결 해제하기

참고: 이 섹션은 2026년 3월 10일 이후에 Zendesk 계정을 만든 경우에만 적용됩니다. 그렇지 않은 경우에는 지식 소스 삭제하기를 참조하세요.

고급 AI 상담사 와 지식 소스의 연결을 해제하여 AI 상담사 고객 질문에 대한 답변을 생성할 때 해당 소스의 정보를 사용하지 못하도록 할 수 있습니다.

지식 소스를 연결 해제하려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  3. 소스 편집을 클릭합니다.

    지식 소스 대화 상자가 나타납니다.

  4. 위쪽 필드에서 헬프 센터 또는 외부 콘텐츠를 선택합니다.

    목록에서 연결 해제하려는 지식 소스를 선택 취소합니다.

  5. 저장을 클릭합니다.

    연결 해제된 지식 소스는 지식 소스 목록에서 제거됩니다.

지식 소스 가져오기(레거시)

참고: 이 섹션은 2026년 3월 10일 이전에 Zendesk 계정을 만든 경우에만 적용됩니다. 그렇지 않은 경우에는 고급 AI 상담사 에게 Zendesk 헬프 센터 연결하기 또는 고급 AI 상담사 에게 외부 지식 소스 연결하기를 참조하세요.

클라이언트 관리자는 AI 상담사 에 대해 다음과 같은 유형의 지식 소스를 가져올 수 있습니다.

  • Zendesk 헬프 센터
  • Salesforce 헬프 센터
  • Freshdesk 헬프 센터
  • Confluence 사이트 또는 공간
  • CSV 파일
  • 웹 크롤링 콘텐츠

Zendesk 헬프 센터 가져오기

클라이언트 관리자는 Zendesk 헬프 센터 를 가져올 수 있습니다.

Zendesk 헬프 센터 가져오려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  3. 지식 소스 탭에서 소스 추가를 클릭합니다.

    소스 추가 창이 열립니다.

  4. 유형 에서 Zendesk를 선택합니다.
  5. 헬프 센터 URL 에 헬프 센터 로캘을 포함한 하위 도메인(예: https://yoursubdomain.zendesk.com/hc/en-us )을 입력합니다.

    로캘을 제공하지 않으면 헬프 센터의 기본 로캘이 업로드됩니다.

  6. 소스 이름 에 소스의 이름을 입력합니다.

    이 이름은 AI 상담사 - 어드밴스드 내에서 리포팅에 사용됩니다.

  7. 가져오기 빈도 에서 헬프 센터 콘텐츠를 다시 가져오는 빈도를 선택합니다.
    • 일별 : 일요일과 해당 달의 15일을 제외하고 매일 콘텐츠를 다시 가져옵니다. 지식 소스가 자주 업데이트되지 않는 한 권장하지 않습니다.
    • 매주 : 콘텐츠는 매주 일요일에 다시 가져옵니다.
    • 매월 : 매달 15일에 콘텐츠를 다시 가져옵니다.
    • 안 함 : 콘텐츠를 한 번 가져오고 다시 가져오지 않습니다.

      다시 가져오기의 정확한 타이밍은 보장되지 않습니다. 다시 가져오기는 예정된 날에 처리되지만 항상 일관된 시간에 준비되는 것은 아닙니다.

      정기적으로 다시 가져오기를 수행하면 AI 상담사 최신 상태로 유지됩니다. 대부분 조직의 경우 매주 또는 매월 가져오기로 충분합니다. 예정된 다시 가져오기 시간 외에 새 변경 내용을 반영해야 하는 경우에는 언제든지 수동으로 다시 가져올 수 있습니다.

  8. 제한된 문서를 가져오려면 다음과 같이 하세요.
    1. 비공개 문서 가져오기를 켭니다.
    2. 이메일 에 제한된 콘텐츠에 액세스할 수 있는 권한이 부여된 사용자의 이메일 주소를 입력합니다.

      보통 지식 관리자의 이메일 주소입니다.

    3. API 액세스 토큰 에 이 용도로 생성하는 API 토큰을 입력합니다.
  9. 가져오기를 클릭합니다.
참고: 제한된 문서를 가져올 때 이메일이나 API 토큰이 올바르지 않으면 경고나 오류가 표시되지 않습니다. 대신 제한된 문서가 아닌 공개 문서만 가져옵니다. 가져오기 전에 자격 증명을 다시 확인하고 가져오기가 완료된 후 AI 상담사 제한된 문서를 사용하여 질문에 답변할 수 있는지 테스트하는 것이 좋습니다.

Salesforce 헬프 센터 가져오기

클라이언트 관리자는 Salesforce 헬프 센터 가져올 수 있습니다.

Salesforce 헬프 센터 가져오려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  3. 지식 소스 탭에서 소스 추가를 클릭합니다.

    소스 추가 창이 열립니다.

  4. 유형 에서 Salesforce 선택합니다.
  5. Salesforce 에 로그인을 클릭합니다.
  6. Salesforce 환경에 로그인합니다.
  7. 헬프 센터 URL 에 Salesforce 헬프 센터 의 전체 URL을 입력합니다.
  8. 소스 이름 에 소스의 이름을 입력합니다.

    이 이름은 AI 상담사 - 어드밴스드 내에서 리포팅에 사용됩니다.

  9. 가져오기 빈도 에서 헬프 센터 콘텐츠를 다시 가져오는 빈도를 선택합니다.
    • 일별 : 일요일과 해당 달의 15일을 제외하고 매일 콘텐츠를 다시 가져옵니다. 지식 소스가 자주 업데이트되지 않는 한 권장하지 않습니다.
    • 매주 : 콘텐츠는 매주 일요일에 다시 가져옵니다.
    • 매월 : 매달 15일에 콘텐츠를 다시 가져옵니다.
    • 안 함 : 콘텐츠를 한 번 가져오고 다시 가져오지 않습니다.

      다시 가져오기의 정확한 타이밍은 보장되지 않습니다. 다시 가져오기는 예정된 날에 처리되지만 항상 일관된 시간에 준비되는 것은 아닙니다.

      정기적으로 다시 가져오기를 수행하면 AI 상담사 최신 상태로 유지됩니다. 대부분 조직의 경우 매주 또는 매월 가져오기로 충분합니다. 예정된 다시 가져오기 시간 외에 새 변경 내용을 반영해야 하는 경우에는 언제든지 수동으로 다시 가져올 수 있습니다.

  10. 가져오기를 클릭합니다.

Freshdesk 헬프 센터 가져오기

클라이언트 관리자는 Freshdesk 헬프 센터 가져올 수 있습니다.

Freshdesk 헬프 센터 가져오려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  3. 지식 소스 탭에서 소스 추가를 클릭합니다.

    소스 추가 창이 열립니다.

  4. 유형 에서 Freshdesk를 선택합니다.
  5. 헬프 센터 URL 에 Freshdesk 헬프 센터 의 전체 URL을 입력합니다.

    전체 헬프 센터 추가하거나 헬프 센터 의 특정 섹션만 추가할 수 있습니다.

  6. 소스 이름 에 소스의 이름을 입력합니다.

    이 이름은 AI 상담사 - 어드밴스드 내에서 리포팅에 사용됩니다.

  7. 가져오기 빈도 에서 헬프 센터 콘텐츠를 다시 가져오는 빈도를 선택합니다.
    • 일별 : 일요일과 해당 달의 15일을 제외하고 매일 콘텐츠를 다시 가져옵니다. 지식 소스가 자주 업데이트되지 않는 한 권장하지 않습니다.
    • 매주 : 콘텐츠는 매주 일요일에 다시 가져옵니다.
    • 매월 : 매달 15일에 콘텐츠를 다시 가져옵니다.
    • 안 함 : 콘텐츠를 한 번 가져오고 다시 가져오지 않습니다.

      다시 가져오기의 정확한 타이밍은 보장되지 않습니다. 다시 가져오기는 예정된 날에 처리되지만 항상 일관된 시간에 준비되는 것은 아닙니다.

      정기적으로 다시 가져오기를 수행하면 AI 상담사 최신 상태로 유지됩니다. 대부분 조직의 경우 매주 또는 매월 가져오기로 충분합니다. 예정된 다시 가져오기 시간 외에 새 변경 내용을 반영해야 하는 경우에는 언제든지 수동으로 다시 가져올 수 있습니다.

  8. API 액세스 토큰 에 이 용도로 Freshdesk에서 생성하는 API 토큰을 입력합니다.
  9. 가져오기를 클릭합니다.

Confluence 사이트 또는 공간 가져오기

클라이언트 관리자는 Confluence 사이트나 공간을 가져올 수 있습니다.

지식에서 Confluence 연결을 만들고 관리합니다. Confluence 사이트나 공간을 고급 AI 상담사 에 연결하기 전에 지식에서 Confluence 연결을 만들어야 합니다.

고급 AI 상담사를 위한 다른 지식 소스와 달리 Confluence 콘텐츠에 대한 다시 가져오기 빈도를 지정할 수 없습니다. Confluence 연결은 24시간마다 자동으로 동기화되지만 필요한 경우 콘텐츠를 수동으로 다시 동기화 할 수 있습니다.

Confluence 사이트 또는 공간을 가져오려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  3. 지식 소스 탭에서 소스 추가를 클릭합니다.

    소스 추가 창이 열립니다.

  4. 유형 에서 Confluence를 선택합니다.

  5. 도메인 에 Zendesk 하위 도메인의 URL(예:https://yoursubdomain.zendesk.com ).
  6. 이메일 에 Zendesk 관리자의 이메일 주소를 입력합니다.
  7. API 액세스 토큰에 이 용도로 생성하는 API 토큰을 입력합니다.
  8. 권한 부여를 클릭합니다.
  9. Zendesk 계정에 이미 연결된 Confluence 사이트나 공간을 선택하거나 새 Confluence 연결을 만듭니다 .

    두 개 이상 선택할 수 있습니다.

  10. 저장을 클릭합니다.

선택한 Confluence 사이트나 공간이 지식 소스 목록에 추가됩니다.

CSV 파일 가져오기

클라이언트 관리자는 CSV 파일을 지식 소스로 가져올 수 있습니다.

CSV 파일을 가져오려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  3. 지식 소스 탭에서 소스 추가를 클릭합니다.

    소스 추가 창이 열립니다.

  4. 유형 에서 파일(CSV)을 선택합니다.
  5. 지식 소스 CSV 파일 선택을 클릭합니다.
  6. 가져오려는 CSV 파일을 선택합니다.

    파일 형식이 올바른지 확인하려면 CSV 파일의 필수 형식 지정을 참조하세요.

  7. 소스 이름 에 소스의 이름을 입력합니다.

    이 이름은 AI 상담사 - 어드밴스드 내에서 리포팅에 사용됩니다.

  8. 가져오기를 클릭합니다.
참고: CSV 파일은 자동으로 다시 가져올 수 없습니다. 콘텐츠가 변경되면 CSV 파일을 업데이트하거나 새 파일을 만들어 다시 가져와야 합니다.

CSV 파일의 필수 서식

지식 소스로 업로드하는 CSV 파일에는 가져오려는 각 문서에 대해 하나의 행이 있어야 합니다. 파일에는 다음 열이 포함되어야 합니다.

  • title : 문서의 제목입니다.
  • content : 문서의 전체 콘텐츠입니다.
    • 콘텐츠에 HTML 태그가 포함될 수 있으므로 제거할 필요가 없습니다. 실제로 태그는 문서에 구조를 부여하여 AI 상담사 문서 섹션을 이해하는 데 도움이 될 수 있습니다.
    • 콘텐츠에 마크다운이 포함될 수도 있지만 마크다운이 유효해야 합니다. 그렇지 않으면 해당 셀의 콘텐츠를 가져올 수 없습니다. 또한 한 줄의 셀이 2,000자를 초과하는 방식으로 마크다운이 작성된 경우에는 경고를 표시하지 않고 셀 가져오기가 실패합니다.

다음과 같은 선택적 열을 포함할 수도 있습니다.

  • 레이블 : 공백으로 구분된 레이블 이름 목록입니다. 값은 콘텐츠를 분류하는 기준이 될 수 있습니다.
  • locale : 언어 또는 시장별로 문서를 구성하는 데 사용됩니다. 값은 기술적으로 무엇이든 될 수 있지만 표준 로캘 표기법(예: en-US 또는 fi-FI)을 따르는 것이 좋습니다.
  • article_url : 문서를 찾을 수 있는 외부 웹 주소입니다. 위젯의 소스 기여 및 AI 상담사 - 어드밴스드 내의 리포팅에서 사용됩니다.

파일 형식은 다음도 사용해야 합니다.

  • 쉼표(,)를 열 구분 기호로 사용하고 큰 따옴표(")를 문자열 인용 문자로 사용합니다.
  • 열 헤더의 첫 번째 행입니다.
  • ASCII 문자만 가능합니다. CSV 파일에 ASCII가 아닌 문자가 포함되어 있으면 가져오기에 실패합니다.

이 문서 아래쪽에서 기본서식을 다운로드할 수 있습니다.

웹 크롤러로 콘텐츠 가져오기

클라이언트 관리자는 웹 크롤러를 사용하여 웹사이트 콘텐츠를 가져올 수 있습니다.

웹 크롤러 가져오기에 대한 자세한 내용은 고급 AI 상담사를 위한 웹 크롤러를 사용하여 콘텐츠를 가져오기 위한 성공 사례 및 고급 AI 상담사를 위한 웹 크롤러 가져오기 관련 문제 해결하기를 참조하세요.

참고: 현재 통합 인증(SSO)으로 보호되는 사이트에서는 웹 크롤러를 사용할 수 없습니다. 대신 CSV 파일을 가져올 수 있습니다.

웹 크롤링 콘텐츠를 가져오려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.
  3. 지식 소스 탭에서 소스 추가를 클릭합니다.

    소스 추가 창이 열립니다.

  4. 유형 에서 웹 크롤러를 선택합니다.
  5. 소스 이름 에 소스의 이름을 입력합니다.

    이 이름은 AI 상담사 - 어드밴스드 내에서 리포팅에 사용됩니다.

  6. 웹 크롤러가 하위 페이지를 포함하지 않고 시작 URL 필드에 나열된 웹 페이지에서만 정보를 가져오도록 하려면 정확한 URL 크롤링을 선택합니다.

    이 옵션을 선택하지 않으면 웹 크롤러가 시작 URL에 나열된 모든 URL에 대해 최대 15개의 하위 페이지 크롤링 깊이를 적용합니다.

  7. 시작 URL 에 웹 크롤러가 통과할 URL을 입력합니다.

    각 URL을 별도의 줄에 나열합니다.

  8. 가져오기 빈도 에서 크롤링된 콘텐츠를 다시 가져오는 빈도를 선택합니다.
    • 일별 : 일요일과 해당 달의 15일을 제외하고 매일 콘텐츠를 다시 가져옵니다. 지식 소스가 자주 업데이트되지 않는 한 권장하지 않습니다.
    • 매주 : 콘텐츠는 매주 일요일에 다시 가져옵니다.
    • 매월 : 매달 15일에 콘텐츠를 다시 가져옵니다.
    • 안 함 : 콘텐츠를 한 번 가져오고 다시 가져오지 않습니다.

      다시 가져오기의 정확한 타이밍은 보장되지 않습니다. 다시 가져오기는 예정된 날에 처리되지만 항상 일관된 시간에 준비되는 것은 아닙니다.

      정기적으로 다시 가져오기를 수행하면 AI 상담사 최신 상태로 유지됩니다. 대부분 조직의 경우 매주 또는 매월 가져오기로 충분합니다. 예정된 다시 가져오기 시간 외에 새 변경 내용을 반영해야 하는 경우에는 언제든지 수동으로 다시 가져올 수 있습니다.

  9. (선택 사항) 크롤러 설정을 확장하여 고급 크롤러 설정을 구성합니다.

    자세한 내용은 고급 크롤러 설정 구성하기를 참조하세요.

    참고: 이러한 설정은 복잡한 기술적 요구 사항이 있는 조직에만 권장됩니다. 많은 조직에서는 이러한 설정이 필요하지 않습니다.
  10. (선택 사항) HTML 처리를 확장하여 고급 HTML 설정을 구성합니다.

    자세한 내용은 고급 HTML 설정 구성하기를 참조하세요.

    참고: 이러한 설정은 복잡한 기술적 요구 사항이 있는 조직에만 권장됩니다. 많은 조직에서는 이러한 설정이 필요하지 않습니다.
  11. 가져오기를 클릭합니다.

고급 크롤러 설정 구성하기

  1. 크롤러 설정 제목 아래의 크롤러 유형 에서 다음 옵션 중 하나를 선택합니다.
    • 브라우저와 원시 HTTP 간의 적응형 전환(기본) : JavaScript 콘텐츠가 있는 경우 Fast 및 렌더링합니다.
    • 헤드리스 브라우저(Firefox + Playwright) : 신뢰성: JavaScript 콘텐츠를 렌더링하여 차단을 피하는 데 가장 좋지만 속도가 느릴 수 있습니다.
    • 원시 HTTP 클라이언트(Cheerio) : 가장 빠르지만 JavaScript 콘텐츠를 렌더링하지 않습니다.
    • Raw with JavaScript : JavaScript를 사용하는 것처럼 페이지를 크롤링합니다.
  2. URL 포함 또는 URL 제외를 선택하여 위의 시작 URL 필드에서 설정된 크롤링 범위를 사용자 지정합니다.

    각 설정 아래의 필드에 포함하거나 제외하려는 URL을 입력합니다. 한 줄에 각 URL을 입력합니다.

    이러한 설정은 하위 페이지를 크롤링하는 동안 찾은 링크에만 영향을 미칩니다. 페이지를 크롤링하려면 시작 URL 필드에 해당 URL을 지정해야 합니다.

    예를 들어 아래 예와 같이 URL 구조가 일관되지 않은 경우:

    • 시작 URL: https://support.example.com/en/support/home
    • 문서 URL: https://support.example.com/en/support/solutions/articles/…
    URL 포함 필드에 다음 URL을 추가할 수 있습니다.
    • https://support.example.com/en/support/**

    이렇게 하면 경로가 시작 URL과 다르더라도 웹 크롤러에 모든 문서가 포함됩니다.

    또 다른 예로 다음 페이지는 매우 광범위하며 관련 없는 페이지(예: 채용 정보 페이지)를 포함합니다.
    • 시작 URL: https://www.example.com/en
    이러한 관련 없는 페이지를 제외하려면 URL 제외 필드에 다음 URL을 추가하면 됩니다.
    • https://www.example.com/en/careers/**
    이렇게 하면 웹 크롤러가 채용 정보 페이지와 해당 하위 페이지의 모든 콘텐츠를 제외합니다.
    팁: 일반 텍스트보다 더 강력한 globs 는 특수 문자를 사용하여 웹 크롤러가 검색할 수 있는 동적 URL을 만들 수 있는 패턴입니다. 다음은 몇 가지 예입니다.
    • https://support.example.com/** 크롤러가 https://support.example.com/으로 시작하는 모든 URL에 액세스할 수 있습니다.
    • https://{store,docs}.example.com/** 크롤러가 https://store.example.com/ 또는 https://docs.example.com/으로 시작하는 모든 URL에 액세스할 수 있습니다.
    • https://example.com/**/*\?*foo=* 크롤러가 어떤 값이든 foo 쿼리 매개변수를 포함하는 모든 URL에 액세스할 수 있습니다.
    DigitalOcean 웹사이트 에서 globs에 대해 자세히 알아보고 테스트하세요.
  3. 크롤링할 최대 페이지 수 에 시작 URL을 포함하여 웹 크롤러가 통과할 최대 페이지 수를 입력합니다.

    여기에는 시작 URL, 페이지 매김 페이지, 콘텐츠가 없는 페이지 등이 포함됩니다. 이 한도에 도달하면 웹 크롤러가 자동으로 중지됩니다.

  4. 최대 크롤링 심도 에 웹 크롤러가 시작 URL에서 따라갈 최대 링크 수를 입력합니다.

    시작 URL의 깊이는 0입니다. 시작 URL에서 직접 연결된 페이지의 깊이는 1 등입니다. 이 설정을 사용하여 실수로 웹 크롤러가 실행되지 않도록 하세요.

  5. 프록시 구성 에서 다음 옵션 중 하나를 선택합니다.
    • 데이터 센터(기본) : 데이터를 스크래핑하는 가장 빠른 방법입니다.
    • 주거용 : 성능이 떨어지지만 차단될 가능성이 적습니다. 기본 프록시가 차단되어 있거나 특정 국가에서 크롤링해야 하는 경우에 적합합니다.

고급 HTML 설정 구성하기

  1. HTML 처리 머리글 아래의 HTML 요소 유지 에 지정된 HTML 요소만 유지하는 CSS 선택기를 입력합니다.

    다른 모든 콘텐츠는 제거되어 관련 정보에만 집중할 수 있습니다.

  2. HTML 요소 제거 에서 텍스트로 변환하거나, 마크다운하거나, HTML로 저장하기 전에 제거할 HTML 요소를 선택합니다.

    이렇게 하면 원하지 않는 콘텐츠를 제외하는 데 도움이 됩니다.

  3. 클릭 가능한 요소 확장 에 클릭할 DOM 요소와 일치하는 올바른 CSS 선택기를 입력합니다.

    이는 텍스트 콘텐츠를 캡처하기 위해 축소된 섹션을 확장하는 데 유용합니다.

  4. HTML 변환기 에서 다음 값 중 하나를 선택하여 중요한 콘텐츠만 유지하고 관련 없는 콘텐츠(예: 탐색 또는 팝업)를 제거하도록 HTML을 정리하는 방법을 정의합니다.
    • Extractus : (권장하지 않음) Extractus 라이브러리를 사용합니다.
    • 없음: 위의 HTML 요소 제거 옵션에서 지정된 HTML 요소만 제거합니다.
    • 읽을 수 있는 텍스트 : Mozilla의 가독성 라이브러리를 사용하여 주요 문서 콘텐츠를 추출하여 탐색, 머리글, 바닥글 및 기타 비필수 요소를 제거합니다. 문서가 많은 웹사이트 및 블로그에 가장 적합합니다.
    • 가능한 경우 읽을 수 있는 텍스트 : Mozilla의 가독성 라이브러리를 사용하여 주요 콘텐츠를 추출하지만 페이지가 문서로 나타나지 않으면 원래 HTML로 대체됩니다. 이는 문서가 아닌 페이지에 더 많은 콘텐츠를 보존하므로 문서나 제품 페이지와 같은 혼합 콘텐츠 유형이 있는 웹사이트에 유용합니다.

  5. 동적 콘텐츠 대기 시간 에 동적 콘텐츠 로드될 때까지 크롤러가 기다려야 하는 시간(초)을 입력합니다. 기본적으로 5초 또는 페이지 로드가 완료될 때까지 중 먼저 도래하는 시점까지 기다립니다.
  6. 선택자 대기 시간 에 크롤러가 콘텐츠를 추출하기 전에 로드할 때까지 기다려야 하는 HTML 요소에 대한 CSS 선택자를 입력합니다.

    선택한 요소가 없는 경우에도 크롤러는 해당 페이지를 크롤링합니다.

    각 CSS 선택기를 별도의 줄에 나열합니다.

  7. 선택자 대기 에 크롤러가 콘텐츠를 추출하기 전에 로드할 때까지 기다려야 하는 HTML 요소에 대한 CSS 선택자를 입력합니다.

    선택한 요소가 없으면 크롤러가 해당 페이지를 크롤링하지 않습니다.

    각 CSS 선택기를 별도의 줄에 나열합니다.

  8. 최대 스크롤 높이 에 크롤러가 스크롤해야 하는 최대 픽셀 수를 입력합니다.

    크롤러는 네트워크가 유휴 상태이거나 이 스크롤 높이에 도달할 때까지 페이지를 스크롤하여 더 많은 콘텐츠를 로드합니다. 스크롤을 완전히 사용 중지하려면 0으로 설정합니다.

    원시 HTTP 클라이언트를 사용할 때에는 JavaScript를 실행하거나 동적 콘텐츠 로드하지 않으므로 이 설정이 적용되지 않습니다.

  9. 컨테이너를 고정으로 설정 에 하위 콘텐츠가 숨겨져 있더라도 유지되어야 하는 HTML 요소에 대한 CSS 선택기를 입력합니다.

    각 CSS 선택기를 별도의 줄에 나열합니다.

    이는 페이지에서 숨겨진 콘텐츠를 완전히 제거하는 페이지에서 클릭 가능한 요소 확장 옵션을 사용할 때 유용합니다.

연결된 모든 지식 소스 보기

고급 AI 상담사의 설정에서 현재 연결된 모든 콘텐츠 소스를 볼 수 있습니다. AI 상담사는 이러한 소스를 사용하여 고객 질문에 대한 답변을 생성합니다.

모든 연결된 콘텐츠 소스를 보려면 다음과 같이 하세요.

  1. AI 상담사 - 어드밴스드에서 작업하려는 어드밴스드 AI 상담사를 선택합니다.
  2. 사이드바에서 콘텐츠를 클릭한 다음 지식을 선택합니다.

    이 페이지에는 현재 고급 AI 상담사 에 연결된 모든 지식 소스 목록이 표시됩니다.

번역 고지 사항: 본 문서는 콘텐츠에 대한 기본적인 이해를 제공하기 위해 자동 번역 소프트웨어를 사용하여 번역되었습니다. 정확한 번역을 제공하고자 합당한 노력을 기울였으나 Zendesk는 번역의 정확성을 보장하지 않습니다.

번역된 문서에 포함된 정보의 정확성과 관련하여 질문이 있으시면 문서의 공식 버전인 영문 버전을 참조하시기 바랍니다.

Zendesk 제공