通过网络抓取程序,您无需开发者资源即可抓取外部内容并建立索引,以供在 Zendesk 帐户中需要使用外部内容的任何地方直接调用。您可以设置多个抓取程序,以抓取相同或不同网站的各种内容并建立索引。您还可以抓取特定 URL 列表,而无需抓取整个网站。

我的服务模式是什么?
所有 Suite: Team、Growth、Professional、Enterprise 或 Enterprise Plus
Support,含 Guide Professional 或 Enterprise

通过网络抓取程序,您无需开发者资源即可抓取外部内容并建立索引,以供在 Zendesk 帐户中需要使用外部内容的任何地方直接调用。您可以设置多个抓取程序,以抓取相同或不同网站的各种内容并建立索引。您还可以抓取特定 URL 列表,而无需抓取整个网站。

当用户在帮助中心进行搜索时,抓取程序发现的相关外部内容将进行排名,并显示在搜索结果页面上。用户可以筛选这些结果,并单击链接以在另一个浏览器标签中查看外部内容链接。

本文章涵盖以下主题:
  • 关于网络抓取程序
  • 设置网络抓取程序

关于网络抓取程序

您可以设置一个或多个网络抓取程序,以抓取相同或不同网站的外部内容并建立索引。从抓取的网站和网站内页面获取的内容可在您的 Zendesk 帐户中需要使用外部内容的任何地方使用。您要抓取的外部网站必须有一个网站地图,其中列出了网络抓取程序可以抓取的页面。此外,您要抓取的页面必须是公开的(无需身份验证)。

创建网络抓取程序时,您可以抓取整个网站,或仅限抓取设置期间指定页面(最多 5 个)。如果选择:
  • 抓取整个网站,抓取程序会自动找到与起始 URL 关联的网站地图或您指定的网站地图,然后用它抓取该网站的所有页面。
  • 仅限抓取单个页面,您可以指定 5 个要抓取的 URL。如果输入多个 URL,系统将自动选择仅限抓取这些 URL 选项。但是,如果只输入一个起始 URL,您仍可以手动选择该选项,仅限抓取单个页面。如果输入网站地图,该选项将取消选择并禁用,因为抓取程序必须抓取网站地图的所有页面。

创建新的抓取程序时,您分配给抓取程序的名称将用于创建来源值。来源值用作帮助中心搜索的筛选。如果您以后想更改名称,可以随时编辑或分配不同的来源名称。请参阅管理网络抓取程序。

配置完成后,抓取程序将按计划定期运行,访问网站地图的页面,并将这些来源的内容提取到帮助中心的搜索索引中。网络抓取程序会在初始页面加载时为页面源中的内容建立索引,即使该内容已被 UI 元素(如可折叠面板)隐藏。然而,由于抓取程序不运行 JavaScript,它们无法抓取 JavaScript 呈现的内容或初始页面加载后动态呈现的其他内容。

网络抓取程序不会抓取所访问页面上的链接,而只会按照配置访问网站地图中可以使用的页面。如果抓取程序在定期计划抓取过程中未能从网站收集信息(例如,网站瘫痪或出现网络问题),帮助中心将保留上一次抓取的结果,这些结果仍可在帮助中心搜索。

设置网络抓取程序

您可在帮助中心设置多个抓取程序,用以抓取相同或不同网站的内容并将其编入索引。设置网络抓取程序时,请考虑以下事项:
  • 网络抓取程序不适用于使用 gzip 文件压缩编码的网站。您将不会看到来自这些网站的搜索结果。
  • 网络抓取程序不会遵守外部网站 robots.txt 记录中设置的抓取延迟。
  • 更改频率标签绝对不会影响网络抓取程序。
注意:在使用帮助中心网络抓取程序时,您有责任遵守所有适用法律以及相关网站的条款和条件。您只能在您拥有与此类网站地图关联的域名时添加网站地图。使用帮助中心网络抓取程序,即表示您确认自己拥有要添加到该抓取程序的所有网站地图的域名,并且您有权抓取此类网站。

设置网络抓取程序

  1. 在知识管理中,单击侧栏中的设置 ()。
  2. 单击搜索设置。
  3. 在抓取程序下,单击管理。

  4. 单击添加抓取程序。

  5. 单击继续。

  6. 在同步来自网站的内容中,输入以下内容:
    • 您要分配给抓取程序的抓取程序名称。此名称可识别抓取程序管理列表中的网络抓取程序,并用于创建在帮助中心搜索中用作筛选的搜索来源值。
    • 您要抓取的一个或多个网站页面的起始 URL。如果您想要:
      • 抓取整个网站,请输入主域名(例如 zendesk.com)或网站地图路径(例如 zendesk.com/sitemap.xml)
      • 仅限抓取单个页面,请在此字段中输入域名/页面值(例如 test.com/faq.htm)。单击 + 添加另一个可添加 URL(最多 5 个)。

        选择此选项后,抓取程序将仅抓取设置期间指定的起始 URL 并建立索引。

  7. 单击同步。
    网络抓取程序将添加到抓取程序页面。抓取程序将在 24 小时内抓取并解析指定的网站地图。网站地图处理成功后,抓取程序即开始抓取页面,并对其内容建立索引。如果抓取程序失败,系统会向抓取程序所有者发送一封包含故障排除提示的电邮通知,以帮助其解决问题。抓取程序将定期重试。
    注意:Zendesk/External-Content 是网络抓取程序的用户代理。要防止抓取程序由于防火墙阻止请求而失败,请将 Zendesk/External-Content 加入白名单(或允许列表)。

如果您要设置网络抓取程序以提取外部内容用于:
  • 帮助中心搜索,则您需要选择要在帮助中心搜索结果中包含和排除的内容。请参阅在帮助中心搜索结果中包含外部内容。
  • 专员背景信息面板的“知识”组别,请参阅在背景信息面板中配置知识。
由 Zendesk 提供技术支持