搜索抓取程序可用于在帮助中心进行联合搜索,而无需使用开发者资源。您可在帮助中心设置多个抓取程序,用以抓取相同或不同网站的内容并将其编入索引。请参阅搜索抓取程序的工作方式。
注意:在使用帮助中心搜索抓取程序时,您有责任遵守所有适用法律以及相关网站的条款和条件。您只能在您拥有与此类网站地图关联的域名时添加网站地图。使用帮助中心搜索抓取程序,即表示您确认自己拥有要添加到该抓取程序的所有网站地图的域名,并且您有权抓取此类网站。
设置搜索抓取程序
-
在 Guide 中,单击侧栏中的设置图标 (),然后单击搜索设置。
- 在抓取程序下,单击管理。
- 单击添加抓取程序。
- 在命名此抓取程序中,配置以下内容:
- 名称 - 输入您要分配给抓取程序的名称。这是一个内部名称,用于在抓取程序管理列表中标识您的搜索抓取程序。
-
所有者 - 输入负责抓取程序维护和故障排除的 Guide 管理员用户姓名。默认情况下,创建抓取程序的用户是抓取程序负责人,但您可以将此名称更改为任意 Guide 管理员。
抓取程序负责人在抓取程序成功运行和出现错误通知时都会收到电邮通知,例如域名验证、网站地图处理或抓取页面等方面的问题。请参阅排除搜索抓取程序故障。
- 在添加您要抓取的网站中,通过配置以下内容验证您对域名的所有权:
- 网站 URL:输入您要抓取的网站 URL。
-
域名所有权验证:单击复制,将 HTML 标签复制到您的剪贴板,然后将该标签粘贴到您网站未通过身份验证的主页 HTML 代码的 <head> 部分。您可以在完成抓取程序设置后进行此操作,并始终可以在“编辑抓取程序”页面上找到验证标签。请参阅管理搜索抓取程序。
注意:该标签就位后请勿将其移除,因为抓取程序每次运行时都需要成功完成域名验证。
- 在添加网站地图的网站地图 URL 中,输入您希望抓取程序在抓取您的网站时使用的网站地图 URL。网站地图必须遵循网站地图 XML 协议,并包含要抓取的网站中所有页面的列表。
网站地图可以是包含网站所有页面的标准网站地图,也可以是列出您希望抓取程序抓取页面的专用网站地图。所有网站地图都必须托管在抓取程序配置为要抓取的域名中。您可以在同一网站上设置多个抓取程序,每个抓取程序使用不同的网站地图,它们分别定义了您希望搜索抓取程序抓取的页面。注意:搜索抓取程序不支持网站地图索引。网站地图文件列出了您要索引的每个页面的 URL,而网站地图索引文件列出了各个网站地图的 URL。
- 在添加筛选以帮助人员找到此内容中,配置终端用户用于筛选搜索结果的来源和类型筛选。来源是指外部内容的来源,例如论坛、问题跟踪程序或学习管理系统。类型是指内容的类型,例如博客文章、技术说明或错误报告。
- 来源 - 单击箭头,然后从列表中选择来源,或选择 + 创建新来源,以添加描述此内容所在位置的名称。
- 类型 - 单击箭头,然后从列表中选择类型,或选择 + 创建新类型,以添加描述此内容属于何种类型的名称。
注意:要编辑或删除在搜索抓取程序设置期间创建的来源和类型,请参阅管理搜索筛选。 - 单击完成。
搜索抓取程序已创建并待处理。抓取程序将在 24 小时内验证域名的所有权,然后抓取并解析指定的网站地图。网站地图处理成功后,抓取程序即开始抓取页面,并对其内容建立索引。如果抓取程序在域名验证或处理网站地图时失败,抓取程序所有者将收到一封带有故障排除提示的电邮通知,以帮助解决问题。抓取程序将在 24 小时后重试。请参阅排除搜索抓取程序故障。注意:Zendesk/External-Content 是搜索抓取程序的用户代理。要防止抓取程序由于防火墙阻止请求而失败,请将 Zendesk/External-Content 加入白名单(或允许列表)。
- 设置联合搜索的帮助中心主题。
要使外部内容显示在您帮助中心搜索的搜索结果中,您必须设置一个支持联合搜索结果的主题。为此,请使用最新版本的 Copenhagen 主题,或将旧的 {{help_center_filters}} 和 {{filters}} 助手替换为新的 {{source_filters}} 和 {{type_filters}} 助手(请参阅帮助中心模板化指南)。
-
选择您要在帮助中心搜索结果中包含和排除的内容。请参阅在帮助中心搜索结果中包含外部内容。
-
根据需要配置知识结果,以便在知识搜索中包括外部内容。请参阅在背景信息面板中配置知识。