Ein Gebietsschema ist ein Standard, der die Sprache der Help-Center-Inhalte und gegebenenfalls ihre regionale Variante (z. B. en-US für amerikanisches oder en-GB für britisches Englisch) angibt. Wenn Sie das Help Center zur Unterstützung mehrerer Sprachen konfiguriert haben, können Sie das Help Center lokalisieren und übersetzte Versionen der Inhalte hinzufügen oder einzelne Beiträge nur in bestimmten Sprachen bereitstellen.
Beim Indizieren stellt der Such-Crawler das Gebietsschema und die Sprache der externen Inhalte fest, sodass diese dem Help Center mit dem entsprechenden Gebietsschema zugeordnet werden können.
Dieser Beitrag enthält die folgenden Abschnitte:
Gebietsschemas im Help Center
Help-Center-Seiten werden je nach dem in der Seiten-URL angegebenen Gebietsschemacode (z. B. ".../hc/en-us") in unterschiedlichen Sprachen angezeigt. Jeder übersetzte Beitrag muss übergeordnete Seiten (Abschnitt und Kategorie) haben, die in die gleiche Sprache übersetzt sind.
Das folgende Diagramm zeigt den Aufbau des Gebietsschema-Tags für die Bezeichnung der Sprache und der regionalen Sprachvariante von Inhalten. Dieses Tag ist in der URL aller Beiträge im Help Center enthalten (z. B. https://helpcenter.zendesk.com/hc/en-us/articles/4408827609882).
Wie der Such-Crawler Gebietsschemas erkennt
Der Such-Crawler unterstützt die Verwaltung mehrerer Sprachen und Gebietsschemas im Help Center, indem er das Gebietsschema sowie die Sprache und die regionalen Sprachvarianten externer Inhalte bestimmt und die Inhalte dann mit dem erkannten Gebietsschema indiziert, damit sie dem entsprechenden Help Center zugeordnet werden können.
Um das Gebietsschema oder die Sprache zu bestimmen, versucht der Such-Crawler zunächst, das Gebietsschema aus dem Attribut lang
im Tag <html>
zu extrahieren, um festzustellen, ob es eine exakte Übereinstimmung für das Gebietsschema in einem beliebigen Help Center des Kontos gibt. Wenn er eine Übereinstimmung findet, indiziert er den Datensatz mit dem erkannten Gebietsschema. Wenn er hier kein oder kein exakt übereinstimmendes Gebietsschema erkennt, versucht der Crawler, das Gebietsschema erst aus dem Tag Content-Language header
und dann aus dem Tag
<meta>
zu extrahieren.
Wenn es keine exakte Übereinstimmung mit dem Tag lang
, Content-Language
header
oder meta
gibt, versucht der Crawler, die Help-Center-Gebietsschemas zu finden, die mit dem Sprachen-Subtag in html lang
übereinstimmen (der Teil „region“ im Tag lang
wird ignoriert, sofern vorhanden). Wenn der Such-Crawler beispielsweise bei einer Seite mit <html lang="en">
feststellt, dass im Konto die Gebietsschemas en-US und en-GB aktiviert sind, indiziert er den Datensatz sowohl für amerikanisches als auch für britisches Englisch.
Wenn das Tag lang
, Content-Language
header
oder <meta>
nicht definiert ist, führt der Crawler eine Textanalyse des Inhalts mithilfe von Compact Language Detection (CLD) durch, um die Sprache zu erkennen. Erkennt er dabei eine Sprache, so indiziert er den Datensatz mit den zu dieser Sprache passenden aktiven Gebietsschemas. Wenn der Such-Crawler beispielsweise feststellt, dass der Text in englischer Sprache verfasst ist, und im Konto die Gebietsschemas en-US und en-GB aktiviert sind, indiziert er den Datensatz sowohl für amerikanisches als auch für britisches Englisch.
Wenn er kein oder kein mit einer Help-Center-Übersetzung in Ihrem Konto übereinstimmendes Gebietsschema erkennt, generiert der Crawler den Fehler „Locale not detected“ (Gebietsschema nicht erkannt), der mit dem Fehlerbericht an den bei der Einrichtung des Such-Crawlers angegebenen Inhaber gesendet wird.