ヘルプセンターでは、ナレッジベースの記事とコミュニティ投稿に対して、また、横串検索が有効かつ設定されている場合は、ブログやWebサイトなどの外部コンテンツに対して、全文検索が実行されます。
ユーザーが検索クエリをヘルプセンターに入力したら、検索アルゴリズムが作動し、最も関連性の高い結果のインデックスを検索して、ランク付けします。ナレッジベースの記事、コミュニティの投稿、または外部コンテンツのコンテンツから関連するスニペットが作成され、検索結果および関連する検索フィルターが検索結果ページに表示されます。
メモ:ヘルプセンター検索は、ヘルプセンター内のコンテンツを検索する方法の1つです。その他の検索方法については、「ヘルプセンターの検索方式の概要」をご覧ください。
この記事では、次のシナリオについて説明します。
- 検索結果に含まれるコンテンツと除外されるコンテンツ
- 検索結果における関連性スコアの概要
- 検索結果の精度を上げるには
- 関連性に関するその他の機能
- エンドユーザーが期待どおりの検索結果を得られるようにする
検索結果に含まれるコンテンツと除外されるコンテンツ
ヘルプセンターを検索すると、ネイティブヘルプセンター内のすべてのナレッジベース記事(各記事の最初の10,000文字まで)が検索されます。また、検索に以下のものを含めることができます。
- アプリケーション内の他のヘルプセンターからの記事およびコミュニティ投稿:複数のヘルプセンターが有効になっていて、それらのヘルプセンターからの結果を含むように検索が構成されている場合、各ヘルプセンターブランドからの検索結果。詳しくは「複数のヘルプセンターをまたぐ検索の有効化」を参照してください。
- 外部ソースのコンテンツ:横串検索が有効で、外部コンテンツからの結果を含めるように検索が構成されている場合。詳しくは「Zendeskの横串検索について」を参照してください。
記事およびコミュニティ投稿
記事、投稿または外部コンテンツが返されると、検索エンジンは、検索に一致するスニペットをドキュメント本文から見つけようとします。ドキュメント本文またはコメントに一致するものがない場合、ドキュメント本文の先頭から抽出された部分が返されます。一致する場合、検索エンジンは記事または投稿を文に分割し、一致数に基づいて各文をランク付けします。次に、フラグメントが小さすぎないことを保証するために、スコアはフラグメント長によって正規化されます。
検索結果のデフォルトのスニペットサイズは120文字ですが、スニペットエンジンは常に完全な文章を含むフラグメントを返そうとするため、結果は多少異なる場合があります。
次のアイテムも検索結果に含まれる可能性があります。
- 制限付きコンテンツ:制限付きコンテンツへのアクセスを持つユーザーに対してのみ表示されます。
- 新規コンテンツ:コンテンツの追加や更新を行う場合、わずか数分で、コンテンツがインデックス付けされ、検索可能になります。
- コメント:記事と投稿のコメントもヘルプセンターの検索対象です。コメント内で検索結果スニペットが一致する限り、コメントは検索結果に表示されます。1つのコミュニティ投稿内にコメントの一致が複数ある場合、アルゴリズムは関連性の最も高いコメントスニペットを選択します。
- ハイパーリンク:ドキュメント本文内のURL、およびリンクテキストは、ヘルプセンターの検索対象です。
次のアイテムは検索結果に含まれません。
- 添付ファイル:記事の添付ファイルに含まれるコンテンツは、ヘルプセンターの検索対象外です。
- マイアクティビティ:ヘルプセンターのマイアクティビティを検索する場合、検索対象は、自分がアクセスできるチケットのみに限られます。記事は含まれません。
外部コンテンツ
外部コンテンツが使用可能な場合は、外部コンテンツのタイトルが、コンテンツを新しいブラウザタブで開くためのリンクと、検索に一致するドキュメント本文のスニペットと共に表示されます。ドキュメント本文に一致するものがない場合、ドキュメント本文の先頭から抽出された部分が返されます。
外部コンテンツソースのタイプとフィルターは、検索クローラーのセットアップ時または横串検索APIの構成時に定義されます。詳しくは「Zendeskの横串検索について」を参照してください。
検索結果における関連性スコアの概要
ランク付けされた検索結果は、関連性スコアに基づいており、スコアの髙い順に表示されます。
関連性スコアは、フィールドスコアごとの加重平均値で示されます。フィールドとは、レコードの一部で、データのアイテムを表すものです。以下はその例です。
- 記事または投稿のタイトルのフィールドの一致スコアが、他のフィールドの一致スコアより高くなる。
- 記事ラベルのフィールドの一致スコアが、他の本文フィールドの一致スコアより高くなる。
以下は現在のフィールドの重み付けです。
フィールド |
重み付け対象 |
重み付け対象 |
外部コンテンツの重み付け |
タイトル |
3 |
3 |
3 |
詳細(コミュニティ投稿の本文) |
該当なし |
1 |
該当なし |
本文 |
1 |
該当なし |
1 |
ラベル |
2.8 |
該当なし |
該当なし |
コメント |
1 |
1 |
該当なし |
セクションのタイトル |
1.5 |
該当なし |
該当なし |
関連性スコアは、次の要因を考慮するテキスト分析プロセスの影響も受けます。
- 完全一致:結果が検索文字列内の単語と完全に一致する場合。部分一致よりも高いスコアになります。
- 部分一致:単語の語幹が一致する場合。たとえば、単語の単数形と複数形は一致と見なされます。
- 単語の出現頻度:1個のフィールド内で返される一致の回数。出現頻度が高いほど、スコアは高くなります。
- フィールドの長さ:短いフィールドの一致は、長いフィールドの一致よりも高いスコアになります。たとえば、ひとつの単語を検索したときに、その単語1語から成るタイトルとの一致の方が、その単語を含むより長いタイトルとの一致よりも、高いスコアになります。
- 近接ブースト:すべての検索用語が同じフィールド内に近接して含まれる場合に重み付けが高くなります。たとえば、すべての検索語が記事のタイトルに含まれる場合、近接性が強いと評価され、検索結果の関連性が高くなります。
- フレーズブースト:クエリが複数ある場合は、単語の並びが正確な結果が優先されます。たとえば、「car park」を検索した場合、「park car」よりも「car park」を含んだ結果のほうが優先されます。
- クエリの長さ:検索語が1つまたは2つの単語の場合、アルゴリズムによって、すべての検索語が一致するドキュメントのみが返されますが、クエリが長い場合は、検索語の40%が検索結果としてドキュメント内に存在する必要があります。
- 検索結果の全体の数量と品質
- セマンティック検索:Guideでは、ユーザーの検索クエリの目的と文脈に基づいて、ランキングを向上させ、可能な限り正確な検索結果を生成する方法として、セマンティック検索を導入しました。 セマンティック検索は、すべてのコンテンツタイプ、言語、検索チャネルに段階的に展開されます。詳しくは「セマンティック検索とそのしくみについて」を参照してください。
検索結果の精度を上げるには
テキストの解析結果以外にも、記事および投稿に重み付けをするための機能がいくつかあります。以下にそれらを示します。
- 記事への投票:エンドユーザーは、「役に立った」または「役に立たなかった」と記事を評価できます。その結果、一定期間が過ぎた後、「50人中、10人が「役に立った」と投票しました」というスコアが付きます。 「役に立った」の投票率が高い記事に重みを付け、この投票率が低い記事よりも検索結果の上位に表示されるようにします。記事への投票数も重み付けに影響を与えます。たとえば、50人中10人が役に立ったと投票した場合、100人中10人が役に立ったと投票した場合よりも、髙く重み付けされます。
- コミュニティ投稿への投票(Guide ProfessionalまたはEnterpriseが必要):エンドユーザーはその内容に応じて、コミュニティ投稿を各記事ごとに、「役に立った」または「役に立たなかった」と評価できます。「役に立った」と投票された割合の高い投稿は、そうでない投稿よりも検索結果の上位に表示されます。
- ラベル(Guide ProfessionalまたはEnterpriseが必要):ラベルを使用することで、検索結果において記事の関連性スコアを変えることができます。ナレッジベースの検索結果とのバランスをよく考えてラベルを付けるようにしましょう。
関連性に関するその他の機能
あいまい検索
あいまい検索は、一部の言語で利用できます。この検索は、特定の記事や投稿の内容に検索フィールドの検索語と完全に一致する内容が存在しなくても、それらの記事や投稿と検索クエリとの関連性が高いと見なすプロセスです。このテクニックを使えば、ユーザーが検索語の入力でスペルミスをしても、適切な検索結果が得られます。
接尾辞や接頭辞を除外して検索語の語根取り出すステミングの処理とは異なり、あいまい検索では編集距離を使用して、検索語に近い言葉を含んだ検索結果を特定します。 たとえば「user segmemt」を検索した場合、検索エンジンは「user segment」を含んだ結果も返します。
近似の一致結果を見つけ出す現行のルールは次のようになっています。
- 検索語の文字のうち少なくとも2つが正確に一致している
- 3から5つの文字が含まれている検索語の場合、タイポは1つ許容される
- 6文字以上の言葉の場合、タイポは2つまで許容される
ヘルプセンターでは、日本語、韓国語、中国語のファジー検索はできません。
言語サポートの最適化
特定の言語で記述されたコンテンツには、特別な最適化を施しています。
ステミングは、言語固有の処理です。英語において「films」という言葉を検索した場合、「film」という単数形の言葉を含む検索結果をユーザーが求めていると、検索エンジンは理解しています。 同様のルールが、すべての言語に当てはまります。
言語固有の別の要素として、ストップワードがあります。検索結果が多くなりすぎるのを防ぐためにある言語で通常検索クエリから除外する言葉として最もよく知られているのがストップワードです。たとえば英語では、「the」がストップワードになります。
ヘルプセンターの検索の場合、エンドユーザーが行うすべての検索の最大で99%を占める多数の言語について、ステミングのルールとストップワードが認識されています。
Zendeskでは、以下の言語に関して検索の最適化を進めています。
また、これら以外のすべての言語について、基本的な検索のサポートを提供しています。
エンドユーザーの検索エクスペリエンスを向上させる
ユーザーの検索エクスペリエンスを改善する方法はいくつかあります。
カスタムテーマで、検索結果をハイライト表示する色を変更することを検討してください。CSSを使用して検索結果に含まれるキーワードのハイライト表示を変更します。
過去30日間にヘルプセンター内で検索された語句を確認できる検索アナリティクスダッシュボードを使用できます。ここには、検索された各語句について、検索回数、返された検索結果の件数と種類(検索がヒットした場合)、クリックスルー、および次のアクションが表示されます。
メモ:Talk ProfessionalまたはEnterpriseが必要です。
検索アナリティクスにより、カスタマーが探しているものや、カスタマーが回答を得られなかったものについて、洞察を得ることができます。エンドユーザーが期待どおりの検索結果を得られるように、検索データを分析して、検索精度とナレッジベースコンテンツの質を高めるために対策を立てましょう。詳しくは「Exploreを使用したヘルプセンターの検索結果の分析」を参照してください。
ExploreでSearchダッシュボードにアクセスするには
- Zendesk製品トレイで、Exploreアイコン()をクリックします。
- ダッシュボードのリストで、Zendesk Guideダッシュボードを選択します。
- 「Search」タブをクリックします。
コンテンツを見つけやすいようにユーザーにヒントを提供する
エンドユーザーが検索でコンテンツを見つけやすくするためにおすすめのオペランドがいくつかあります。
-
複数の単語の検索: 複数の単語すべてを含むコンテンツを探すには、各単語を二重引用符(")で囲みます。
たとえば、「"article" "title" "section" "author"
」と入力すると、4つの単語すべてを任意の順序で含むコンテンツが返されます。 各単語の間にはスペースを必ず入れてください。そうしないと、検索でテキストが1つの文字列として処理されます。
コンテンツに、語幹が同じ単語がある場合はヒットします(例:articles)。 コンテンツに、たとえば「title」と「section」という単語のみが含まれる場合は、ヒットしません。
単語を単一引用符(')で囲んでも、単一引用符は無視されます。 「'article' 'title' 'section' 'author'
」を検索すると、「title」、「article」、「section」、または「author」のいずれかの単語を含むコンテンツのすべてのヒットが検索結果として返されます(一重引用符なしで検索した場合とまったく同じ)。 -
語句を検索: 語句を二重引用符(")で囲んで、その語句内のすべての単語を含むコンテンツを検索します。
たとえば、「"article title"
」と検索すると、「article」と「title」がこの順序で含まれるコンテンツがヒットします。 語幹が同じ単語(「articles」など)を含むコンテンツもヒットしますが、 「title」のみが含まれるコンテンツはヒットしません。
単語を単一引用符(')で囲んでも、単一引用符は無視されます。 -
特定の単語を含むコンテンツを除外: 検索語の前にマイナス演算子(-)を使用して、その単語または語句を含まないコンテンツを検索します。
たとえば、「reporting bugs -support」を検索すると、「reporting」と「bugs」という単語を含むコンテンツが返され、単語「support」を含むコンテンツは結果セットから除外されます。
メモ:マイナス演算子(-)の後に同じ単語を繰り返さないでください。例えば、「"cannot send -cannot set"
」と検索すると、「cannot」が繰り返されているため、検索結果は返されません。代わりに、"cannot send -set"
を検索すると、"cannot set"という語句を含む記事を除く結果が返されます。 -
オペランドを組み合わせて詳細検索を行う:上記のオペランドを組み合わせることで、より具体的な結果セットを見つけることができます。
たとえば、「"reporting bugs" -support」を検索すると、「reporting」と「bugs」の両方の単語を含み、「support」という単語を含まないコンテンツが返されます。