Mon édition
Module supplémentaire Agents IA - avancé

Les sources de connaissances sont les informations qu’un agent IA utilise pour créer des réponses générées par l’IA aux questions de vos utilisateurs. On parle aussi de réponses génératives.

L’ajout de sources de connaissances à votre agent IA lui permet de générer des réponses pour aider les clients sans que vous ayez à scripter chaque réponse.

Cet article aborde les sujets suivants :

  • À propos des sources de connaissances
  • Importation d’une source de connaissances

Articles connexes :

  • Configuration des règles de recherche pour les sources de connaissances pour les agents IA - Avancé

À propos des sources de connaissances

Vous pouvez importer les différents types de sources de connaissances suivants dans un agent IA - avancé.

  • Centres d’aide : centres d’aide Web fournis par Zendesk, Salesforce ou Freshdesk.
  • Fichiers CSV : fichiers CSV contenant des informations d’articles.

    L’importation de fichiers CSV est une bonne solution pour importer des bases de connaissances qui ne sont pas prises en charge nativement ou qui sont protégées par la connexion unique.

  • Contenu importé par un crawler Web : informations provenant d’une ou plusieurs pages Web.

    Cette option est un bon moyen d’importer les informations d’une base de connaissances, d’une page FAQ ou de description d’un produit, mais est moins efficace pour les boutiques en ligne. Pour les pages d’e-commerce, Zendesk vous conseille de créer une intégration capable d’extraire les informations de produits pertinentes et de les ajouter à un dialogue ou une procédure générative.

Vous pouvez ajouter plusieurs sources de connaissances à un seul agent IA. Par exemple, vous pouvez importer des articles à partir de plusieurs centres d’aide Zendesk, de plusieurs fichiers CSV ou des deux. Néanmoins, nous vous conseillons de ne pas importer un nombre trop important de sources de connaissances, car cela cause parfois des problèmes de précision ou de latence.

Il est important de comprendre que votre agent IA n’effectue pas de recherches directement dans un centre d’aide, un fichier ou un site Web, mais que les données sont importées dans l’agent IA de manière ponctuelle ou récurrente. Ce sont ces informations importées que l’agent IA utilise pour générer ses réponses.

Importation d’une source de connaissances

Les administrateurs clients peuvent importer des sources de connaissances pour un agent IA.

Pour importer une source de connaissances

  1. En haut à droite du module Agents IA - avancé, utilisez le champ déroulant des agents IA pour sélectionner l’agent IA pour lequel vous voulez importer une source de connaissances.
  2. Dans la barre latérale sur la gauche, cliquez sur l’une des options suivantes :
    • Paramètres > Réponses génératives > Sources de connaissances pour un agent IA sans formation.
    • Contenu > Connaissances > Sources de connaissances pour un agent IA agentique.

      La page des sources de connaissances s’ouvre.

  3. Cliquez sur Ajouter une source.

    La page Ajouter une source s’ouvre.

  4. Dans le menu déroulant Type, sélectionnez l’une des options suivantes :
    • Zendesk : importe un centre d’aide Zendesk.
    • Salesforce : importe un centre d’aide Salesforce.
    • Freshdesk : importe un centre d’aide Freshdesk.
    • Fichier (CSV) : importe un fichier au format .csv.
    • Crawler Web : importe le contenu d’un site Web spécifique.
  5. Suivez les instructions ci-dessous pour la source de votre choix :
    • Importation d’un centre d’aide Zendesk
    • Importation d’un centre d’aide Salesforce
    • Importation d’un centre d’aide Freshdesk
    • Importation d’un fichier CSV
    • Importation du contenu avec un crawler Web

Importation d’un centre d’aide Zendesk

  1. Dans le volet Ajouter une source, pour Type, sélectionnez Zendesk.
  2. Dans URL du centre d’aide, saisissez l’URL de votre centre d’aide Zendesk.
    Ajoutez la totalité de votre centre d’aide en incluant l’URL complète (par exemple, votresousdomaine.zendesk.com/hc), ou n’ajoutez qu’une langue spécifique de votre centre d’aide en spécifiant également le paramètre régional à la fin du chemin de l’URL (par exemple,, votresousdomaine.zendesk.com/hc/en-us).
  3. Dans Nom de la source, saisissez un nom pour votre source.

    Ce nom est utilisé dans les rapports des Agents IA - Avancé.

  4. Dans Fréquence d’importation, sélectionnez la fréquence à laquelle vous voulez que le contenu du centre d’aide soit réimporté : Quotidienne, Hebdomadaire, Mensuelle ou Jamais.

    Mensuelle signifie le 15 du mois. Quotidienne signifie tous les jours sauf le 15 du mois.

    En réimportant régulièrement le contenu du centre d’aide, vous vous assurez que votre agent IA reste à jour. Si vous ne voulez importer le contenu qu’une seule fois, sélectionnez Jamais. Les importations quotidiennes ne sont pas recommandées, sauf si votre source de connaissances est mise à jour très souvent. La plupart des organisations peuvent se contenter d’importations hebdomadaires ou mensuelles. N’oubliez pas que vous pouvez toujours effectuer une réimportation manuelle si des modifications apportées hors du calendrier des réimportations doivent être reflétées dans les réponses de votre agent IA.

  5. Pour importer des articles restreints :
    1. Cliquez sur le bouton pour activer Importer les articles privés.
    2. Dans E-mail, saisissez l’adresse e-mail d’un utilisateur autorisé à accéder au contenu restreint.

      Il s’agit généralement de l’adresse e-mail d’un administrateur Guide.

    3. Dans Token d’accès à l’API, saisissez un token API que vous générez dans ce but.
  6. Cliquez sur Importer.
Remarque – Quand vous importez des articles restreints, si l’adresse e-mail ou le token API est incorrect, aucun avertissement ni message d’erreur ne s’affiche, mais seuls les articles publics sont importés (pas les articles restreints). Nous vous conseillons vivement de bien vérifier ces identifiants avant l’importation et de vérifier que l’agent IA est capable de répondre à des questions en utilisant des articles restreints une fois l’importation terminée.

Importation d’un centre d’aide Salesforce

  1. Dans le volet Ajouter une source, pour Type, sélectionnez Salesforce.
  2. Cliquez sur Se connecter à Salesforce.
  3. Connectez-vous à votre environnement Salesforce.
  4. Dans URL du centre d’aide, saisissez l’URL complète de votre centre d’aide Salesforce.
  5. Dans Nom de la source, saisissez un nom pour votre source.

    Ce nom est utilisé dans les rapports des Agents IA - Avancé.

  6. Dans Fréquence d’importation, sélectionnez la fréquence à laquelle vous voulez que le contenu du centre d’aide soit réimporté : Quotidienne, Hebdomadaire, Mensuelle ou Jamais.

    Mensuelle signifie le 15 du mois. Quotidienne signifie tous les jours sauf le 15 du mois.

    En réimportant régulièrement le contenu du centre d’aide, vous vous assurez que votre agent IA reste à jour. Si vous ne voulez importer le contenu qu’une seule fois, sélectionnez Jamais. Les importations quotidiennes ne sont pas recommandées, sauf si votre source de connaissances est mise à jour très souvent. La plupart des organisations peuvent se contenter d’importations hebdomadaires ou mensuelles. N’oubliez pas que vous pouvez toujours effectuer une réimportation manuelle si des modifications apportées hors du calendrier des réimportations doivent être reflétées dans les réponses de votre agent IA.

  7. Cliquez sur Importer.

Importation d’un centre d’aide Freshdesk

  1. Dans le volet Ajouter une source, pour Type, sélectionnez Freshdesk.
  2. Dans URL du centre d’aide, saisissez l’URL de votre centre d’aide Freshdesk.
  3. Dans Nom de la source, saisissez un nom pour votre source.

    Ce nom est utilisé dans les rapports des Agents IA - Avancé.

  4. Dans Fréquence d’importation, sélectionnez la fréquence à laquelle vous voulez que le contenu du centre d’aide soit réimporté : Quotidienne, Hebdomadaire, Mensuelle ou Jamais.

    Mensuelle signifie le 15 du mois. Quotidienne signifie tous les jours sauf le 15 du mois.

    En réimportant régulièrement le contenu du centre d’aide, vous vous assurez que votre agent IA reste à jour. Si vous ne voulez importer le contenu qu’une seule fois, sélectionnez Jamais. Les importations quotidiennes ne sont pas recommandées, sauf si votre source de connaissances est mise à jour très souvent. La plupart des organisations peuvent se contenter d’importations hebdomadaires ou mensuelles. N’oubliez pas que vous pouvez toujours effectuer une réimportation manuelle si des modifications apportées hors du calendrier des réimportations doivent être reflétées dans les réponses de votre agent IA.

  5. Dans Token d’accès à l’API, saisissez un token API que vous générez dans Freshdesk dans ce but.
  6. Cliquez sur Importer.

Importation d’un fichier CSV

  1. Dans le volet Ajouter une source, pour Type, sélectionnez Fichier (CSV).
  2. Cliquez sur Sélectionner un fichier CSV comme source de connaissances.
  3. Sélectionnez le fichier CSV à importer.

    Consultez Formatage du fichier CSV pour vous assurer que votre fichier est formaté correctement.

  4. Dans Nom de la source, saisissez un nom pour votre source.

    Ce nom est utilisé dans les rapports des Agents IA - Avancé.

  5. Cliquez sur Importer.
Remarque – Il est impossible de réimporter les fichiers CSV automatiquement. Si votre contenu change, vous devez mettre le fichier CSV à jour ou en créer un nouveau que vous importerez.

Formatage du fichier CSV

Le fichier CSV que vous importez comme source de connaissances doit avoir une ligne pour chaque article que vous souhaitez importer. Il doit inclure les colonnes suivantes :

  • title : le titre de l’article.
  • content : le contenu intégral de l’article.
    • Le contenu peut inclure des balises HTML, vous n’avez donc pas besoin de les supprimer. D’ailleurs, ces balises peuvent être utiles pour structurer les articles, ce qui aide l’agent IA à comprendre les sections d’un article.
    • Le contenu peut aussi contenir du code Markdown, mais il doit être valide. Sinon, le contenu de la cellule ne sera pas importé. En outre, si le code Markdown a été rédigé de telle façon que la cellule est une seule ligne de plus de 2 000 caractères, l’importation échoue sans avertissement.

Vous pouvez aussi inclure les colonnes facultatives suivantes :

  • labels : une liste de libellés séparés par des espaces. Vous pouvez choisir n’importe quelles valeurs qui vous permettent de catégoriser le contenu.
  • locale : cela vous permet d’organiser les articles par langue ou par marché. En théorie, vous pouvez utiliser n’importe quelles valeurs, mais vous conseillons de suivre les normes courantes (p. ex., en-US ou fr-FR).
  • article_url : l’adresse Web externe où se trouve l’article. Cela est utilisé pour l’attribution des sources dans le widget et les rapports dans Agents IA - Avancé.

Le format de fichier doit utiliser une virgule (,) comme séparateur de colonne et des guillemets doubles (") comme caractère de citation de chaîne. La première ligne est toujours réservée aux en-têtes de colonnes.

Importation du contenu avec un crawler Web

Remarque – Actuellement, vous ne pouvez pas utiliser le crawler Web sur un site protégé par la connexion unique, mais vous pouvez importer un fichier CSV.
  1. Dans le volet Ajouter une source, pour Type, sélectionnez Crawler Web.
  2. Dans Nom de la source, saisissez un nom pour votre source.

    Ce nom est utilisé dans les rapports des Agents IA - Avancé.

  3. Sélectionnez Explorer l’URL exacte si vous voulez que le crawler Web importe les informations des pages Web répertoriées dans le champ URL de départ, sans inclure les sous-pages.

    Quand cette option n’est pas sélectionnée, le crawler Web applique un niveau d’exploration maximal de 15 sous-pages pour les URL répertoriées dans le champ URL de départ.

  4. Dans URL de départ, saisissez les URL que vous voulez que le crawler Web explore.

    Saisissez une seule URL par ligne.

  5. Dans Fréquence d’importation, sélectionnez la fréquence à laquelle vous voulez que le contenu exploré soit réimporté : Quotidienne, Hebdomadaire, Mensuelle ou Jamais.

    Mensuelle signifie le 15 du mois. Quotidienne signifie tous les jours sauf le 15 du mois.

    En réimportant régulièrement le contenu du centre d’aide, vous vous assurez que votre agent IA reste à jour. Si vous ne voulez importer le contenu qu’une seule fois, sélectionnez Jamais. Les importations quotidiennes ne sont pas recommandées, sauf si votre source de connaissances est mise à jour très souvent. La plupart des organisations peuvent se contenter d’importations hebdomadaires ou mensuelles. N’oubliez pas que vous pouvez toujours effectuer une réimportation manuelle si des modifications apportées hors du calendrier des réimportations doivent être reflétées dans les réponses de votre agent IA.

  6. (facultatif) Développez la section Crawler Settings pour configurer les paramètres avancés du crawler.

    Consultez Configuration des paramètres de crawler avancés pour en savoir plus.

    Remarque – Ces paramètres ne sont conseillés que pour les organisations avec des exigences techniques complexes. De nombreuses organisations n’en ont pas besoin.
  7. (facultatif) Développez la section HTML Processing pour configurer les paramètres HTML avancés.

    Consultez Configuration des paramètres HTML avancés pour en savoir plus.

    Remarque – Ces paramètres ne sont conseillés que pour les organisations avec des exigences techniques complexes. De nombreuses organisations n’en ont pas besoin.
  8. Cliquez sur Importer.

Configuration des paramètres de crawler avancés

  1. Sous Crawler Settings, dans Crawler type, sélectionnez l’une des options suivantes :
    • Adaptive switching between browser and raw HTTP (Default) : rapide, rend le contenu JavaScript s’il y en a.
    • Headless browser (Firefox + Playwright) : fiable, rend le contenu JavaScript, idéal pour éviter les blocages, mais peut parfois être lent.
    • Raw HTTP client (Cheerio) : option la plus rapide, mais ne rend pas le contenu JavaScript.
    • Raw with JavaScript : pour explorer la page comme si vous utilisiez JavaScript.
  2. Sélectionnez Inclure les URL ou Exclure des URL pour personnaliser le niveau d’exploration défini dans le champ URL de départ ci-dessus.

    Dans le champ sous chaque paramètre, saisissez les URL que vous voulez inclure ou exclure. Saisissez une seule URL par ligne.

    Ces paramètres n’affectent que les liens trouvés pendant l’exploration des sous-pages. Si vous voulez explorer une page, spécifiez son URL dans le champ URL de départ.

    Par exemple, si la structure des URL n’est pas homogène comme dans l’exemple ci-dessous :

    • URL de départ : https://support.example.com/en/support/home
    • URL de l’article : https://support.example.com/en/support/solutions/articles/…
    Vous pouvez ajouter l’URL suivante dans le champ Inclure les URL :
    • https://support.example.com/en/support/**

    Ainsi, le crawler Web inclura tous les articles, même si leur chemin n’est pas le même que celui du chemin de l’URL de départ.

    La page ci-dessous est un autre exemple, car elle est très large et inclut des pages qui ne sont pas pertinentes (la page des carrières, p. ex.) :
    • URL de départ : https://www.example.com/en
    Pour exclure ces pages qui ne sont pas pertinentes, vous pouvez ajouter l’URL suivante dans le champ Exclure des URL :
    • https://www.example.com/en/careers/**
    Ainsi, le crawler Web exclura tout le contenu de la page des emplois et de ses sous-pages.
    Conseil : les globs, des schémas qui vous permettent d’utiliser des caractères spéciaux pour créer des URL dynamiques que le crawler Web peut explorer, sont plus puissants que le texte brut. Voici quelques exemples :
    • https://support.example.com/** permet au crawler d’accéder à toutes les URL qui commencent par https://support.example.com/.
    • https://{store,docs}.example.com/** permet au crawler d’accéder à toutes les URL qui commencent par https://docs.example.com.
    • https://example.com/**/*\?*foo=* permet au crawler d’accéder à toutes les URLs qui contiennent des paramètres de requête foo avec n’importe quelle valeur.
    Pour en savoir plus sur les globs et les essayer, rendez-vous sur le site Web DigitalOcean.
  3. Dans Nombre maximal de pages à explorer, saisissez le nombre de pages maximum que le crawler Web explorera, URL de départ comprise.

    Cela inclut l’URL de départ, les pages de pagination, les pages sans contenu, etc. Le crawler Web s’arrêtera automatiquement une fois cette limite atteinte.

  4. Dans Profondeur d’exploration maximale, saisissez le nombre maximal de liens que le crawler Web suivra à partir de l’URL de départ.

    L’URL de départ a une profondeur de 0. Les pages liées directement depuis l’URL de départ ont une profondeur de 1 et ainsi de suite. Utilisez ce paramètre pour éviter tout emballement accidentel de la part du crawler Web.

  5. Sous Configuration du proxy, choisissez l’une des options suivantes :
    • Centre de données (par défaut) : méthode la plus rapide pour extraire des données.
    • Résidentiel : performances réduites, mais moins de chances d’être bloqué. Méthode idéale quand le proxy par défaut est bloqué ou quand vous devez explorer à partir d’un pays spécifique.

Configuration des paramètres HTML avancés

  1. Sous HTML processing, dans Keep HTML elements, saisissez un sélecteur CSS pour conserver uniquement les éléments HTML spécifiés.

    Tout le reste du contenu sera supprimé, ce qui vous aide à vous concentrer sur les informations pertinentes.

  2. Dans Remove HTML elements, choisissez les éléments HTML à supprimer avant la conversion en texte ou Markdown, ou l’enregistrement au format HTML.

    Cela vous aide à exclure le contenu indésirable ou inutile.

  3. Dans Expand clickable elements, saisissez un sélecteur CSS valide correspondant aux éléments DOM sur lesquels les utilisateurs cliqueront.

    Cela est utile pour développer les sections réduites afin de capture leur contenu texte.

  4. Dans Transformateur HTML, sélectionnez l’une des valeurs suivantes pour définir comment nettoyer le contenu HTML pour ne garder que le contenu important et supprimer le contenu superflu (navigation ou fenêtres contextuelles, p. ex.) :
    • Extractus : (déconseillé) utilise la bibliothèque Extractus.
    • Aucun : supprime uniquement les éléments HTML spécifiés dans l’option Remove HTML elements ci-dessus.
    • Texte lisible : utilise la bibliothèque de lisibilité Mozilla pour extraire le contenu principal de l’article, en supprimant la navigation, les en-têtes, les pieds de page et autres éléments non essentiels. Idéal pour les sites Web et les blogs avec beaucoup d’articles.
    • Readable text if possible : utilise la bibliothèque de lisibilité Mozilla pour extraire le contenu principal de l’article, mais se replie sur le contenu HTML original si la page ne semble pas être un article. Cette option est utile pour les sites Web avec des types de contenu mixte, comme des articles et des pages de produits, car elle préserve plus de contenu des pages qui ne sont pas des articles.

  5. Dans Wait for dynamic content, saisissez le nombre de secondes pendant lesquelles le crawler doit attendre que le contenu dynamique se charge. Par défaut, il attend cinq secondes ou la fin du chargement de la page, selon ce qui se produit en premier.
  6. Dans Soft wait for selector, saisissez des sélecteurs CSS pour les éléments HTML desquels le crawler devrait attendre le chargement avant d’extraire le contenu.

    Si l’élément sélectionné n’est pas présent, le crawler explore quand même la page.

    Saisissez un seul sélecteur CSS par ligne.

  7. Dans Wait for selector, saisissez des sélecteurs CSS pour les éléments HTML desquels le crawler doit attendre le chargement avant d’extraire le contenu.

    Si l’élément sélectionné n’est pas présent, le crawler n’explore pas la page.

    Saisissez un seul sélecteur CSS par ligne.

  8. Dans Max scroll height, saisissez le nombre maximal de pixels que le crawler doit explorer.

    Le crawler fait défiler la page pour charger plus de contenu jusqu’à ce que le réseau soit inactif ou que cette hauteur de défilement soit atteinte. Pour désactiver le défilement, définissez cette valeur sur 0.

    Ce paramètre ne s’applique pas quand vous utilisez le client HTTP brut, car il n’exécute pas JavaScript et ne charge pas le contenu dynamique.

  9. Dans Make containers sticky, saisissez des sélecteurs CSS pour les éléments HTML pour lesquels le contenu enfant doit être conservé, même s’il est masqué.

    Saisissez un seul sélecteur CSS par ligne.

    Cette option est utile quand vous utilisez l’option Expand clickable elements sur des pages qui suppriment totalement le contenu masqué de la page.

Réalisé par Zendesk