Vous pouvez utiliser un crawler Web pour importer du contenu dans votre agent IA - avancé. Cela lui permet de créer des réponses générées par l’IA aux questions des clients, en s’appuyant sur les informations de sites Web externes.
Cet article vous fournit des meilleures pratiques pour l’utilisation d’un crawler Web pour importer du contenu dans un agent IA - avancé.
Cet article aborde les sujets suivants :
- Utilisez le crawler Web pour le bon type de site
- Limitez les réimportations à une fréquence raisonnable
- Limitez le nombre de sources de connaissances
- Consultez le résumé de l’importation
- Commencez modestement et testez
Articles connexes :
Utilisez le crawler Web pour le bon type de site
Le crawler Web est bien adapté aux sites Web qui fonctionnent comme des centres d’aide ou aux pages de description de produits. Pour les pages d’e-commerce, nous vous conseillons de créer une intégration capable d’extraire les informations de produits pertinentes et de les ajouter à un dialogue ou une procédure.
Il est conseillé d’utiliser un centre d’aide Zendesk comme source de connaissances principale. Les sites Web peuvent avoir n’importe quel format, notamment des éléments dynamiques et JavaScript, et sont donc plus difficiles à ingérer de façon prévisible. Le crawler Web a des options de configuration puissantes, mais elles nécessitent configuration et pratique. Les centres d’aide Zendesk sont, de par leur nature, plus simples et plus prévisibles au niveau du format, ce qui donne souvent de meilleurs résultats. Les importations sont aussi souvent plus rapides quand vous utilisez un centre d’aide Zendesk.
Seuls les sites Web accessibles au grand public peuvent être explorés. Si un site Web nécessite une authentification, le crawler Web ne peut pas y accéder.
Limitez les réimportations à une fréquence raisonnable
Les importations ne sont pas une recherche Web en temps réel. L’agent IA n’effectue pas de recherches directement dans un centre d’aide, un fichier ou un site Web : les données sont importées dans l’agent IA de manière ponctuelle ou récurrente. Ce sont ces informations importées que l’agent IA utilise pour générer ses réponses.
Les importations quotidiennes ne sont pas recommandées, sauf si la source de connaissances est mise à jour très souvent. La plupart des organisations peuvent se contenter d’importations hebdomadaires ou mensuelles. N’oubliez pas que vous pouvez toujours effectuer une réimportation manuelle si des modifications apportées hors du calendrier des réimportations doivent être reflétées dans les réponses de votre agent IA.
Limitez le nombre de sources de connaissances
Vous pouvez ajouter plusieurs sources de connaissances à un seul agent IA, y compris plusieurs explorations Web. Néanmoins, il est conseillé de ne pas importer un nombre trop important de sources de connaissances, car cela cause parfois des problèmes de précision ou de latence.
Consultez le résumé de l’importation
Si l’exploration a réussi, mais que vous rencontrez d’autres difficultés (les réponses de l’agent IA sont incomplètes ou de mauvaise qualité, par exemple), vous pouvez consulter le résumé de l’importation pour vérifier que toutes les URL et tout le contenu attendus ont été importés. C’est la première et meilleure manière de comprendre ce qui a été importé et ce que vous devez dépanner après l’importation.
Commencez modestement et testez
Si vous voulez vérifier que le contenu a été exploré correctement et avez des pages qui suivent un schéma spécifique, limitez votre exploration à un ou deux exemples de ces pages. Vous pouvez utiliser l’URL de départ d’une page cible et une profondeur maximale d’exploration de zéro. Vous pouvez aussi configurer un nombre maximal de pages à explorer relativement bas, rapide à traiter.