Las fuentes de conocimiento son la información que usa el agente IA para crear respuestas generadas por IA a las preguntas de los usuarios. Este tipo de respuestas generadas por IA se conocen como respuestas generativas.
Si se agregan fuentes de conocimiento al agente IA, este podrá generar respuestas que ayudan a los clientes sin que sea necesario redactar una respuesta para cada pregunta.
En este artículo se tratan los siguientes temas:
Artículos relacionados:
Acerca de las fuentes de conocimiento
En un agente IA avanzado se pueden importar los siguientes tipos de fuentes de conocimiento:
- Centros de ayuda: centros de ayuda basados en Internet con tecnología de Zendesk, Salesforce o Freshdesk.
-
Archivos CSV: archivos CSV formateados con información del artículo.
La importación de archivos CSV es una buena solución para importar bases de conocimiento que no se admiten de manera nativa o que están protegidas con un inicio de sesión único (SSO).
-
Contenido importado con un rastreador web: información de una página web o una serie de páginas web.
Esta opción es más apropiada para importar información de una base de conocimientos, una página de preguntas frecuentes o una página de descripción de producto. No es tan conveniente para tiendas de comercio electrónico o tiendas virtuales. Para las páginas de comercio electrónico, Zendesk recomienda crear una integración que sea capaz de obtener información relevante del producto y agregar esa información en un diálogo o procedimiento generativo.
Se pueden agregar varias fuentes de conocimiento a un solo agente IA. Por ejemplo, se pueden importar artículos de distintos centros de ayuda de Zendesk, varios archivos CSV o una combinación de ambas fuentes. No obstante, se recomienda mantener el número total de fuentes de conocimientos dentro de un límite razonable. Tener demasiadas fuentes puede, en algunos casos, reducir la precisión y aumentar la latencia.
Es importante comprender que el agente IA no busca en los datos en tiempo real de un centro de ayuda, archivo o sitio web. Lo que ocurre es que la información se importa en el agente IA una sola vez o de manera recurrente. El agente IA utiliza esta información importada al generar sus respuestas.
Importar una fuente de conocimiento
Los administradores de clientes pueden importar fuentes de conocimiento para un agente IA.
Para importar una fuente de conocimiento
- En la esquina superior derecha de Agentes IA – Avanzado, en el campo desplegable Agente IA, seleccione el agente IA para el que desea importar una fuente de conocimiento.
- En la barra lateral izquierda, haga clic en cualquiera de las siguientes opciones:
- Configuración > Respuestas generativas > Fuentes de conocimiento para un agente IA que no requiere entrenamiento.
-
Contenido > Conocimiento > Fuentes de conocimiento para un agente IA agéntico.
Se abre la página Fuentes de conocimiento.
- Haga clic en Agregar origen.
Se abre el panel Agregar origen.
- En el menú desplegable Tipo, seleccione una de estas opciones:
- Zendesk: importa un centro de ayuda de Zendesk.
- Salesforce: importa un centro de ayuda de Salesforce.
- Freshdesk: importa un centro de ayuda de Freshdesk.
- Archivo (CSV): importa un archivo con formato .csv.
- Rastreador web: importa contenido de un sitio web especificado.
- Siga las instrucciones a continuación para la fuente que elija:
Importar un centro de ayuda de Zendesk
- En el panel Agregar origen, seleccione un Tipo para Zendesk.
- En URL del centro de ayuda, ingrese el URL de su centro de ayuda de Zendesk.
Agregue todo su centro de ayuda incluyendo el URL completo (por ejemplo, susubdominio.zendesk.com/hc) o agregue solo un idioma determinado de su centro de ayuda especificando también la configuración regional al final de la ruta del URL (por ejemplo, susubdominio.zendesk.com/hc/es). - En Nombre de origen, escriba un nombre para la fuente.
Este nombre se usa en los informes dentro de Agentes IA – Avanzado.
- En Frecuencia de importación, seleccione con qué frecuencia se debe volver a importar el contenido del centro de ayuda: Cada día, Cada semana, Cada mes o Nunca.
Cada mes significa el día 15 del mes. Cada día significa todos los días excepto el día 15 del mes.
Si las importaciones se hacen de manera regular, el agente IA estará siempre al día. Si desea importar el contenido una sola vez, seleccione Nunca. No se recomienda hacer importaciones diarias, salvo que la fuente de conocimientos se actualice con frecuencia. Para la mayoría de las organizaciones, un intervalo de una semana o un mes es suficiente. Recuerde que siempre puede volver a importar el contenido manualmente si hay cambios nuevos que tienen que reflejarse antes de la reimportación programada.
- Si desea importar artículos restringidos:
- Active la opción Importar artículos privados.
- Para Correo electrónico, ingrese la dirección de correo electrónico de un usuario que tenga autorización para acceder al contenido restringido.
Suele ser la dirección de correo electrónico de un administrador de Guide.
- En Token de acceso a API, ingrese un token de API generado para este propósito.
- Haga clic en Importar.
Importar un centro de ayuda de Salesforce
- En el panel Agregar origen, seleccione un Tipo para Salesforce.
- Haga clic en Iniciar sesión en Salesforce.
- Inicie sesión en su entorno de Salesforce.
- En URL del centro de ayuda, ingrese el URL completo de su centro de ayuda de Salesforce.
- En Nombre de origen, escriba un nombre para la fuente.
Este nombre se usa en los informes dentro de Agentes IA – Avanzado.
- En Frecuencia de importación, seleccione con qué frecuencia se debe volver a importar el contenido del centro de ayuda: Cada día, Cada semana, Cada mes o Nunca.
Cada mes significa el día 15 del mes. Cada día significa todos los días excepto el día 15 del mes.
Si las importaciones se hacen de manera regular, el agente IA estará siempre al día. Si desea importar el contenido una sola vez, seleccione Nunca. No se recomienda hacer importaciones diarias, salvo que la fuente de conocimientos se actualice con frecuencia. Para la mayoría de las organizaciones, un intervalo de una semana o un mes es suficiente. Recuerde que siempre puede volver a importar el contenido manualmente si hay cambios nuevos que tienen que reflejarse antes de la reimportación programada.
- Haga clic en Importar.
Importar un centro de ayuda de Freshdesk
- En el panel Agregar origen, seleccione un Tipo para Freshdesk.
- En URL del centro de ayuda, ingrese el URL de su centro de ayuda de Freshdesk.
- En Nombre de origen, escriba un nombre para la fuente.
Este nombre se usa en los informes dentro de Agentes IA – Avanzado.
- En Frecuencia de importación, seleccione con qué frecuencia se debe volver a importar el contenido del centro de ayuda: Cada día, Cada semana, Cada mes o Nunca.
Cada mes significa el día 15 del mes. Cada día significa todos los días excepto el día 15 del mes.
Si las importaciones se hacen de manera regular, el agente IA estará siempre al día. Si desea importar el contenido una sola vez, seleccione Nunca. No se recomienda hacer importaciones diarias, salvo que la fuente de conocimientos se actualice con frecuencia. Para la mayoría de las organizaciones, un intervalo de una semana o un mes es suficiente. Recuerde que siempre puede volver a importar el contenido manualmente si hay cambios nuevos que tienen que reflejarse antes de la reimportación programada.
- En Token de acceso a API, ingrese un token de API generado por usted en Freshdesk para este propósito.
- Haga clic en Importar.
Importar un archivo CSV
- En el panel Agregar origen, seleccione un Tipo para Archivo (CSV).
- Haga clic en Seleccionar archivo CSV como fuente de conocimiento.
- Seleccione el archivo CSV que desea importar.
Consulte Formato necesario para el archivo CSV para asegurarse de que su archivo esté bien formateado.
- En Nombre de origen, escriba un nombre para la fuente.
Este nombre se usa en los informes dentro de Agentes IA – Avanzado.
- Haga clic en Importar.
Formato necesario para el archivo CSV
El archivo CSV que cargue como una fuente de conocimiento debe tener una fila para cada artículo que desea importar. El archivo debe incluir las siguientes columnas:
- title: el título del artículo.
-
content: todo el contenido del artículo.
- El contenido puede incluir etiquetas HTML, de modo que no es necesario deshacerse de ellas. De hecho, las etiquetas pueden ser útiles porque estructuran los artículos, lo que ayuda al agente IA a comprender las distintas secciones.
- El contenido también puede contener Markdown, pero este tiene que ser válido o no se importará el contenido de esa celda. Además, si Markdown se escribe de tal manera que la celda es una sola línea de más de 2000 caracteres, la importación de la celda fallará sin mostrar ninguna advertencia.
También se pueden incluir las siguientes columnas opcionales:
- labels: una lista de nombres de rótulos separados por un espacio. Los valores pueden ser cualquier cosa que desee usar para clasificar el contenido.
- locale: se utiliza para organizar los artículos por idioma o mercado. Desde el punto de vista técnico, se admite cualquier valor, pero se recomienda seguir la notación estándar para la configuración regional (por ejemplo, en-US o fi-FI).
- article_url: la dirección web externa donde se encuentra el artículo. Esto se usa en la atribución de la fuente en el widget y en los informes de Agentes IA – Avanzado.
El formato de archivo debe usar comas (,) para separar las columnas y comillas dobles (") como el carácter para delimitar cadenas. La primera fila es siempre para los encabezados de columna.
Importar contenido con un rastreador web
- En el panel Agregar origen, seleccione un Tipo de Rastreador web.
- En Nombre de origen, escriba un nombre para la fuente.
Este nombre se usa en los informes dentro de Agentes IA – Avanzado.
- Seleccione Rastrear URL exacta si desea que el rastreador web importe información solo de las páginas web que aparecen en el campo URL de inicio, sin incluir ninguna subpágina.
Si esta opción no está seleccionada, el rastreador web aplica una profundidad de rastreo máxima de 15 subpáginas para los URL que se muestran en el campo URL de inicio.
- En URL de inicio, ingrese los URL que desea que rastree el rastreador web.
Ponga cada URL en una línea distinta.
- En Frecuencia de importación, seleccione con qué frecuencia se debe volver a importar el contenido rastreado del centro de ayuda: Cada día, Cada semana, Cada mes o Nunca.
Cada mes significa el día 15 del mes. Cada día significa todos los días excepto el día 15 del mes.
Si las importaciones se hacen de manera regular, el agente IA estará siempre al día. Si desea importar el contenido una sola vez, seleccione Nunca. No se recomienda hacer importaciones diarias, salvo que la fuente de conocimientos se actualice con frecuencia. Para la mayoría de las organizaciones, un intervalo de una semana o un mes es suficiente. Recuerde que siempre puede volver a importar el contenido manualmente si hay cambios nuevos que tienen que reflejarse antes de la reimportación programada.
- (Opcional) Amplíe Configuración del rastreador para configurar las opciones avanzadas del rastreador.
Consulte Configurar las opciones avanzadas del rastreador si desea ver los detalles.
Nota: Estas opciones se recomiendan solo para las organizaciones que tienen requisitos técnicos complejos. Muchas organizaciones no necesitan estas opciones. - (Opcional) Amplíe Procesamiento de HTML para configurar las opciones avanzadas de HTML.
Consulte Configurar las opciones avanzadas de HTML si desea ver los detalles.
Nota: Estas opciones se recomiendan solo para las organizaciones que tienen requisitos técnicos complejos. Muchas organizaciones no necesitan estas opciones. - Haga clic en Importar.
Configurar las opciones avanzadas del rastreador
-
Bajo el encabezado Configuración del rastreador, en Tipo de rastreador, seleccione una de las siguientes opciones:
- Cambio adaptativo entre navegador y HTTP sin formato (predeterminado): es rápido y representa el contenido de JavaScript si existe.
- Navegador autónomo (Firefox + Playwright): es confiable y representa el contenido de JavaScript; es ideal para evitar bloqueos, pero puede ser lento.
- Cliente HTTP sin procesar (Cheerio): es la opción más rápida, pero no representa el contenido de JavaScript.
- Sin procesar con JavaScript: rastrea el contenido sin procesar de la página como si se estuviera usando JavaScript.
- Seleccione Incluir URL o Excluir URL para personalizar el alcance del rastreo configurado en el campo URL de inicio de arriba.
En el campo que se encuentra debajo de cada opción, ingrese los URL que desea incluir o excluir. Ingrese cada URL en su propia línea.
Estas opciones solo afectan los vínculos que se encuentran al rastrear las subpáginas. Si desea rastrear una página, asegúrese de especificar su URL en el campo URL de inicio.Por ejemplo, si la estructura del URL no coincide, como en el ejemplo que sigue:
- URL de inicio:
https://support.example.com/en/support/home
- URL del artículo:
https://support.example.com/en/support/solutions/articles/…
https://support.example.com/en/support/**
De este modo, el rastreador web incluirá todos los artículos, aunque su ruta difiera de la del URL de inicio.
Otro ejemplo: el siguiente sitio web es muy amplio e incluye páginas irrelevantes (por ejemplo, la página de empleos):- URL de inicio:
https://www.example.com/en
https://www.example.com/en/careers/**
Sugerencia: Los globs —patrones que permiten usar caracteres especiales para crear URL dinámicos en los que el rastreados web pueda hacer búsquedas— ofrecen más funciones que el texto sin formato. Estos son algunos ejemplos:-
https://support.example.com/**
permite que el rastreador acceda a todos los URL que comienzan con https://support.example.com/. -
https://{store,docs}.example.com/**
permite que el rastreador acceda a todos los URL que comienzan con https://store.example.com/ o https://docs.example.com/. -
https://example.com/**/*\?*foo=*
permite que el rastreador acceda a todos los URL que contienen parámetros de consulta foo con cualquier valor.
- URL de inicio:
- En Máximo de páginas para rastrear, ingrese el máximo número de páginas que rastreará el rastreador web, incluido el URL de inicio.
Esto incluye el URL de inicio, las páginas de paginación, las páginas sin contenido y mucho más. El rastreador web se detendrá automáticamente después de alcanzar este límite.
- En Profundidad máxima de rastreo, ingrese el número máximo de vínculos que seguirá el rastreador web desde el URL de inicio.
El URL de inicio tiene una profundidad de 0. Las páginas vinculadas directamente desde el URL de inicio tienen una profundidad de 1, y así sucesivamente. Utilice esta opción para evitar que el rastreador web se descontrole accidentalmente.
- En Configuración de proxy, seleccione una de estas opciones:
- Centro de datos (predeterminado): el método más rápido para extraer datos.
-
Residencial: tiene un rendimiento reducido, pero es menos probable que sea bloqueado. Es la opción ideal para cuando el proxy predeterminado está bloqueado o cuando hay que hacer rastreos desde un país especifico.
Configurar las opciones avanzadas de HTML
-
Bajo el encabezado Procesamiento de HTML, en Conservar elementos HTML, ingrese un selector de CSS para mantener solo los elementos de HTML especificados.
El resto del contenido será eliminado, lo que le ayudará a enfocarse solo en la información relevante.
- En Eliminar elementos HTML, elija los elementos de HTML que desea eliminar antes de convertir el contenido a texto o Markdown, o de guardarlo como HTML.
Esto ayuda a excluir el contenido no deseado.
- En Expandir elementos en los que se puede hacer clic, ingrese un selector de CSS válido que coincida con los elementos DOM en los que se hará clic.
Esto es útil para ampliar las secciones contraídas y capturar su contenido de texto.
- En Transformador HTML, seleccione uno de los siguientes valores para definir cómo limpiar el HTML, eliminando el contenido innecesario (como la navegación y las ventanas emergentes) para guardar solo el importante:
- Extractus: (no se recomienda) utiliza la biblioteca Extractus.
- Ninguno: elimina solo los elementos de HTML que se especifican en la opción Eliminar elementos HTML de arriba.
- Texto legible: utiliza la biblioteca de legibilidad de Mozilla para extraer el contenido del artículo principal, y elimina la navegación, los encabezados, los pies de página y otros elementos no esenciales. Funciona mejor en blogs y sitios web con muchos artículos.
-
Texto legible si es posible: usa la biblioteca de legibilidad de Mozilla para extraer el contenido principal, pero recurre al HTML original si la página no parece un artículo. Esto es útil para los sitios web que tienen tipos de contenido mixtos, como artículos o páginas de producto, ya que conserva más contenido en las páginas sin artículos.
- En Esperar contenido dinámico, especifique el número de segundos que el rastreador debe esperar para que se cargue el contenido dinámico. De manera predeterminada, espera cinco segundos o hasta que la página termine de cargarse (lo que ocurra primero).
- En Espera temporal para selector, ingrese los selectores de CSS para elementos de HTML que deberán cargarse antes de que el rastreador extraiga contenido.
Si el elemento seleccionado no está presente, el rastreador seguirá rastreando esa página.
Ponga cada selector de CSS en una línea separada.
- En Esperar selector, ingrese los selectores de CSS para elementos de HTML que el rastreador debe esperar que se carguen antes de extraer contenido.
Si el elemento seleccionado no está presente, el rastreador no rastrea esa página.
Ponga cada selector de CSS en una línea separada.
- En Altura máxima de desplazamiento, especifique el número máximo de píxeles que debe recorrer el rastreador.
El rastreador se desplaza por la página para cargar más contenido hasta que la red esté inactiva o se alcance esta altura de desplazamiento. Establezca el valor en 0 para desactivar el desplazamiento por completo.
Esta configuración no se aplica cuando se usa el cliente HTTP sin procesar, porque no ejecuta JavaScript ni carga contenido dinámico.
- En Hacer que los contenedores sean fijos, ingrese los selectores de CSS para elementos de HTML en los que el contenido secundario debe conservarse, aunque esté oculto.
Ponga cada selector de CSS en una línea separada.
Esto es útil cuando se usa la opción Expandir elementos en los que se puede hacer clic en las páginas que eliminan totalmente el contenido oculto de la página.