¿Qué plan tengo?
Suite, todas las versiones Team, Growth, Professional, Enterprise o Enterprise Plus
Support con Guide Professional o Enterprise

Gracias a la búsqueda federada de Zendesk, los usuarios finales pueden ver, en los resultados de las búsquedas realizadas en un centro de ayuda, contenido que reside fuera de ese centro de ayuda (por ejemplo, en bases de conocimiento externas, software de administración del aprendizaje, blogs y páginas de un sitio web). Para implementar la búsqueda federada, se puede usar la API de búsqueda federada de Zendesk o el rastreador web.

El rastreador web se encuentra en la configuración de búsqueda de su centro de ayuda y permite implementar la búsqueda federada en su centro de ayuda sin acudir a los desarrolladores (consulte Configuración del rastreador web). Puede usar este artículo para resolver problemas con la configuración del rastreador y errores de página que pueden presentarse durante la configuración del rastreador web en su aplicación.

Los temas tratados son estos:

  • Errores de configuración del rastreador
  • Errores de registro
  • Errores del archivo robots.txt

Errores de configuración del rastreador

Cuando el rastreador web no puede ejecutarse correctamente debido a errores en la verificación de propiedad del dominio o en el procesamiento del mapa de sitio, se generan errores de configuración del rastreador. Estos errores generan, a su vez, una notificación por correo electrónico que se envía al dueño del rastreador configurado junto con el rastreador web.

No se pudo verificar la propiedad del dominio

El rastreador web intenta verificar la propiedad del dominio cada vez que se ejecuta, lo que puede tardar hasta 24 horas. Si falla la verificación del dominio, el dueño del rastreador recibe una notificación por correo electrónico y, en la página Rastreadores, se muestra el estado de rastreo "Falló la verificación del dominio".

Para resolver los errores de verificación del dominio, compruebe lo siguiente:

  • ¿Funciona y está disponible para el público la página principal de su sitio web (también conocida como página raíz o índice)? El acceso a la página no debe estar supeditado al cumplimiento de determinados requisitos de inicio de sesión del usuario, contraseña, restricciones de IP u otro tipo de autenticación.
  • ¿Aún no ha confirmado la propiedad del dominio? Haga clic en el menú de opciones () de la página Rastreadores y seleccione Editar para volver a la configuración del rastreador y confirmar que el dominio es suyo. Consulte Configuración de la búsqueda federada en el centro de ayuda usando un rastreador web o la API.

El mapa de sitio no se pudo procesar

El rastreador web utiliza el mapa de sitio definido durante la configuración del rastreador cada vez que se ejecuta. Si el mapa de sitio no puede procesarse, el dueño del rastreador recibe una notificación por correo electrónico y el rastreador no se ejecuta. Si esto sucede, verifique lo siguiente:

  • El rastreador web está apuntando al URL del mapa de sitio correcto y lo puede ubicar correctamente. Puede editar el rastreador para ver el URL del mapa de sitio actual. Consulte Administración de rastreadores web.
  • El mapa de sitio está funcionando y disponible para el público. El acceso a la página no debe estar supeditado al cumplimiento de determinados requisitos de inicio de sesión del usuario, contraseña, restricciones de IP u otro tipo de autenticación.
  • El mapa de sitio es un mapa en XML donde se enumeran los URL del sitio, según el protocolo XML para mapas de sitio.

Errores de registro

Se generan errores de registro cuando no hay errores de configuración, pero el rastreador web no puede extraer e indexar correctamente las páginas definidas en el mapa de sitio del rastreador (consulte Configuración del rastreador web). Cuando ocurre un error de registro, se envía una notificación por correo electrónico al dueño del rastreador con un vínculo a un archivo CSV donde se enumeran las páginas afectadas y los errores asociados.

No se detectó configuración regional

El error "Locale not detected" indica que el rastreador web no pudo detectar ninguna configuración regional o que la configuración regional detectada no coincide con ninguna de las configuraciones regionales del centro de ayuda actual.

Para determinar la configuración regional de un registro, el rastreador prueba las siguientes estrategias. La primera estrategia que funciona correctamente determina la configuración regional de los registros.

  1. Extraer la configuración regional del atributo de idioma en la etiqueta <html>.
  2. Extraer la configuración regional del encabezado Content-Language.
  3. Extraer la configuración regional de la etiqueta <meta>.
  4. Realizar un análisis textual del contenido (CLD - Compact Language Detection).

El error "Locale not detected" es el resultado de uno de los siguientes problemas:

  • La configuración regional o el idioma identificado no coincide con la configuración regional o el idioma configurado en ninguno de los centros de ayuda de su cuenta. Para ver los idiomas configurados en cada centro de ayuda de su cuenta, consulte Configuración del centro de ayuda para admitir varios idiomas. Los códigos de configuración regional para los idiomas configurados en su cuenta se encuentran en Soporte de Zendesk en varios idiomas por producto.
  • El rastreador web no pudo determinar una configuración regional ni un idioma.

Para resolver este problema, verifique lo siguiente:

  • El atributo de idioma en la etiqueta de html coincide con una configuración regional del centro de ayuda.
  • El encabezado Content-Language de HTTP coincide con una configuración regional del centro de ayuda.
  • El elemento meta con el Content-Language configurado en el atributo http-equiv coincide con una configuración regional del centro de ayuda.

Consulte La configuración regional y el rastreador web.

No se detectó título

El error "Title not detected" indica que el rastreador web no pudo detectar el título de un registro. El rastreador web utiliza las siguientes estrategias para determinar el título de un registro:

  1. Extraer el contenido de la etiqueta <title>.
  2. Extraer el contenido de la etiqueta <h1>.
  3. Extraer el contenido textual de la etiqueta <body>.

La primera estrategia que funciona correctamente determina la configuración regional de los registros. El rastreador solo indexa los primeros 255 caracteres del contenido extraído. El registro no se indexa si las estrategias anteriores no logran determinar ningún contenido.

Para resolver este problema, asegúrese de que la página afectada tenga una de las etiquetas mencionadas arriba.

No se encontró cuerpo

El error "Body not found" indica que el rastreador web no pudo detectar el cuerpo de una página. Para resolver este error, asegúrese de que la página afectada esté debidamente marcada con la etiqueta <body>.

HTTP [código de estado]

Si el campo del código de error en el archivo CSV para un registro contiene HTTP y un código de estado, quiere decir que la página no se pudo indexar porque no se pudo acceder a ella. Si la página se pudo indexar correctamente (HTTP 2xx), no recibirá un error de código de estado de HTTP.

Los códigos de error más comunes son:

  • 404 - Página no encontrada: la página no existe o fue movida a otro URL. Para resolver este problema, asegúrese de que el mapa de sitio que utiliza el rastreador esté al día y de que todos los URL incluidos en el mapa de sitio apunten a páginas existentes.
  • 403 - Prohibido: el rastreador no puede acceder a la página debido a un mecanismo de control de acceso (por ejemplo, una restricción de inicio de sesión o de la dirección IP). Para resolver este problema, verifique lo siguiente:
    • Que ha agregado Zendesk/External-Content, el agente de usuario del rastreador web, a su lista autorizada.
    • Que las páginas que desea indexar sean de acceso público, ya que el rastreador no puede rastrear páginas con acceso restringido. Si las páginas que desea rastrear e indexar no pueden ponerse a disposición del público, plantéese indexarlas mediante usando la API de búsqueda federada (contenido externo). Consulte Configuración de la API de búsqueda federada de Zendesk.
  • 5xx - Error del servidor: la página no se pudo rastrear debido a un error del servidor. Es posible que el sitio no esté disponible temporalmente. Para resolver este problema, visite una o más de las páginas que tengan este error para asegurarse de que el sitio esté funcionando. Si el sitio no funciona, contacte a su administrador. Una vez corregido el error, espere a que el rastreador se vuelva a ejecutar cuando corresponda (cada 12-24 horas).

Dominio de URL no válido

El error "Invalid URL domain" indica que el URL de la página especificada en el mapa de sitio no coincide con el elegido durante la configuración del rastreador.

Para resolver este problema, verifique que el dominio de la página que produjo el error sea el mismo que el definido para su rastreador web. Si la página vinculada en su mapa de sitio apunta a una página alojada en un dominio diferente al definido al configurar el rastreador, puede hacer una de las siguientes cosas:

  • Configurar un nuevo rastreador web para la página afectada.
  • Mover la página del dominio externo al dominio configurado para el rastreador web.

Indeterminado

El error "Undetermined" puede deberse a uno o más de los siguientes motivos:

  • Se ha excedido el límite de registros externos para su instancia: si se ha superado el límite de registros externos, no se indexarán ni actualizarán los últimos registros externos por encima del límite. Para resolver este problema, puede hacer una o más de las siguientes cosas:
    • Borrar algunos de sus rastreadores; así se borrarán los registros externos de esas páginas en su instancia y se podrán indexar las páginas que no se pudieron indexar anteriormente debido a que ya se había alcanzado el límite. Consulte Administración de rastreadores web.
    • Borrar registros individuales a través de la API de búsqueda federada. Sin embargo, si el rastreador que está indexando la página todavía está activo o si una integración de API personalizada que agrega esta página está activa, la página volverá a aparecer la próxima vez que se ejecute el rastreador o se sincronice la integración.
    • Eliminar páginas que uno o más rastreadores están usando del mapa de sitio. La próxima vez que se ejecute, el rastreador volverá a indexar el resto de las páginas y borrará las que se eliminaron del mapa de sitio.
    • Apuntar uno o más rastreadores a un mapa de sitio con menos páginas. La próxima vez que se ejecute, el rastreador volverá a indexar el resto de las páginas y borrará las que se eliminaron del mapa de sitio.
  • La página está usando redireccionamientos location de JavaScript: el rastreador web no respeta los redireccionamientos location de JavaScript. Si la página usa redireccionamientos location de JavaScript, el rastreador no puede llegar al contenido de la página.

    Para resolver este problema, puede hacer una de las siguientes cosas:

    • Asegurarse de que el mapa de sitio apunte directamente a la página que desea indexar.
    • Implementar redireccionamientos de HTTP.

Errores del archivo robots.txt

Un archivo robots.txt comunica al rastreador a qué partes del sitio web se le permite acceder. Su principal objetivo es impedir que el sitio web se sobrecargue por un exceso de solicitudes de rastreo.

El archivo robots.txt no es un paso de configuración, sino un conjunto de directrices que indican al rastreador si puede rastrear todo el sitio o solo determinadas secciones. Los clientes solo tienen que interactuar con él si se da una de estas dos situaciones: que el propio archivo robots.txt no sea válido o que el rastreador esté bloqueado. En estos casos, el sistema genera uno de los siguientes errores, que habrá que solucionar para que el sitio web pueda rastrearse y sincronizarse correctamente.

Rastreo bloqueado por el sitio web

Este error se produce cuando el archivo robots.txt está configurado para impedir que todos los agentes de usuario, incluido el rastreador, accedan al sitio.

Para asegurarse de que el rastreador de Zendesk pueda acceder al sitio aun cuando se opte por bloquear otros rastreadores, se puede agregar al archivo robots.txt una regla de anulación que dé permiso de acceso al rastreador de Zendesk.

Ejemplo 1: Permitir solamente Zendesk/External-Content
User-agent: Zendesk/External-Content
Allow: /
Ejemplo 2: Bloquear el acceso a Googlebot
User-agent: Googlebot
Disallow: /

Archivo robots.txt no válido

Este error se produce cuando, a pesar de haber un archivo robots.txt, este contiene errores de sintaxis o reglas no válidas que lo hacen ilegible para los rastreadores (lo que lleva a estos a ignorar o cancelar el rastreo).

Para resolver este problema, revise y corrija el archivo robots.txt para asegurarse de que esté utilizando la sintaxis correcta y que los permisos del rastreador estén bien especificados. Haga la validación con herramientas web como la herramienta de prueba del robot de Google.

Tecnología de Zendesk