A pesquisa agrupada do Zendesk permite que os usuários finais vejam, nos resultados de pesquisa da central de ajuda, conteúdo externo à sua central de ajuda, como bases de conhecimento externas, softwares de gerenciamento de aprendizado, blogs e páginas de seu website. Você pode implementar a pesquisa agrupada pela API de pesquisa agrupada do Zendesk ou pelo rastreador da web.
Esse rastreador está disponível nas configurações de pesquisa da central de ajuda e permite implementar a pesquisa agrupada na central de ajuda sem recursos de desenvolvedor (consulte Configuração do rastreador da web). Use este artigo para solucionar problemas da configuração do rastreador e erros de página que podem acontecer durante a configuração do rastreador da web no seu aplicativo.
Este artigo contém os seguintes tópicos:
Erros de configuração do rastreador
Os erros de configuração do rastreador são gerados quando o rastreador da web não é executado com êxito por causa de erros de verificação de responsabilidade pelo domínio ou processamento do mapa do site. Os erros de configuração do rastreador geram uma notificação por e-mail, que é enviada para o responsável pelo rastreador definido na configuração dele.
Não foi possível confirmar a responsabilidade pelo domínio
O rastreador da web tenta confirmar a responsabilidade pelo domínio sempre que é executado, o que pode demorar até 24 horas. Se a verificação de domínio falhar, o proprietário do rastreador será notificado por e-mail e a página Rastreadores exibirá o status de rastreamento "Erro na verificação do domínio".
Para solucionar erros de verificação de domínio, veja se:
- A página inicial do seu website (também conhecida como índice ou página-raiz) está funcionando e disponível publicamente. A página não tem nenhuma restrição de acesso, senha e IP de usuário ou outro requisito de autenticação.
- Você precisa confirmar sua propriedade sobre o domínio. Clique no menu de opções (
) na página Rastreadores e selecione Editar para retornar à configuração do rastreador, em que você pode confirmar sua propriedade sobre o domínio. Consulte Configuração da pesquisa agrupada em sua central de ajuda usando um rastreador da web ou a API.
Não foi possível processar o mapa do site
O rastreador da web usa o mapa do site definido na configuração do rastreador sempre que é executado. Se o mapa do site não for processado, o responsável pelo rastreador receberá uma notificação por e-mail e o rastreador não será executado. Caso isso aconteça, verifique o seguinte:
- O rastreador da web aponta para a URL correta do mapa do site e consegue localizá-la com êxito. Você pode editar o rastreador para visualizar a URL atual do mapa do site. Consulte Gerenciamento de rastreadores da web.
- O mapa do site funciona e está disponível publicamente. A página não deve ter nenhuma restrição de acesso, senha e IP de usuário ou outra forma de autenticação.
- O mapa do site é um mapa com URL em XML que segue o protocolo XML de mapas do site.
Erros de registro
Os erros de registro ocorrem quando não há erros de configuração, mas o rastreador da web não consegue extrair e indexar com êxito as páginas definidas no mapa do site do rastreador (consulte Configuração do rastreador da web). Quando um erro de registro acontece, uma notificação por e-mail é enviada para o responsável pelo rastreador com um link para um arquivo CSV que lista as páginas afetadas e os erros associados.
Localidade não detectada
O erro "Localidade não detectada" indica que o rastreador da web não detectou nenhuma localidade ou que a localidade detectada não corresponde a uma existente da central de ajuda.
Para determinar a localidade de um registro, o rastreador tenta as seguintes abordagens. A primeira estratégia bem-sucedida determina a localidade dos registros.
- Extração da localidade do atributo lang da tag <html>.
- Extração da localidade do cabeçalho Content-Language.
- Extração da localidade da tag <meta>.
- Análise textual com detecção de idiomas (CLD – Compact Language Detection).
O erro "Localidade não detectada" tem origem em um destes problemas:
- A localidade ou idioma identificado não corresponde à localidade ou ao idioma configurado em nenhuma central de ajuda de sua conta. Para ver quais idiomas estão configurados para cada central de ajuda de sua conta, consulte Configuração da central de ajuda para dar suporte a vários idiomas. Encontre os códigos de localidade dos idiomas configurados em Suporte a idiomas por produto da Zendesk.
- O rastreador da web não determinou a localidade ou o idioma.
Para solucionar esse problema, verifique se:
- O atributo lang da tag html corresponde à localidade da central de ajuda.
- O cabeçalho HTTP Content-Language corresponde à localidade da central de ajuda.
- O elemento meta com o conjunto Content-Language do atributo http-equiv corresponde à localidade da central de ajuda.
Consulte Noções básicas sobre localidades do rastreador da web.
Título não detectado
O erro "Título não detectado" indica que o rastreador da web não detectou o título de um registro. Para determinar o título de um registro, o rastreador da web tenta as seguintes abordagens:
- Extração do conteúdo da tag <title>.
- Extração do conteúdo da tag <h1>.
- Extração do conteúdo textual da tag <body>.
A primeira estratégia bem-sucedida determina a localidade dos registros. O rastreador indexa apenas os primeiros 255 caracteres do conteúdo extraído. O registro não é indexado se as estratégias acima não determinarem nenhum conteúdo.
Para solucionar esse problema, certifique-se de que a página afetada tenha uma das tags listadas acima.
Corpo não encontrado
O erro "Corpo não encontrado" indica que o rastreador da web não detectou o corpo do texto de uma página. Para solucionar esse problema, certifique-se de que a página afetada esteja marcada corretamente com a tag <body>.
HTTP [código do status]
Se o campo de código de erro no CSV de um registro tiver um código HTTP e de status, isso significa que a página não foi indexada porque ela não pode ser acessada. Se a página for indexada com êxito (HTTP 2xx), você não receberá um erro de código de status do HTTP.
Os códigos de erro mais comuns são:
- 404 - Página não encontrada - a página não existe ou foi movida para outra URL. Para solucionar esse problema, certifique-se de que o mapa do site que o rastreador está usando é atual e que todas as URLs do mapa do site apontam para páginas existentes.
-
403 - Proibido - o rastreador não pode acessar a página por causa de um mecanismo de controle de acesso, como restrição de endereço IP ou ele estar subjacente a um registro. Para solucionar esse problema, verifique se:
- Você adicionou Zendesk/External-Content, o agente do usuário do rastreador da web, à lista de autorização.
- As páginas que você deseja indexar estão disponíveis publicamente, pois o rastreador não consegue agir em páginas com restrição de acesso. Se as páginas que você deseja rastrear e indexar não puderem ser disponibilizadas publicamente, tente indexar as páginas usando a API da pesquisa agrupada (conteúdo externo). Consulte Configuração da API de pesquisa agrupada do Zendesk.
- 5xx - Erro de servidor - a página não pode ser rastreada por causa de um erro de servidor. O site pode estar temporariamente indisponível. Para solucionar esse problema, acesse algumas páginas com esse erro para confirmar se o site está funcionando. Se o site não estiver funcionando, entre em contato com o administrador dele. Quando o erro for corrigido, aguarde o rastreador ser executado novamente no intervalo de sempre (a cada 12 a 24 horas).
Domínio com URL inválida
O erro "Domínio com URL inválida" indica que a URL da página listada no mapa do site não está no domínio definido na configuração do rastreador.
Para solucionar esse problema, verifique se o domínio da página que acionou o erro está no mesmo domínio definido para o rastreador da web. Se a página vinculada ao mapa do site apontar para uma página hospedada em um domínio diferente daquele definido na configuração do rastreador, faça o seguinte:
- Configure um novo rastreador da web para a página afetada.
- Mova a página do domínio externo para o domínio configurado para o rastreador da web.
Indeterminado
O erro "Indeterminado" pode ser causado pelo seguinte:
-
Você excedeu o limite de registros externos da instância - se você excedeu o limite de registros externos, os registros externos mais recentes que ultrapassarem esse número não serão indexados nem atualizados. Para solucionar esse problema, faça o seguinte:
- Apague alguns rastreadores, o que remove o registro externo de páginas da instância e permite que as páginas não indexadas anteriormente sejam indexadas. Consulte Gerenciamento de rastreadores da web.
- Apague registros individuais pela API de pesquisa agrupada. No entanto, se o rastreador que indexa a página ou uma integração de API personalizada que adiciona a página estiverem ativos, a página reaparecerá na próxima vez que o rastreador for executado ou a integração for sincronizada.
- Remova páginas que um ou mais rastreadores usam do mapa do site. Na próxima vez que o rastreador for executado, ele indexará novamente as páginas restantes e apagará aquelas removidas do mapa do site.
- Aponte um ou mais rastreadores para um mapa do site com menos páginas. Na próxima vez que o rastreador for executado, ele indexará novamente as páginas restantes e apagará aquelas removidas do mapa do site.
-
A página usa redirecionamentos de local de JavaScript – o rastreador da web não observa redirecionamentos de local do JavaScript. Se a página usa redirecionamentos de local do JavaScript, o rastreador não consegue se conectar ao conteúdo da página.
Para solucionar esse problema, faça o seguinte:
- Certifique-se de que o mapa do site aponta diretamente para a página que você deseja indexar.
- Implemente redirecionamentos HTTP.
Erros do robots.txt
Um arquivo robots.txt informa ao rastreador quais partes de um site ele tem permissão para acessar. Seu principal objetivo é evitar sobrecarregar um site com solicitações excessivas de rastreamento.
Em vez de ser uma etapa de configuração, o robots.txt atua como um conjunto de diretrizes que informa ao rastreador se ele pode rastrear todo o site ou apenas seções específicas. A única vez que os clientes precisam interagir com o robots.txt é quando o rastreador é bloqueado ou o arquivo robots.txt é inválido. Nesses casos, o sistema gerará um dos seguintes erros que devem ser resolvidos antes que o site possa ser rastreado e sincronizado com êxito.
Rastreamento bloqueado pelo website
Esse erro ocorre quando o arquivo robots.txt está configurado para impedir que todos os agentes do usuário, incluindo o rastreador, acessem o site.
Para garantir que o rastreador do Zendesk tenha permissão para acessar o site, enquanto opcionalmente bloqueia outros rastreadores, você pode adicionar uma regra de substituição ao arquivo robots.txt para permitir o rastreador do Zendesk.
User-agent: Zendesk/External-Content
Allow: /
User-agent: Googlebot
Disallow: /
Arquivo robots.txt inválido
Esse erro ocorre quando o arquivo robots.txt existe, mas contém erros de sintaxe ou regras inválidas, tornando-o ilegível para os rastreadores e fazendo com que eles ignorem ou cancelem o rastreamento.
Para resolver esse problema, avalie e corrija o arquivo robots.txt para garantir que siga a sintaxe correta e especifique com precisão as permissões dos rastreadores. Use ferramentas online, como a ferramenta de teste de robôs do Google, para validar seu arquivo robots.txt.