A maioria dos webmasters sabe que, para obter bons ranqueamentos, eles precisam de conteúdo e backlinks fortes e relevantes para aumentar a autoridade de seus sites. No entanto, é essencial garantir que os rastreadores dos mecanismos de pesquisa possam rastrear e indexar seus sites. É por isso que, além de se concentrar em adicionar e otimizar páginas para palavras-chave relevantes e fazer o link building, você deve monitorar constantemente se os rastreadores da Web podem acessar seu site e relatar o que encontram para o mecanismo de pesquisa.
Entendendo rastreabilidade e indexação
Ambos os termos se referem à capacidade de um mecanismo de pesquisa acessar e indexar páginas em um site para adicioná-las ao seu índice. A rastreabilidade descreve a capacidade do mecanismo de pesquisa de acessar e rastrear conteúdo em uma página. Se um site não tiver problemas de rastreabilidade, os rastreadores da Web poderão acessar todo o seu conteúdo com facilidade, seguindo os links entre as páginas. No entanto, links quebrados podem resultar em problemas de rastreabilidade - a incapacidade do mecanismo de pesquisa de acessar conteúdo específico em um site. A indexação, por outro lado, refere-se à capacidade do mecanismo de pesquisa de analisar e adicionar uma página ao seu índice.
Mesmo se o Google conseguiu rastrear um site, ele pode não ser capaz de indexar todas as suas páginas, normalmente devido a problemas de indexação.
Para evitar os erros de rastreabilidade e indexação recomendamos sempre fazer a auditoria do seu arquivo de log.
Porque recomendamos analisar o arquivo de Log?
A análise de arquivos de log ajuda a entender como os mecanismos de pesquisa estão rastreando um site e como isso impacta no SEO. Essas informações são de grande ajuda para melhorar sua rastreabilidade e desempenho de SEO. Com esses dados, você pode analisar o comportamento de rastreamento e analisar algumas métricas interessantes, como:
-
Seu orçamento de rastreamento foi gasto com eficiência?
-
Quais erros de acessibilidade foram encontrados durante o rastreamento?
-
Onde estão as áreas problemáticas de rastreamento?
-
Quais são as páginas mais ativas?
-
Quais páginas o Google não conhece?
Estes são apenas alguns exemplos de oportunidades que a análise de arquivos de log traz. A introdução de algumas melhorias ajudará a economizar o orçamento do Google e a ajudá-lo a rastrear as páginas certas e chegar a elas com mais frequência.
Optimize o Orçamento de Rastreamento do Google
Os Googlebots rastreiam regularmente as páginas novas e as existentes no seu site da mesma maneira que um usuário comum. Isso ajuda o Google a entender o desempenho do site (tempo de carregamento lento ou uma página com erro 404 que podem piorar a experiência do usuário).O número de páginas que o Google acessa em seu site durante uma única conexão é chamado de orçamento de rastreamento. Este orçamento de rastreamento é diferente para sites diferentes. Um crescimento do orçamento de rastreamento significa que o Google está interessado em saber mais sobre seu site, o que pode melhorar suas posições no ranking de pesquisa (lembre-se, os ranqueamentos têm mais de 200 fatores e o orçamento de rastreamento é apenas um deles).
Veja como o Google define a taxa de rastreamento:
“O limite de taxa de rastreio do Googlebot foi concebido para ser um bom cidadão da Web. O rastreamento é sua principal prioridade, garantindo que ele não prejudique a experiência dos usuários que visitam o site. Chamamos isso de "limite de taxa de rastreamento", que limita a taxa máxima de busca de um determinado site. Simplificando, isso representa o número de conexões paralelas simultâneas que o Googlebot pode usar para rastrear o site, bem como o tempo que ele precisa aguardar entre as buscas. A taxa de rastreamento pode aumentar ou diminuir com base em alguns fatores, como, por exemplo, a saúde do rastreamento: se o site responder rapidamente por um tempo, o limite aumenta, o que significa que mais conexões podem ser usadas para rastrear. Se o site ficar lento ou responder com erros do servidor, o limite será reduzido e o Googlebot rastreará menos. ”Podemos dizer que o limite de rastreamento é uma excelente maneira de estimar o desempenho de um website nos resultados de pesquisa, pois um orçamento de rastreamento melhor leva a um tráfego mais orgânico, pois aumenta a importância de um site aos olhos do Google. Nas palavras do Google "Uma taxa de rastreamento aumentada não levará necessariamente a melhores posições nos resultados da Pesquisa". O uso da palavra significa que a taxa de rastreamento realmente tem impacto no desempenho da pesquisa e pode ser considerada um fator de ranqueamento.
Algumas táticas para otimizar o orçamento de rastreamento do Google:
-
Aumente a velocidade do site, já que um site mais rápido melhora a experiência do usuário e também aumenta a taxa de rastreamento. O rastreamento eficiente leva automaticamente a uma melhor indexação e melhores ranqueamentos.
-
Monitore regularmente o relatório de erros de rastreamento e mantenha o número de erros do servidor o mais baixo possível.
-
Certifique-se de que você tenha páginas AMP adequadas em seu site, para que leve menos tempo para o Google rastrear essas páginas para melhorar o desempenho do site mobile.
-
Reduza o tempo de carregamento de página para páginas dinâmicas. As páginas dinâmicas levam muito tempo para serem carregadas, resultando em problemas de tempo limite.
-
Use servidores virtuais privados para melhorar o tempo de resposta do servidor.
-
Otimize imagens e reduza JS e CSS desnecessários.
-
Passe o teste de mobile-friendliness e corrija qualquer problema de rastreabilidade ou design móvel que seu site possa ter.
Como fazer a gestão de rastreabilidade e indexação?
Para não perder os ranqueamentos é importante estar sempre atento à saúde do seu site. Existem ferramentas que podem ajudar a identificar e corrigir seus problemas de rastreabilidade e indexação.
Log File Analyzer
Log File Analyzer mostra como os robôs de Desktop e Mobile do Google rastreiam seu site, e se há algum erro para corrigir para economizar o orçamento de rastreamento. Você só precisa fazer o upload do arquivo access.log do seu site e deixar a ferramenta fazer o trabalho.Um log de acesso é uma lista de todas as solicitações que pessoas ou bots enviaram ao seu site. A análise de um arquivo de log permite rastrear e entender o comportamento de robôs de rastreamento.
Site Audit
Site Audit é uma parte da suíte SEMrush que faz a verificação da saúde do seu site. Analise seu site em busca de vários erros e problemas, incluindo os que afetam a capacidade de rastreamento e a indexação de um site.
Prioridade de Rastreamento e páginas ativas
A análise de arquivos de log também pode ajudar a determinar as páginas mais populares nos olhos do Google e ver quais delas são menos rastreadas. Esta informação pode ajudar a saber se são as páginas mais importantes que são frequentemente visitadas por bots ou não, para evitar que o bot ignore algumas sessões do site.
A análise de log pode destacar URLs ou diretórios que não são rastreados com freqüência pelos bots. Por exemplo, se o usuário desejar que uma publicação específica de seu blog ranqueia bem em uma consulta segmentada, mas que esteja localizada em um diretório que o Google acessa apenas uma vez a cada seis meses, ele perderá as chances de receber tráfego orgânico desta publicação, pelo menos durante seis meses. Se for o caso, ele saberá que é necessário, por exemplo, redefinir os links internos para impulsionar suas “páginas mais valiosas”. A análise de logs também pode ajudar a conhecer suas páginas mais ativas ou, em outras palavras, páginas que recebem mais visitas do bot.