Indexação do Google: o que é e como fazer com que seu site seja indexado

Erich Casagrande

Mar 16, 20239 min de leitura
Indexação do Google
Compartilhar

ÍNDICE

Indexação do Google: o que é o índice de busca?

O índice de busca do Google é um banco de dados de todas as páginas da internet que os bots rastrearam e armazenaram para mostrar nos resultados da pesquisa.

Cada página que aparece nos resultados de pesquisa do Google deve ter sido indexada primeiro.

Portanto, se sua página não tiver sido encontrada e indexada pelo Google, ela não será exibida nas SERPs.

A indexação do Google faz parte de um processo de três etapas:

  • Rastreamento: o Googlebot rastreia a web à procura de páginas novas ou atualizadas;
  • Indexação: o Google analisa as páginas e as armazena em um enorme banco de dados;
  • Classificação: o algoritmo do Google seleciona as melhores e mais relevantes páginas do seu índice e as exibe nos resultados de pesquisa.
how search engines work

Algoritmos predeterminados controlam a indexação do Google. No entanto, você pode influenciar o processo ajudando os bots a descobrirem seu conteúdo.

Youtube video thumbnail

Como verificar se o Google indexou uma página

O Google ajuda a descobrir se o seu site foi indexado usando o operador de pesquisa “site:”.

Veja como verificar:

  1. Acesso o Google;
  2. Na barra de pesquisa, digite o operador de pesquisa “site:” seguido do seu domínio (por exemplo, site:seudominio.com.br);
  3. Você verá uma estimativa de quantas páginas do seu site o Google indexou.

Se nenhum resultado aparecer, significa que a página não está indexada.

indexação google - exemplo de site não indexado

Se houver páginas indexadas, o Google as mostrará como resultados da pesquisa.

indexação google - exemplo de site indexado

É assim que você verifica o status de indexação de suas páginas mais rapidamente. Mas não é a maneira mais prática, pois pode ser difícil identificar páginas específicas que não foram indexadas.

A outra maneira (e mais complexa) de verificar se o Google indexou seu site é usar o Google Search Console.

Como fazer o Google indexar um site?

Se você tem um site novo, pode levar algum tempo para o Google indexá-lo. O rastreamento pode levar de alguns dias a algumas semanas. (A indexação geralmente acontece logo depois, mas não é garantida).

Portanto, a indexação pode levar tempo, mas você pode acelerar esse processo por meio do Google Search Console.

O Google Search Console (GSC) é um conjunto de ferramentas gratuito que permite verificar a presença do seu site no mecanismo de pesquisa e identificar quaisquer problemas relacionados.

Se você ainda não tiver uma conta no GSC:

  1. Entre na sua conta do Google;
  2. Adicione uma nova propriedade (seu site);
  3. Verifique a propriedade do site.

Preciso de ajuda? Leia nosso guia passo a passo sobre como configurar o Google Search Console.

Crie e envie um sitemap

Um sitemap XML é um arquivo que lista todas as URLs que você quer que o Google indexe.

Ele informa ao Google que essas páginas são importantes, ajudando os rastreadores a encontrar suas páginas principais mais rapidamente.

Assim:

exemplo de sitemap xml

Você pode encontrar seu sitemap nesta URL:

https://seudominio.com.br/ sitemap.xml

Se você não tiver um, leia nosso guia de como criar um sitemap XML ou este outro guia de sitemap WordPress.

Assim que tiver a URL do seu sitemap, vá para o painel Sitemaps no GSC. Você o encontrará na seção Indexing (Indexação) no menu à esquerda.

Insira a URL do seu sitemap e clique em Submit (Enviar).

google search console sitemaps

Pode levar alguns dias para que o sitemap seja processado. Quando terminar, você deverá ver o link para o sitemap e um status verde de Sucess (Sucesso) no relatório.

google search console sitemap success

O envio do sitemap pode ajudar o Google a descobrir todas as páginas que você considera importantes e pode acelerar o processo de indexação deles.

Use a Ferramenta de inspeção de URL

Para verificar o status de uma URL específica, use a Ferramenta de inspeção de URL no GSC.

Insira a URL na barra de pesquisa URL Inspection (Inspeção de URL) na parte superior.

google search console url inspection tool

Se você vir o status URL is on Google (URL está no Google), isso significa que a URL inspecionada foi rastreada e indexada.

url inspection page indexed

Você pode verificar os detalhes para ver quando foi seu site rastreado pela última vez, bem como outras informações úteis.

google search console helpful info

Se for esse o caso, está tudo pronto e não precisa fazer mais nada.

Mas se você vir o status URL is not on Google (URL não está no Google), isso significa que a URL inspecionada não está indexada e não pode aparecer nos resultados de pesquisa.

google search console url not indexed

Você provavelmente verá o motivo pelo qual a página não foi indexada e precisará resolver esse problema.

Feito isso, clique no botão Request Indexing (Solicitar Indexação).

google search console request indexing button

Observação: se a URL inspecionada for relativamente nova, pode ser que o Google ainda não a tenha descoberto. Ao clicar em "Request Indexing" (Solicitar indexação), você pode acelerar o processo.

Como encontrar e corrigir problemas de indexação

Às vezes, pode haver problemas mais profundos com o SEO técnico do seu site. Portanto, há uma chance de seu domínio (ou uma página específica) não ser indexado mesmo se você solicitar.

Isso pode acontecer se seu site não for compatível com dispositivos móveis, carregar muito lentamente, se houver problemas de redirecionamento etc.

Nesse caso, execute uma auditoria de SEO técnico para encontrar problemas que podem impedir que seu site seja indexado.

Você pode usar a ferramenta Auditoria do site, da Semrush.

  1. Crie uma conta Semrush gratuita;
  2. Configure seu primeiro rastreamento (temos um guia detalhado de configuração para ajudar);
  3. Clique no botão Iniciar Auditoria do site.

Depois de executar a auditoria, você terá uma visão detalhada da integridade do seu site.

página inicial da ferramenta auditoria do site

Você também pode ver uma lista de todos os problemas clicando na aba Problemas:

aba problemas na ferramenta auditoria do site

Os problemas relacionados à indexação quase sempre aparecerão no topo da lista – na seção Erros.

Vamos ver alguns motivos pelos quais seu site pode não ser indexado e como corrigi-los.

Verifique seu arquivo robots.txt

O arquivo robots.txt fornece instruções aos mecanismos de pesquisa para não rastrear determinadas partes de um site. Exemplo:

exemplo arquivo robots txt

Você encontrará o seu em: https://seudominio.com.br/ robots.txt

Siga esse guia sobre como criar o arquivo robots.txt se você não tiver um.

Você pode impedir que o Google rastreie páginas duplicadas, páginas privadas ou recursos como PDFs e vídeos.

Mas se o seu arquivo robots.txt informar aos bots que todo o seu site não deve ser rastreado, há uma grande chance de ele não ser indexado.

Cada diretiva no robots.txt consiste em duas partes:

  • “User-agent” identifica o rastreador que é endereçado;
  • A instrução “Allow” ou “Disallow” informa ao bot que o site (ou parte dele) pode ou não ser rastreado.

Por exemplo:

User-agent: *
Disallow: /

Esta diretiva diz que qualquer rastreador (representado por um asterisco) não pode rastrear (disallow:) o site inteiro (representado por um símbolo de barra):

Inspecione seu robots.txt e certifique-se de que não haja nenhuma diretiva que possa impedir o Google de rastrear seu site ou páginas/pastas que você deseja indexar.

Gerencie suas tags Noindex e Canonical

Uma das maneiras de informar aos mecanismos de pesquisa para não indexar suas páginas é usar as metatags robots com um atributo “noindex”.

Algo assim:

<meta name="robots" content="noindex">

Se uma página contém esta linha de código, você está dizendo ao Google para não indexá-la.

Você pode verificar quais páginas do seu site têm metatags noindex no Google Search Console:

  1. Clique no relatório Pages (Páginas) na seção Indexing (Indexação) no menu à esquerda;
  2. Role para baixo até a seção Why pages aren’t indexed (Por que as páginas não são indexadas);
  3. Procure por Excluded by ‘noindex’ tag (Excluído pela tag 'noindex').
excluded by noindex tag

Se a lista de URLs tiver uma página que você deseja indexar, basta remover a meta tag noindex do código-fonte dela.

A ferramenta Auditoria do site também irá indicar quais páginas estão bloqueadas pelo arquivo robots.txt ou tag noindex.

o rastreamento foi bloqueado

Ela também irá informar sobre recursos bloqueados pela tag X-Robots, que geralmente é usada para documentos não HTML (como arquivos PDF).

páginas bloqueadas por x-robots tag

Outra razão pela qual sua página pode não ser indexada é a tag canônica.

As tags canônicas informam aos rastreadores se uma determinada versão de uma página deve ser priorizada. Elas evitam problemas causados por conteúdo duplicado que pode esta aparecendo em diferentes URLs.

Se uma página tiver uma tag canônica apontando para outra URL, o Googlebot entenderá que há uma versão preferida dessa página e não indexará a que tiver a tag canônica, mesmo que não haja uma versão alternativa.

O relatório Pages (Páginas) no Google Search Console ajudará novamente.

Basta rolar para baixo até a seção Why pages aren’t indexed (Por que as páginas não são indexadas) e clicar em Alternate page with proper canonical tag (Página alternativa com tag canônica adequada).

google search console alternate page with canonical tag

Você verá uma lista de páginas afetadas.

Se houver uma página que você deseja indexar (ou seja, a tag canônica usada incorretamente), remova a tag dessa página ou certifique-se de apontar para a versão que você deseja indexar.

Saiba mais sobre este tema em nosso guia sobre tags canônicas.

Os links internos ajudam os rastreadores a encontrar suas páginas, o que pode acelerar o processo de indexação.

Se você quer auditar seus links internos, acesse o relatório Links internos na Auditoria do site.

relatório de links interno na ferramenta auditoria do site

O relatório listará todos os problemas relacionados à linkagem interna.

detalhes do relatório de links internos

Considere essas três questões:

  1. Os links de saída contêm atributo nofollow: os links nofollow não passam autoridade. Se usado internamente, o Google pode optar por ignorar a página de destino ao rastrear seu site. Certifique-se de não usá-los para páginas que deseja indexar.
  2. As páginas precisam de mais de três cliques para serem acessadas: se as páginas precisarem de mais de três cliques para serem acessadas a partir da pagina inicial, é possível que não sejam rastreadas e indexadas. Adicione mais links internos para essas páginas (e revise a arquitetura do seu site).
  3. Páginas órfãs no sitemap: as páginas que não têm links internos apontando para elas são conhecidas como “páginas órfãs”. Raramente são indexadas. Corrija esse problema fazendo links a qualquer página órfã.

Para ver as páginas afetadas por um problema específico, clique no link que indica o número de problemas encontrados ao lado.

problemas de links internos

Por último, mas não menos importante, não se esqueça de usar links internos estrategicamente:

  • Link para suas páginas mais importantes: o Google reconhece que as páginas são importantes para você se tiverem mais links internos.
  • Links para novas páginas: torne os links internos parte de seu processo de criação de conteúdo para acelerar a indexação de suas páginas novas.

Confira nosso guia de links internos para saber mais sobre as melhores práticas e estratégias.

Melhore a qualidade geral do seu site

Os problemas de indexação nem sempre estão relacionados a questões técnicas.

Mesmo que seu site atenda a todos os requisitos técnicos para ser indexado, o Google pode não indexar todas as suas páginas. Especialmente se ele não achar que seu site tem alta qualidade.

Como disse John Mueller, do Google:

Se você tem um site pequeno e percebe que boa parte das suas páginas não está sendo indexada, dê um passo para trás e tente analisar a qualidade geral do seu site e não foque tanto em questões técnicas para estas páginas.

Se este for o seu caso, faça o seguinte:

Compartilhar
Author Photo
Trabalho como Marketing Manager Lead da Semrush no Brasil e sou responsável pelas ações de marketing que envolvem a marca em diferentes canais. Sou apaixonado por comunicação e por aprender cada vez mais sobre o universo do Marketing Digital.
Mais sobre isso