Conhecimento
Kits de ferramentas da Semrush
SEO
Auditoria do site
Configurando a Auditoria do site

Configurando a Auditoria do site

Para configurar uma Auditoria do site, primeiro você precisa criar um projeto para o domínio. Depois de criar seu novo projeto, selecione o botão “Configurar” no bloco Auditoria do site da sua interface do projeto.

Se você se deparar com algum problema ao executar a Auditoria do site, consulte Solução de problemas de Auditoria do site para obter ajuda.

Domínio e limite de páginas

Você será levado para a primeira parte do assistente de configuração, Domínio e limite de páginas. A partir daqui, você pode optar por “Iniciar Auditoria do site”, para executar imediatamente uma auditoria do seu site com nossas configurações padrão, ou prosseguir para personalizar as configurações de sua auditoria da forma como quiser. Mas não se preocupe, você sempre pode alterar as configurações e executar novamente a auditoria para rastrear uma área mais específica do site após fazer a configuração inicial.

Escopo de rastreamento

Para rastrear um domínio, subdomínio ou subpasta específico, você pode inseri-lo no campo “Escopo de rastreamento”. Se você inserir um domínio neste campo, terá a opção de rastrear todos os subdomínios do seu domínio, basta ativar uma caixa de seleção.

Por padrão, a ferramenta verifica o domínio raiz, que inclui todos os subdomínios e subpastas disponíveis em seu site. Nas configurações da Auditoria do site, você especificar um subdomínio ou subpasta como escopo de rastreamento e desmarcar “Rastrear todos os subdomínios” se não quiser que outros subdomínios sejam rastreados.

Por exemplo, talvez você queira auditar somente o blog do seu site. Você pode especificar o escopo de rastreamento blog.semrush.com ou semrush.com/blog/, dependendo se ele está implementado como subdomínio ou subpasta.

Janela exibindo as configurações básicas de Auditoria do site: Escopo de rastreamento, Limite de páginas verificadas e Fonte de rastreamento. Uma seta vermelha aponta para a linha Ver Exemplos abaixo de Escopo de rastreamento, que abre os exemplos de domínio raiz, subdomínio e subpasta.

GIF exibindo as configurações básicas de Auditoria do site. O número de páginas e o escopo de rastreamento estão sendo selecionados, demonstrando as opções disponíveis. Após selecionar o número desejado de páginas a serem rastreadas e a fonte de rastreamento, o cursor do mouse vai para o botão verde Iniciar Auditoria do site.

Limite de páginas verificadas

Em seguida, selecione quantas páginas você deseja rastrear por auditoria. É possível inserir um valor personalizado na opção “Personalizado”. Você deve escolher esse número de forma sensata, dependendo do nível da sua assinatura e com que frequência você planeja refazer a auditoria do site.

  • Os usuários do Pro podem rastrear até 100.000 páginas por mês e 20.000 páginas por auditoria
  • Os usuários do Guru podem rastrear 300.000 páginas por mês e 20.000 páginas por auditoria
  • Os usuários do Business podem rastrear até 1 milhão de páginas por mês e 100.000 páginas por auditoria

Fonte de rastreamento

Ao definir a Fonte de rastreamento, você determina como o robô da Auditoria do site da Semrush rastreia seu site e encontra páginas a serem auditadas. Além de definir a fonte de rastreamento, você pode definir máscaras e parâmetros para incluir/excluir da auditoria nas etapas 3 e 4 do assistente de configuração.

Existem 4 opções para definir como fonte de rastreamento da sua Auditoria: Site, Sitemaps do site, Informe a URL do sitemap e URLs do arquivo.

1. Para a Fonte de rastreamento “Site”, vamos rastrear seu site como o GoogleBot, usando um algoritmo de pesquisa em largura (breadth-first) e navegando pelos links que vemos no código da sua página, começando pela página inicial.

Se você deseja rastrear apenas as páginas mais importantes de um site, optar por rastrear a partir do sitemap em vez do site permitirá que a auditoria rastreie as páginas mais importantes, em vez de escolher apenas as páginas mais acessíveis na página inicial.

2. Para a Fonte de rastreamento “Sitemaps do site”, vamos rastrear somente as URLs que forem encontradas no sitemap do arquivo robots.txt.

3. A Fonte de rastreamento “Sitemap por URL” é igual à "Sitemaps do site", mas essa opção permite informar especificamente a URL do seu sitemap.

Como os mecanismos de pesquisa usam sitemaps para entender quais páginas precisam rastrear, você deveria sempre tentar manter seu sitemap o mais atualizado possível e usá-lo como fonte de rastreamento com nossa ferramenta para obter uma auditoria precisa.

Observação: a Auditoria do site pode usar somente uma URL de sitemap como fonte de rastreamento em um dado momento, portanto, caso seu site tenha vários sitemaps, a opção seguinte (URLs do arquivo) pode ser uma solução alternativa.

4. Para a Fonte de rastreamento “URLs do arquivo”, você audita um conjunto muito delimitado de páginas de um site. O seu arquivo deve estar formatado corretamente como .CSV ou .TXT, com uma URL por linha, e deve ser enviado diretamente à Semrush pelo seu computador.

Esse é um método útil se você quiser verificar páginas específicas e conservar seu orçamento de rastreamento. Se você tiver feito alguma alteração em apenas algumas páginas do seu site, pode usar esse método para executar uma auditoria específica e não desperdiçar seu orçamento de rastreamento.

Depois de carregar o arquivo, o assistente informará quantas URLs foram detectadas para que você possa verificar se deu certo antes de executar a auditoria.

Janela de configurações da Auditoria do site. Em Fonte de rastreamento, a opção URLs do arquivo está selecionada e destacada. Para demonstrar o funcionamento, um arquivo de exemplo foi carregado. A ferramenta forneceu o número de URLs detectadas no arquivo (97), e esse número também está destacado no menu.

Rastreamento de JavaScript

Se você usa JavaScript em seu site, pode habilitar a renderização em JS nas configurações de sua campanha de auditoria do site.

Site Audit settings window with the second tab, Crawler settings, on display. The JS rendering part, which is the last one on this tab, is highlighted to make this option easier to find.

Este recurso está disponível apenas em assinaturas Guru ou Business.

Auditoria de AMPs

A caixa de seleção “Rastrear páginas AMP primeiro” garante que a auditoria rastreie suas páginas AMP para verificar os problemas mais importantes relacionados à implementação de AMP. No momento, as verificações de AMP estão disponíveis apenas para assinaturas Business.

Depois de definir essas configurações, você pode executar a Auditoria do Site. No entanto, se você quiser adicionar máscaras ou remover parâmetros e definir uma programação de auditorias, use as instruções avançadas de configuração abaixo. 

Configurações avançadas

Observação: os quatro passos de configuração a seguir são avançados e opcionais.

Configurações do rastreador

É aqui que você pode escolher o user agent que vai rastrear seu site. Primeiro, defina o user agent de auditoria. Você pode escolher a versão Mobile (dispositivos móveis) ou Desktop (computadores) do SiteAuditBot ou do GoogleBot.

Por padrão, verificamos seu site com nosso bot de rastreamento para dispositivos móveis, que ajuda a auditar o site da mesma forma que o rastreador para dispositivos móveis do Google. Você pode alterar o bot para o rastreador para computadores da Semrush quando desejar. 

Menu de configurações da Auditoria do site. Na segunda guia, “Configurações do rastreador”, a seção User agent está destacada. A opção padrão de User agent está selecionada: SiteAuditBot-Mobile.

Conforme você altera o user agent, verá o código na caixa de diálogo abaixo mudar também. Esse é o código do user agent e pode ser usado em um comando curl se você quiser testar o user agent por conta própria.

Opções de crawl-delay (atraso de rastreamento)

Em seguida, você tem três opções para definir um atraso de rastreamento: atraso mínimo, respeitar o robots.txt e 1 URL a cada 2 segundos.

Se você deixar o atraso mínimo entre as páginas marcado, o bot rastreará seu site na velocidade normal. Por padrão, o SiteAuditBot aguardará um segundo antes de iniciar o rastreamento de outra página.

Se você tiver um arquivo robots.txt em seu site com um atraso de rastreamento especificado, poderá selecionar a opção “respeitar o robots.txt” para que nosso rastreador de auditoria do site siga essas instruções.

Veja abaixo um exemplo de atraso de rastreamento em um arquivo robots.txt:

Crawl-delay: 20

Se nosso rastreador deixar seu site mais lento e você não tiver uma diretiva de atraso de rastreamento no arquivo robots.txt, pode dizer à Semrush para rastrear 1 URL a cada 2 segundos. Dessa forma, a auditoria pode demorar mais para ser concluída, mas causará menos problemas de velocidade para usuários reais que estiverem usando o seu site durante a auditoria.

Permitir/proibir URLs

Esta opção permite especificar quais subpastas de um site podem ou não podem ser rastreadas. Você deve incluir tudo dentro da URL após o TLD. Por exemplo, se você quiser rastrear a subpasta http://www.example.com/shoes/mens/, precisa inserir “/shoes/mens/” na caixa de permissões à esquerda.

Etapa Permitir/proibir URLs nas configurações de Auditoria do site. Na captura de tela. há dois campos para as máscaras de permitir/proibir. No campo “Permitir”, o seguinte exemplo foi adicionado: /shoes/mens/. Uma seta vermelha aponta para esse exemplo, indicando que esta é a máscara de formato que deve ser aplicada corretamente.

Para impedir o rastreamento de subpastas específicas, você deve inserir o caminho da subpasta na caixa de proibições. Por exemplo, para rastrear a categoria de sapatos masculinos, mas impedir o rastreamento da subcategoria botas para trilha, em sapatos masculinos, (https://example.com/shoes/mens/hiking-boots/), você deve inserir /shoes/mens/hiking-boots/ na caixa de proibições.

Exemplo de como especificar outras configurações de máscara de permitir e proibir. No campo “Permitir”, uma seta vermelha aponta para o mesmo exemplo /shoes/mens/. Em “Proibir”, uma segunda seta aponta para /shoes/mens/hiking-boots, indicando que determinadas subpastas podem ser excluídas, apesar das diretivas da seção “Permitir”.

Caso você se esqueça de inserir o símbolo / no final da URL na caixa de proibição (exemplo: /shoes), a Semrush pulará todas as páginas na subpasta /shoes/, bem como todas as URLs que começam com /shoes (como www.example.com/shoes-men). 

Remover parâmetros de URL

Parâmetros de URL (também conhecidos como strings de consulta) são elementos de uma URL que não se encaixam na estrutura de caminho hierárquico. Em vez disso, eles são adicionados ao final de uma URL e fornecem instruções lógicas ao navegador da web.

Os parâmetros de URL sempre têm em um ? seguido pelo nome do parâmetro (page, utm_medium, etc) e =.

Portanto, “?page=3” é um parâmetro de URL simples que pode indicar a 3ª página de rolagem em uma única URL.

O 4º passo da configuração da Auditoria do site permite especificar os parâmetros de URL que seu site usa para removê-los das URLs durante o rastreamento. Isso ajuda a Semrush a evitar o rastreamento da mesma página duas vezes na auditoria. Se um bot vê duas URLs, uma com um parâmetro e outra sem, ele pode rastrear ambas as páginas e, consequentemente, desperdiçar seu orçamento de rastreamento.

Etapa Remover parâmetros de URL nas configurações de Auditoria do site. Nos campos de parâmetros, são exibidas diversas opções de exemplo, com uma seta vermelha apontando para elas, destacando como usar o formato de parâmetros de URL para que funcionem corretamente.

Por exemplo, se você adicionar “page” (página) a essa caixa, todas as URLs que tiverem “page” na extensão da URL serão removidas. Seriam URLs com valores como ?page=1, ?page=2, etc. Dessa forma, você evitaria o rastreamento da mesma página duas vezes (por exemplo, “/shoes” e “/shoes/?page=1” como uma URL) no processo de rastreamento.

Os usos comuns de parâmetros de URL incluem páginas, idiomas e subcategorias. Esses tipos de parâmetros são úteis para sites com grandes catálogos de produtos ou informações. Outro tipo de parâmetro de URL comum são os UTMs, usados para rastrear cliques e tráfego de campanhas de marketing.

Se você já tem um projeto configurado e deseja alterar as configurações, pode fazê-lo pelo ícone de engrenagem de Configurações:

Relatório Visão geral da auditoria com o menu Configurações aberto ao clicar no ícone de engrenagem no canto superior direito. O menu Configurações é suspenso, e é possível rolar para baixo para ver mais opções. A lista de opções está destacada em vermelho, assim como o ícone de engrenagem, para que fique mais fácil encontrá-los.

Você usará as mesmas instruções indicadas acima selecionando as opções “Máscaras” e “Parâmetros removidos”.

Ignorar restrições do site

Para auditar um site em pré-produção ou oculto por autenticação com acesso básico, a etapa 5 oferece duas opções:

  1. Ignorar diretiva “Disallow” em robots.txt e pela meta tags robots
  2. Rastreamento com suas credenciais para acessar áreas protegidas por senha

Se você quiser ignorar os comandos de disallow no robots.txt ou meta tag (geralmente isso pode ser encontrado na tag

do seu site), você terá que fazer o upload do arquivo .txt fornecido pela Semrush para a pasta principal do seu site.

Você pode fazer upload desse arquivo da mesma forma que faria upload de um arquivo para verificação do GSC, por exemplo, diretamente na pasta principal do seu site. Esse processo verifica que você é proprietário do site e permite que façamos o rastreamento.

Etapa Ignorar restrições do site nas configurações de Auditoria do site. Cada widget desta etapa está destacada em vermelho. Uma seta vermelha abaixo do número 1 aponta para a opção marcada Ignorar diretiva "Disallow" em robots.txt e pela meta tags robots. A segunda seta abaixo do número 2 aponta para a opção Rastreamento com suas credenciais. A opção Rastreamento com suas credenciais também está marcada e apresenta os campos Nome de usuário e Senha.

Depois que o arquivo for carregado, você poderá iniciar a Auditoria do site e coletar os resultados.

Para rastrear com suas credenciais, basta digitar o nome de usuário e a senha que você usa para acessar a parte oculta do seu site. Em seguida, nosso robô utilizará suas informações de login para acessar as áreas ocultas e fornecer os resultados da auditoria.

Agendamento

Por fim, selecione com que frequência você deseja que façamos a auditoria do seu site automaticamente. As opções são:

  • Semanalmente (escolha qualquer dia da semana)
  • Diariamente
  • Uma vez

Você pode executar a auditoria novamente quando desejar dentro do projeto.

Exemplo das opções de agendamento na última guia do menu de configurações de Auditoria do site. Um menu suspenso está aberto, indicando as opções de cada dia da semana, além de Diariamente e Uma vez.

Depois de concluir todas as configurações desejadas, selecione “Iniciar auditoria do site”.

Solução de problemas

Se a janela “auditoria do domínio falhou” for exibida, você precisa verificar se nosso rastreador de Auditoria do site não está bloqueado pelo seu servidor. Para garantir o rastreamento adequado, siga nossos passos de Solução de problemas de auditoria do site para incluir nosso bot na lista de permissões. 

Como alternativa, você pode baixar o arquivo de log gerado quando ocorre falha no rastreamento e fornecê-lo ao seu webmaster para que ele possa analisar a situação e tentar descobrir o motivo pelo qual estamos sendo impedidos de rastrear.

Como conectar o Google Analytics à Auditoria do site

Após concluir o assistente de configuração, você poderá conectar a sua conta do Google Analytics para incluir problemas relacionados às suas páginas mais visualizadas. 

Se algum problema persistir com a execução da Auditoria do site, tente solucionar problemas de auditoria do site ou entre em contato com a nossa equipe de suporte, que terá o maior prazer em ajudar.

Mostrar mais
Mostrar mais
Mostrar mais