Conteúdo duplicado: práticas de SEO para evitá-lo

O que é conteúdo duplicado?

Conteúdo duplicado é uma cópia exata de um conteúdo em outro lugar da internet. No entanto, o termo também pode se referir a conteúdos quase idênticos, como aqueles que apenas trocam o nome de um produto, marca ou local, por exemplo.

A simples troca de algumas palavras não fará com que uma página deixe de ser considerada conteúdo duplicado. Como resultado, seu desempenho de pesquisa orgânica pode ser afetado negativamente.

O termo também se refere ao conteúdo repetido em várias páginas do seu site ou em domínios diferentes. Felizmente existem muitos métodos para prevenir ou minimizar o impacto de conteúdo duplicado pode meio de correções técnicas.

Neste guia, veremos as principais causas do conteúdo duplicado, as melhores formas de evitá-lo e como garantir que seus concorrentes não possam copiar seu conteúdo e alegar que são os verdadeiros criadores.

Veremos:

O impacto do conteúdo duplicado
Métodos para evitar conteúdo duplicado
E se meu conteúdo tiver sido copiado contra minha vontade?
Revisão de conteúdo duplicad

O impacto do conteúdo duplicado

Páginas criadas com exatamente o mesmo conteúdo que outra podem resultar em várias consequências nos resultados da pesquisa Google e até mesmo em penalidades. Os problemas mais comuns por conta de conteúdo duplicado incluem:

A versão errada da página é exibida na SERP;
Páginas-chave com desempenho ruim na SERP ou com problemas de indexação;
Flutuações ou reduções nas principais métricas do site (tráfego, classificação ou critérios EAT);
Outras ações inesperadas dos mecanismos de pesquisa.

Embora ninguém tenha certeza de quais elementos do conteúdo serão priorizados pelo Google, o buscador sempre aconselhou webmasters e criadores de conteúdo a criar páginas para usuários, não para mecanismos de pesquisa.

Com isso em mente, o ponto de partida para qualquer webmaster ou profissional de SEO deve ser criar conteúdo que agregue valor aos usuários. No entanto, isso nem sempre é fácil ou mesmo possível.

Fatores como conteúdo de templates, funcionalidade de pesquisa, tags UTM, compartilhamento de informações ou distribuição de conteúdo são possíveis causas de duplicação.

Garantir que seu próprio site não tenha conteúdo duplicado envolve uma combinação de estrutura clara, manutenção regular e conhecimento técnico para evitar a criação de conteúdo idêntico.

Métodos para evitar conteúdo duplicado

Existem muitos métodos e estratégias diferentes para evitar a criação de conteúdo duplicado no seu próprio site e impedir que outros domínios se beneficiem de uma cópia do seu conteúdo.

São eles:

Taxonomia;
Tags canônicas;
Metamarcação;
Parameter Handling;
Manipulação de Parâmetros;
Redirecionamentos.

Taxonomia

É aconselhável ter uma visão geral da taxonomia do seu site. Seja um conteúdo novo ou atualizado, mapear suas páginas e atribuir uma palavra-chave e um H1 únicos para cada um é fundamental.

Organizar seu conteúdo em topic clusters pode ajudar a criar uma estratégia que evita a duplicação.

Tags canônicas

Possivelmente, o elemento mais importante para evitar a duplicação de conteúdo são as tags canônicas.

O elemento rel=canonical é um trecho de código HTML que informa o Google que aquele conteúdo pertence àquele site, mesmo havendo cópias em outro lugar. Essas tags indicam aos bots qual versão de uma página é a ‘principal'.

A tag canônica pode ser usada para versões de uma página para celular e computador, páginas customizadas por local, versões impressas etc.. Basicamente, ela pode ser usada para qualquer situação em que existam versões diferentes de uma mesma página

Existem dois tipos de tags canônicas: as que apontam para uma página e as que apontam para fora da página. Aqueles que apontam para outra página informam aos mecanismos de pesquisa que outra versão da página é a principal'.

A outra são aquelas que se reconhecem como a versão master, também conhecidas como tags canônicas autorreferenciadas. Elas são uma parte essencial para eliminar conteúdo duplicado – e o uso de tags canônicas autorreferenciadas é uma prática recomendada para o seu site.

Metamarcação

Outro elemento técnico útil para analisar ao procurar conteúdo idêntico no seu site são os robot meta e os sinais de página que você envia para os mecanismos de pesquisa.

As tags robots meta são importantes caso você deseje excluir uma determinada página da indexação do Google para ela não ser exibida nos resultados de pesquisa.

Ao adicionar a tag meta robots 'no index' ao código HTML da página, você ordena que ela não seja exibida nas SERPs. Este é o método mais utilizado para o bloqueio do Robots.txt.

Embora essa instrução possa ser dada por vários motivos, o Google a entenderá e excluirá as páginas duplicadas dos resultados.

Manipulação de parâmetros

Os parâmetros de URL indicam aos mecanismos de pesquisa como rastrear sites de maneira eficaz. Esses parâmetros geralmente causam duplicação de conteúdo, pois seu uso cria cópias de uma página.

Por exemplo: se houver várias páginas diferentes de um mesmo produto, isso será considerado como conteúdo idêntico pelo Google.

No entanto, a manipulação de parâmetros facilita o rastreamento do site e ajuda a evitar a criação de conteúdo duplicado. Especialmente para sites maiores e sites com funcionalidade de pesquisa integrada, é importante empregar a manipulação de parâmetros por meio do Google Search Console ou do Bing Webmaster Tools.

Ao indicar determinadas páginas na ferramenta e sinalizá-las ao Google, fica claro para o mecanismo de busca que elas não devem ser rastreadas e qual ação adicional deve ser tomada.

URLs duplicadas

Vários elementos estruturais de URL podem causar problemas de duplicação em um site. Muitos deles são causados pela maneira como os mecanismos de pesquisa interpretam as URLs. Se não houver outras diretivas ou instruções, uma URL diferente sempre será entendida uma página diferente.

Essa falta de clareza pode causar flutuações ou reduções nas principais métricas do site (tráfego, classificação ou critérios EAT ) se não for resolvida. Como já falamos, os parâmetros de URL causados pela funcionalidade de pesquisa, códigos de rastreamento e outros elementos de terceiros podem causar a criação de várias versões de uma mesma página.

As formas mais comuns de versões duplicadas de URLs incluem: versões de páginas HTTP e HTTPS, www. e não-www., e páginas com barras à direita e sem etc.

No caso das duas últimas, você precisa identificar a versão mais usada no seu site e mantê-la em todas as páginas para evitar o risco de duplicação. Além disso, os redirecionamentos devem ser configurados para a versão da página que deve ser indexada, por exemplo, mysite.com > www.mysite.com.

Por outro lado, as URLs HTTP representam um problema de segurança, pois a versão HTTPS usa criptografia (SSL), tornando a página segura.

Redirecionamentos

Os redirecionamentos são muito úteis para eliminar conteúdo duplicado. Páginas duplicadas podem ser redirecionadas ou enviadas de volta para a versão principal.

Caso haja páginas com alto volume de tráfego ou valor de link duplicado de outra página, os redirecionamentos podem resolver esse problema.

Ao usar redirecionamentos para remover conteúdo duplicado, há duas coisas importantes que devem ser lembradas: sempre redirecione para a página de melhor desempenho, para limitar o impacto no desempenho do seu site, e, se possível, use o redirecionamento 301.

Se você quiser mais informações sobre quais redirecionamentos implementar, confira nosso guia sobre redirecionamentos 301.

E se meu conteúdo tiver sido copiado contra minha vontade?

O que fazer se seu conteúdo foi copiado e você não usou uma tag canônica para indicar que ele era o original?

Use o Search Console para identificar com que regularidade seu site está sendo indexado.
Entre em contato com o webmaster responsável pelo site que copiou o seu conteúdo e solicite sua remoção – ou citação da fonte.
Use tags canônicas de autorreferência em todos os conteúdos criados para garantir que eles sejam reconhecidos como a fonte das informações.

Revisão de conteúdo duplicado

Os esforços para evitar conteúdo duplicado começa na criação de conteúdo de qualidade para o seu site. No entanto, as práticas para evitar que outras pessoas o copiem podem ser mais complexas.

A maneira mais segura de evitar problemas de conteúdo duplicado é revisar a estrutura do site e focar na jornada dos seus usuários. Quando a duplicação de conteúdo ocorre devido a fatores técnicos, as táticas que abordamos acima ajudam a aliviar os riscos para o seu site.

É importante enviar os sinais corretos ao Google para marcar seu conteúdo como a fonte original. Isso é especialmente importante se seu conteúdo for distribuído para terceiros ou se você descobriu plágios (ou conteúdo sem fonte) em outros sites.

Dependendo de como ocorreu a duplicação, você pode usar diferentes táticas para indicar o seu conteúdo como original e as outras versões como duplicatas.