Conteúdo Duplicado: Black Hat e Encrenca em Dobro

Afinal, o que é Conteudo Duplicado?

Uma técnica muito comum entre blogueiros, webmasters e profissionais de SEO (Otimização de Sites) adeptos do Black Hat (Black Haters) é o chamado Conteúdo Duplicado. Duplicar conteúdo basicamente nada mais é do que pegar uma página de um site ou um artigo de um blog que tenham um conteúdo relevante e copia-los para o seu site ou blog como se você que tivesse escrito. O Google não revela qual a porcentagem do texto de uma página que deve ser copiada ( mais uma vez para evitar a criação de táticas avançadas de black hat ), mas estudos e testes comprovam que algumas poucas linhas já bastam.

Principais Tipos de Conteúdo Duplicado

Conteúdo Duplicado: Nem sempre o resultado é igual ao original...

Uma informação importante que pouca gente sabe é que não é só no corpo do texto que o conteúdo duplicado acontece, copiar meta-description tags, title tags ( títulos ) ou meta keyword tags de outros sites também é um caso deste black hat. Além disso há alguns outros casos interessantes em que o conteúdo duplicado pode ser gerado automaticamente ( sem que o webmaster perceba ):

  • Case Sensitive: muita gente desconhece o fato de que as URLs são case sensitive, ou seja, as letras maiúsculas e minusculas são importantes. Por exemplo você pode usar URLs do tipo “www.meusite.com.br/compre-agora.php” e “www.meusite.com.br/Compre-Agora.php” em pontos diferentes do site sem perceber, qualquer pessoa que ler estas 2 URLs claramente vai saber que são a mesma página, no entanto para o Googlebot e os crawlers em geral que são programas isso não fica claro, já que ele conseguiu chegar na tal página de dois modos diferentes através de 2 URLs distintas, ele vai pensar que se tratam de duas páginas diferentes com o conteúdo exatamente igual.
  • URLs não Canonizadas: Outro caso em que conteúdo duplicado é gerado sem consentimento dos desenvolvedores é o caso das URLs com e sem o www. Da mesma forma que foi dito acima, se o Googlebot consegue chegar na sua home page através dos endereços “www.meusite.com.br” ou então “meusite.com.br” ele vai considerar que são novamente dois sites diferentes ( já que as URLs são diferentes ) ou então duas páginas do seu site com o conteúdo idêntico, para evitar que o Googlebot tenha este comportamento o seu htaccess pode ser configurado para canonizar as suas URLs.

Desvatagens do Conteúdo Duplicado

Além é claro do risco do seu site ser punido e perder algumas posições no ranking por copiar conteúdo de outros ( caso do uso do Conteúdo Duplicado como Black Hat ), há algumas outras desvantagens de se ter conteúdo duplicado no seu site ( acidental ou não ):

  • Competição Desnecessária: Se duas páginas do seu próprio site estiverem duplicadas ( devido a algum dos fatores apontados acima por exemplo ), você só tem a perder pois estas páginas vão começar a competir entre sí e ambas vão perder ranking.
  • Desperdicio de Tempo de Indexação: O Googlebot dependendo do tamanho do seu site, tem um determinado tempo fixo ( as vezes insuficiente para indexar o site todo ) para poder ler e indexar o seu site. Se você proporicionar que ele chegue a uma ou mais páginas através de URLs diferentes ele pode perder tempo indexando mais de uma vez a mesma página pensando se tratar de outra.

Conteúdo Duplicado: Seja Criativo, mas não copie...

Algumas Curiosidades sobre o Conteúdo Duplicado

Uma pergunta que muitos fazem: então quer dizer que não podemos citar trechos de outros sites interessantes de outros sites por que é perigoso cairmos sem querer no filtro de Black Hat do Google ? Não, não é bem assim.. Há uma tática que podemos utilizar para deixar claro que não estamos fazendo Black Hat: usar Blockquotes. Blockquotes são tags HTML que pouquissima gente conhece ( <blockquote> citação de outro site ou blog… </blockquote>). Usar o texto dentro de uma blockquote indica explicitamente ao crawler que você está fazendo uma citação. Claro, não vá abusar da boa vontade do pobre Googlebot botando um artigo inteiro dentro de outro site dentro de Blockquotes ( aposto que algumas mentes black hat já pensaram nisso.. ), dependendo da quantidade de texto colocado o filtro de black hat é sim ativado.

Outra curiosidade que muitos tem: existem conteúdo duplicado em texto de linguas diferentes: a resposta é sim. Se você copiar um texto de um site ou blog em inglês exatemante do jeitinho que ele é no seu site traduzindo para o português você tem uma grande chance de ser pego. O Google em especial vem sempre desenvolvendo ferramentas de tradução, como o Google Translate, ferramantas essas que além de poderem ser usadas pelos usuários para traduzir textos também sempre são incorporadas ao Googlebot para ele poder detectar black hats desse tipo.

Por fim nossa dica para você que produz conteúdo para blogs ou sites é simples e bem manjada: seja criativo, traga coisas novas, conteúdo original. Não faz mau se você se basear em outros artigos para produzir os seus (isso é feito desde a invenção da escrita), só não esqueça de citar as suas fontes. Por enquanto é isso qualquer dúvida é só comentar! Abraços!