Sitemaps: Entendendo e Contruindo!

Entendendo o Conceito de Sitemap

Sitemaps são arquivos presentes no servidor do seu site e que servem para indicar antecipadamente para os crawlers quando eles chegarem, quais são as URLs das suas páginas, ajudando no SEO. Crawlers como o Googlebot por exemplo, tem um tempo determinado máximo para ficar no seu site e indexar o conteúdo, ele até procura pelas URLs se não houver um sitemap presente, mas isso não é nenhuma vantagem já que esse tempo buscando as URLs é descontado do tempo total que ele vai ficar. Então é sempre vantajoso deixar um sitemap preparado para adiantar o trabalho dele.

É interessante lembrar que quanto mais importante vai se tornando o seu site (mais Pagerank, mais visitas e mais tempo no ar) mais tempo o Googlebot vai dedicando a ele e mais regularmente ele vai passando, mas mesmo assim, em geral os sites mais significativos tendem sempre a crescer de tamanho, o que acaba compensando esse ganho de tempo dando mais trabalho para o crawler, resumindo: na prática o Googlebot nunca vai ter tempo de ler o seu site todo, convém sempre dar uma força!

Modo com que o crawler enxerga o seu site quando ele encontra e lê um sitemap:

Modo com que o crawler enxerga o seu site quando ele encontra um sitemap

Modo com que o crawler enxerga o seu site quando ele não encontra um sitemap:

Modo com que o crawler enxerga o seu site quando ele não encontra um sitemap

Informações Adicionais do Sitemap

Além de indicar para o crawler quais são e onde estão as suas páginas, os sitemaps ainda podem indicar algumas informações adicionais:

  • Importância das Páginas: Outra função interessante do sitemap é também informar a eles, qual a importancia que cada página tem. Isso é interessante pois assim o Googlebot e os outros crawlers vão saber quais páginas devem priorizar se não tiverem tempo de ler todas, caso contrário poderia ocorrer de páginas secundárias serem indexadas e as páginas principais ficarem de fora. A prioridade dada a cada página varia de 0 a 1, no caso representando 0% e 100%.
  • Frequência de Atualização: Indicando no sitemap a frequencia com que as suas páginas são atualizadas você ajuda os crawlers a entender melhor como você trabalha e atualiza o seu site. Entendendo como você atualiza fica mais facil pra eles montarem uma tabela de visitação eficiente.
  • Ultima Modificação: Esta informação em conjunto com a frequencia de atualização é util para ajudar os crawlers a planejar o proximo dia que vão voltar.

A Estrutura de Contrução do Sitemap

A estrutura de construção do sitemap foi padronizada esse ano e todos os principais crawlers a compreendem da mesma maneira. Ela é construida da seguinte maneira:

<url>
<loc>http://www.seusite.com.br/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>

Significado de cada tag no Sitemap:

  • <url>: Tag que indica que iniciamos um novo registro no sitemap
  • <loc>: Tag onde serão colocadas as URLs das páginas, sempre com o caminho completo, loc, no caso, vem de location ( localização ) .
  • <lastmod>: Tag que indica a ultima vez que a pagina indicada acima foi modificada, lastmod, vem do termo last modification ( última modificação )
  • <chancefreq>: Tag que tem como função indicar com que frequencia a dada página é alterada, podemos usar: daily, weekly e monthly, o nome da tag vem do termo change frequency ( frequência de atualização )
  • <priority>: Tag que indica para o crawler a importância da página, o valor válido varia de 0 a 1. O valor de 0.8 do exemplo indica que a página, tem importância de 80%, uma importância alta no caso. Prority significa prioridade.

A Localização do Sitemap

Assim como os crawlers procuram pelas suas páginas se não encontram um sitemap, eles também procuram um pouco pelo sitemap se não acham ele logo de cara. O primeiro lugar onde os crawlers procuram e local padrão para deixar o seu sitemap é a raiz do site. Caso você por algum motivo planeje deixar seu sitemap em outro lugar, não esqueça de indicar esse local no robots.txt. A propósito, o robots.txt, ao contrário do sitemap e das URLs não é procurado pelos crawlers, se ele não estiver na raiz do site, os crawlers pressupõe que ele não existe, então não deixe de inserí-lo em seu site para aumentar o nível de adequação para Otimização de Sites. Por enquanto é isso aí, até a semana que vem, abraços !!