O que é o Google Sitemaps?
Ele ainda é experimental, mas a idéia é informar ao Google toda vez que o seu site é atualizado. Um "mapa do site" informará ao Google as mudanças e com isto permitirá mais agilidade na indexação. Ao invés do Google varrer a web atrás de novidade, bastara ele consultar o Sitemap para saber se houve uma atualização.
Dicas sobre o Google Sitemaps.
Para se extrair o melhor do Google Sitemaps, é necessário que se gere um arquivo XML (Extensible Markup Language) para transmitir ou enviar qualquer atualização de informações em seu site para o Google. Os arquivos XML estão por toda a parte, inclusive na página inicial da MR2. Eles são visualmente reconhecidos pelo logotipo XML na cor laranja e geralmente associados aos Blogs, que utilizam bastante o XML/RSS para divulgar seus conteúdos para o público interessado.
Um dos mais interessados na difusão dessa facilidade é o Google. Criando e estimulando o emprego do Sitemaps, o Google convoca os webmasters a assumir o processo de indexação e de atualização de seus sites. Basicamente, fazendo o trabalho do próprio Google!
Mas esta é uma iniciativa do bem. Com a rápida proliferação de sites, a tarefa de indexar todo este material e de mantê-lo atualizado torna-se um desafio cada vez maior, mesmo para mecanismos de busca que disponham dos recursos e da tecnologia do Google. Com o Google Sitemaps, os webmasters poderão se encarregar do processo de atualização e confiar que seus sites serão analisados pelo Google e lá indexados com as informações mais atualizadas.
Mas não se deve pensar que o Sitemaps favorecerá o ranking dos sites no Google. Os webmasters continuarão a competir pelas principais posições com os outros sites indexados pelo Google. Entretanto, com o Sitemaps, poderão ter a certeza de que todas as páginas do site serão visitadas, atualizadas, e indexadas mais rapidamente.
Observemos este arquivo XML mais de perto
location (loc ou localização) - http://www.seusite.com.br - nome de sua página na web priority (ou prioridade): você define a prioridade que deverá ser considerada pelo Google para cada página. Suas prioridades para cada página poderão ser as seguintes: 0.0 para a menos importante; 1.0 para a mais prioritária; 0.5 para as que tiverem importância mediana. É um ranking definido por você e referido apenas ao seu site. Mas que não afeta a posição real de suas páginas no Google. Então, porque a definição dessa prioridade é importante? Ora, certas páginas de seu site são mais relevantes do que outras (a página "home", a mais lucrativa, a página de login etc.). Desse modo, se você pré-definir a prioridade de cada uma delas, contribuirá para ampliar a respectiva importância dentro do Google, que as listará segundo a ordem de relevância que você arbitrar.
lastmod (última modificação): quando você atualiza a sua página, o registro da data em que ocorreu a mudança evita trabalho ao Google, pois não re-indexará as páginas que se mantiverem inalteradas.
changefreq (freqüência da modificação): você poderá informar ao Google qual a periodicidade com que atualiza as suas páginas: nunca, semanalmente, diariamente, a cada hora, e assim por diante. Se você atualiza com muita freqüência as suas páginas, esta informação é de extrema importância.
Qual a necessidade de um Gerador de Código XML?
Para que o arquivo XML de seu site seja constantemente atualizado, você precisará de um gerador que realize a busca em seu site, liste todas as URL e, automaticamente, alimente o Google com essas informações. Existe um monte desses geradores por aí. Cada um apresenta um modo próprio para a geração de arquivos sitemap, no formato XML. Provavelmente, muitos outros estão surgindo enquanto você lê estas linhas.
A maneira mais fácil - Um Gerador Online
Estes Geradores também proliferam por toda parte e o Google os divulga em seu site. Procure-os na Lista do Google de Geradores produzidos por Terceiros
Um dos mais fáceis de se usar está localizado em www.xml-sitemaps.com. Com muita rapidez, este gerador online indexa até 500 páginas e lhe propicia um arquivo XML de sitemap, o mesmo que o Google precisará para indexar o seu site. Ele vasculha o seu site e indexa todas as páginas em um arquivo XML que você poderá baixar no formato comprimido (ou não) e efetuar dentro dele algumas pequenas mudanças, para incluir dados como prioridade, freqüência de atualização etc.
Isto feito, basta fazer o upload do arquivo para o diretório-raiz do servidor (aonde seu site está localizado fisicamente). Então notifique o Google Sitemaps de seu arquivo XML.
Naturalmente, a única desvantagem, se você inclui regularmente novas páginas em seu site, é que também precisará incluir estas páginas em seu arquivo sitemap XML. Isto não deverá constituir-se em problema, a menos que você adicione páginas diariamente em seu site - então necessitará de uma solução baseada em PHP ou no gerador Python, para que o trabalho ocorra de modo automático.
O Google ainda é o maior motor de procura na WEB; então, este é o principal motivo para que se tenha páginas indexadas e rapidamente atualizadas e a razão de se utilizar o Google Sitemaps. Se você deseja que seu site se mantenha competitivo, provavelmente este é um dos caminhos a seguir.
