Entre Códigos


El blog de Rubén Cantón

Reflexiones de un cerebro en fuga y artículos sobre posicionamiento, e-marketing, usabilidad y otros tecnicismos.

greyimg

Hacer tu propio sitemap

Escrito por Ruben Cantón el Monday, 12 de November del 2007
Más del mismo tema: blog, seo, taller

Un sitemap es un archivo en xml que contiene un listado de todas las URLs de tu página que quieres que se indexen, lo que permite a los buscadores recorrer todas tus páginas sin que se les pase una. Además, el sitemap te permite establecer la importancia de una página frente a las demás, la fecha de última modificación y cada cuanto deberían pasar los buscadores para actualizarla.

Además del sitemap en XML, también existe la opción de crear un sitemap en formato HTML, que consiste en crear una sección en tu web a la que se accede a través de la portada y que contiene enlaces a las categorías principales, éstas a las subcategorías y así hasta llegar al contenido. Si la página no es muy grande todas las URLs estarán en el mismo archivo del mapa web, si no, seguramente se generarán páginas dinámicamente. El mapa web es útil para la indexación, pero no permite establecer prioridades (mas allá de los H1-H6) o frecuencia de actualización, aunque si permite meter distintos anchor text que hagan la función de palabra clave además de incrementar los inner links.

¿Cómo creo mi sitemap?

Si tu web es pequeña, quizás te animes a crearlo manualmente, para ello debes crear un archivo xml (comúnmente nombrado sitemap.xml y alojado en el directorio principal) con una serie de etiquetas que indican las distintas URLs y propiedades de las mismas:

  • urlset: Necesaria. Etiqueta de apertura y cierre del xml.
  • url: Necesaria. Etiqueta que sirve para hacer referencia a cada página, dentro de esta etiqueta se ponen las características de cada una.
  • loc: Necesaria. Aquí es donde se pone la URL de la página.
  • priority: Opcional. Establece la prioridad de la página en relación al resto de páginas de tu web de 0.0 a 1.0, siendo 1.0 la máxima prioridad.
  • changefreq: Opcional. Establece la frecuencia con la que se hacen cambios en la página para ayudar a los buscadores, no obstante, estos pasaran con la frecuencia que consideren necesaria teniendo en cuenta lo aquí establecido.
  • lastmod: Opcional. La fecha de última modificación en formato W3C Datetime (YYYY-MM-DD). No es necesario incluir la hora.

Ejemplo:

<?xml version='1.0' encoding='UTF-8'?>
<urlset>
  <url>
    <loc>http://www.entrecodigos.com</loc>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>http://www.entrecodigos.com/manual-seo</loc>
    <priority>0.9</priority>
  </url>
</urlset>

Generar el sitemap automáticamente

Si quieres generar el sitemap automáticamente tienes algunos programas a tu alcance. Comentaré estos programas en unos días, estad atentos a esta misma entrada y al Blog!

Si tienes un blog en wordpress también puedes utilizar el plugin Google Sitemaps Generator, muy útil y de fácil instalación que te lo generará automáticamente, es flexible y te permite configurarlo todo o dejarlo como viene por defecto (que no está mal).

Enviar el sitemap a Google y Yahoo

Una vez que ya hemos conseguido crear nuestro propio sitemap debemos comunicárselo a los principales buscadores (ya comenté aquí porqué el resto no son necesarios).

En el caso de Google, tras crearnos una cuenta e iniciar sesión, nos dirigimos a las herramientas para webmaster y nos aparecerá un menú bastante sencillo para enviar nuestro Sitemap. No obstante, tenemos que validarnos como auténtico webmaster de la página ya que las “herramientas para webmasters” nos ofrecen mucha y muy buena información sobre nuestra web. Tras hacerlo usando el método que te venga mas cómodo esperamos unas horas hasta que Google haya revisado el archivo y lo haya indexado todo.

Limitaciones del sitemap

Un sitemap no puede tener mas de 50.000 URLs y no puede pesar mas de 10 megabytes. No obstante, es posible tener mas de un sitemap si tu web es muy grande (por ejemplo, Habitat24 tiene mas de 400mil inmuebles y 60mil localidades, lo que supone cientos de miles de posibles páginas), simplemente no repitas las URLs entre ellos y no pongas mas de 50.000 URLs en cada uno.

Consejos a tener en cuenta

Es importante establecer la prioridad en función de lo que quieres que los buscadores muestren ante una búsqueda, ya que para evitar contenido duplicado, Google sólo mostrará una (quizás 2) página del mismo dominio que coincida con los resultados (y si tienen el mismo contenido sólo una de ellas).

Imagínate que alguien busca sobre algo que has escrito y Google le lleva a la categoría en que se encuentra pero el articulo está unas líneas mas abajo, tras otros mas recientes. El usuario podría no encontrarlo e irse. Por ello, es bueno decirle a los buscadores qué página quieres que muestren con mayor prioridad, y en el caso de un Blog, el artículo tiene mas prioridad que la categoría.

Ya hay 11 comentarios. ¡Falta el tuyo!

Escríbe aquí tu opinión

Nombre (necesario)

Email (no se mostrará)

Web (opcional)

mygif
November 12th, 2007 at 2:09 pm

Un post muy interesante, si señor!

Para acabar de poner la guinda al estupendo artículo de Rubén comentar que si tu web es una aplicación de asp .net puedes usar el SiteMapGenerator de Subgurim (http://es.sitemap.subgurim.net).

Es open source (es decir, gratuito) y sirve para auto generar el fichero sitemap.xml.

Un saludo!

mygif
November 12th, 2007 at 3:29 pm

Gracias por el apunte Víctor!!
Conozco un programa que se llama SiteCrawler (creo) y algún otro mas, pero ese que comentas creo que no lo conocía, le echaré un vistazo que puede estar muy bien, y eso de que sea en .Net y open source hace que me llame mas la atención aún.

mygif
April 24th, 2009 at 5:37 pm

Muy útil el Google Sitemaps Generator. Me ha ahorrado un montón de trabajo..

Gracias.

mygif
May 28th, 2009 at 6:12 pm

@Ruben y que me dices de la prioridad de los tags en el Google Sitemaps Generator este es que el uso en mi blgo alguna sugerencia…

http://www.meborre.com/sitemap.xml

mygif
May 28th, 2009 at 8:41 pm

La función del sitemap es permitirle a los buscadores conocer todas tus páginas y algunas características de estas, como por ejemplo, la prioridad entre ellas, lo que permite a Google estructurar tu web y mostrar resultados más completos y precisos en las búsquedas.

mygif
March 26th, 2010 at 1:34 am

alguien sabe como generar un sitemap para blogspot

mygif
March 26th, 2010 at 1:43 pm

Si tienes blogspot no creo que necesites eso, al menos no para posicionarte en google.

mygif
April 12th, 2010 at 9:12 pm

Mis páginas mantienen un pagerank casi tan exacto que la prioridad en el sitemap.
1.0 para index
0.63 para las subsecciones
y 0.5 para las de tercer nivel

Escríbe aquí tu opinión

Nombre (necesario)

Email (no se mostrará)

Web (opcional)

Pingback y Trackback

Pingback y trackback de varios blogs:
November 14th, 2007 at 12:38 am

[...] una buena política de links internos y haciendo uso del mapa web, puedes conseguir que los buscadores interpreten que una página determinada trata de ese tema y, [...]

November 30th, 2007 at 8:27 am

[...] ahora he comentado los trucos y mejoras en tu web para permitir que los buscadores la indexen pero, como es normal, hay zonas o secciones que no queremos que indexen, como el área privada de [...]

September 20th, 2008 at 2:38 pm

[...] (consideras que la más relevante es otra), para solucionar este posible problema, puedes usar el sitemap y establecer prioridades (basta con no colocar en sitemap la que no quieres que se [...]

¿Quieres más?

Temas del blog

Busca por Entre Códigos

 

Últimos comentarios

Últimos artículos

Lo más comentado

Blogroll

Mis proyectos