Hacer tu propio sitemap

Un sitemap es un archivo en xml que contiene un listado de todas las URLs de tu página que quieres que se indexen, lo que permite a los buscadores recorrer todas tus páginas sin que se les pase una. Además, el sitemap te permite establecer la importancia de una página frente a las demás, la fecha de última modificación y cada cuanto deberían pasar los buscadores para actualizarla.

Además del sitemap en XML, también existe la opción de crear un sitemap en formato HTML, que consiste en crear una sección en tu web a la que se accede a través de la portada y que contiene enlaces a las categorías principales, éstas a las subcategorías y así hasta llegar al contenido. Si la página no es muy grande todas las URLs estarán en el mismo archivo del mapa web, si no, seguramente se generarán páginas dinámicamente. El mapa web es útil para la indexación, pero no permite establecer prioridades (mas allá de los H1-H6) o frecuencia de actualización, aunque si permite meter distintos anchor text que hagan la función de palabra clave además de incrementar los inner links.

¿Cómo creo mi sitemap?

Si tu web es pequeña, quizás te animes a crearlo manualmente, para ello debes crear un archivo xml (comúnmente nombrado sitemap.xml y alojado en el directorio principal) con una serie de etiquetas que indican las distintas URLs y propiedades de las mismas:

  • urlset: Necesaria. Etiqueta de apertura y cierre del xml.
  • url: Necesaria. Etiqueta que sirve para hacer referencia a cada página, dentro de esta etiqueta se ponen las características de cada una.
  • loc: Necesaria. Aquí es donde se pone la URL de la página.
  • priority: Opcional. Establece la prioridad de la página en relación al resto de páginas de tu web de 0.0 a 1.0, siendo 1.0 la máxima prioridad.
  • changefreq: Opcional. Establece la frecuencia con la que se hacen cambios en la página para ayudar a los buscadores, no obstante, estos pasaran con la frecuencia que consideren necesaria teniendo en cuenta lo aquí establecido.
  • lastmod: Opcional. La fecha de última modificación en formato W3C Datetime (YYYY-MM-DD). No es necesario incluir la hora.

Ejemplo:

<?xml version='1.0' encoding='UTF-8'?>
<urlset>
  <url>
    <loc>http://www.entrecodigos.com</loc>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>http://www.entrecodigos.com/manual-seo</loc>
    <priority>0.9</priority>
  </url>
</urlset>

Generar el sitemap automáticamente

Si quieres generar el sitemap automáticamente tienes algunos programas a tu alcance. Comentaré estos programas en unos días, estad atentos a esta misma entrada y al Blog!

Si tienes un blog en wordpress también puedes utilizar el plugin Google Sitemaps Generator, muy útil y de fácil instalación que te lo generará automáticamente, es flexible y te permite configurarlo todo o dejarlo como viene por defecto (que no está mal).

Enviar el sitemap a Google y Yahoo

Una vez que ya hemos conseguido crear nuestro propio sitemap debemos comunicárselo a los principales buscadores (ya comenté aquí porqué el resto no son necesarios).

En el caso de Google, tras crearnos una cuenta e iniciar sesión, nos dirigimos a las herramientas para webmaster y nos aparecerá un menú bastante sencillo para enviar nuestro Sitemap. No obstante, tenemos que validarnos como auténtico webmaster de la página ya que las “herramientas para webmasters” nos ofrecen mucha y muy buena información sobre nuestra web. Tras hacerlo usando el método que te venga mas cómodo esperamos unas horas hasta que Google haya revisado el archivo y lo haya indexado todo.

Limitaciones del sitemap

Un sitemap no puede tener mas de 50.000 URLs y no puede pesar mas de 10 megabytes. No obstante, es posible tener mas de un sitemap si tu web es muy grande (por ejemplo, Habitat24 tiene mas de 400mil inmuebles y 60mil localidades, lo que supone cientos de miles de posibles páginas), simplemente no repitas las URLs entre ellos y no pongas mas de 50.000 URLs en cada uno.

Consejos a tener en cuenta

Es importante establecer la prioridad en función de lo que quieres que los buscadores muestren ante una búsqueda, ya que para evitar contenido duplicado, Google sólo mostrará una (quizás 2) página del mismo dominio que coincida con los resultados (y si tienen el mismo contenido sólo una de ellas).

Imagínate que alguien busca sobre algo que has escrito y Google le lleva a la categoría en que se encuentra pero el articulo está unas líneas mas abajo, tras otros mas recientes. El usuario podría no encontrarlo e irse. Por ello, es bueno decirle a los buscadores qué página quieres que muestren con mayor prioridad, y en el caso de un Blog, el artículo tiene mas prioridad que la categoría.

18 thoughts on “Hacer tu propio sitemap”

  1. Gracias por el apunte Víctor!!
    Conozco un programa que se llama SiteCrawler (creo) y algún otro mas, pero ese que comentas creo que no lo conocía, le echaré un vistazo que puede estar muy bien, y eso de que sea en .Net y open source hace que me llame mas la atención aún.

  2. La función del sitemap es permitirle a los buscadores conocer todas tus páginas y algunas características de estas, como por ejemplo, la prioridad entre ellas, lo que permite a Google estructurar tu web y mostrar resultados más completos y precisos en las búsquedas.

  3. Mis páginas mantienen un pagerank casi tan exacto que la prioridad en el sitemap.
    1.0 para index
    0.63 para las subsecciones
    y 0.5 para las de tercer nivel

  4. Muy buena información.
    Me ha permitido generar el sitemap de las páginas estáticas, pero tengo una página dinámica en php que no se genera.

    ¿Sabéis de alguna herramienta que pueda utilizar?

    Muchas gracias.
    Lluis.

Comments are closed.