Generador de sitemaps de Google

Publicado el 14 de enero del 2009

Una de las cosas que más dolores de cabeza nos pueden dar las páginas web muy muy grandes es la de creación de sitemaps generales. En páginas web normales es relativamente sencillo crear un sitemaps mediante programación php + MySql pero cuando detrás de un sitio hay muchos servidores distribuidos, millones de artículos, miles de artículos diarios es muy difícil hacer un sitemaps de toda la web cada día.

Hasta ahora se podía usar un Generador de Sitemaps de Google, que es un programa en phyton que se instala en el servidor y te metía TODO lo que encontrara en las carpetas de dicho servidor en el sitemap.

Aunque tenía un archivo de configuración donde le dabas los filtos que querías para que no lo añadiera al sitemaps (gif, jppg, carpetas que no querías que fuesen publicadas, etc) era muy complicado de hacer correctamente, por lo menos en nuestro caso.

Ahora Google ha sacado un nuevo generador de sitemaps que se basa en los logs del servidor, otro método que posiblemente funcione mejor. Lo voy a probar a ver que tal va.

¿Alguien sabe de algún generador de sitemaps online que te deje crear uno de millones de URLs?. Creo que no lo hay pero si alguien conoce alguno le agradecería que lo mencionara a ver si me quito un problema de encima jeje.


 


Carloshace Hace más de 11 años y 79 días


Mira que intenté veces hacer un sitemap de un sitio gigantesco con Xenu, pero siempre se acaba bloqueando a partir de las 100.000 paginas creo recordar.

El nuevo generador no es mala idea, pero no acabo de confiar en que funcione bien la verdad.

Edgar Granadoshace Hace más de 11 años y 79 días

El limite de urls por sitemap de Google es de 50.000 urls, con lo que si tienes 1 millón deberás de crear un index de sitemap que apunte hacia los X sitempas con 50.000 urls cada una.

Raquelhace Hace más de 11 años y 79 días

no le hay...lo busqué pero no lo encontré ...así que no le hay... Hoy nos hemos puesto de acuerdo en el post??? saludos Lino :)

SrLanskyhace Hace más de 11 años y 78 días

Saludos, hombre del futuro... En serio, corrige lo de la fecha.

Errioxahace Hace más de 11 años y 78 días

@SrLansky jaja tienés razón!



Lea otros artículos de Google Search Console

Últimos posts

Últimos comentarios


Lino

@errioxa probando desde comentarios del site :)
Post: El valor de los logs para el SEO

Lino

@Santy Jordi y Sergio muchas gracias! Irá mejorando, pero poco a poco :)
Post: Informes y gráficas usando la API de Google Search Console

sergio

Bravo! Gracias por compartir.
Post: Informes y gráficas usando la API de Google Search Console

Santy

Gracias Lino, muy útil para el día a día
Post: Informes y gráficas usando la API de Google Search Console

Jordi

Buenas tardes Lino, Felicidades por la herramienta, me parece algo espectacular y rápido de utilizar. Espero con muchas ganas ver las nue
Post: Informes y gráficas usando la API de Google Search Console

Joan marc

Muchísimas gracias @Lino!! Para acabar, sabes si con Varnish tendríamos problemas? Entiendo que al no hacerse siempre consultas al servid
Post: Monitorizar GoogleBot con Google Analytics

Lino

@Joan marc sí!, pero has de configurar el server para que cualquier URL que de 301 sea tratada por una única url del site (como la url de
Post: Monitorizar GoogleBot con Google Analytics

Joan marc

Excelento post Lino! Has podido trackear los 301 y 302?
Post: Monitorizar GoogleBot con Google Analytics

German

Hola amigo, lo cierto es que no me he enterado pajolera idea de lo que cuentas, aunque te felicito por aparecer en el Discovery de Google. M
Post: Google podria no querer el HTML de una URL

Lino

Una manera súper sencilla para comprobarlo: 1- Una URL, mirar un log de Googlrbot de esa UR cuando da 200 2- Comparar con otro log
Post: Google podria no querer el HTML de una URL