Generador de sitemaps de Google

Publicado el 14 de enero del 2009

Una de las cosas que más dolores de cabeza nos pueden dar las páginas web muy muy grandes es la de creación de sitemaps generales. En páginas web normales es relativamente sencillo crear un sitemaps mediante programación php + MySql pero cuando detrás de un sitio hay muchos servidores distribuidos, millones de artículos, miles de artículos diarios es muy difícil hacer un sitemaps de toda la web cada día.

Hasta ahora se podía usar un Generador de Sitemaps de Google, que es un programa en phyton que se instala en el servidor y te metía TODO lo que encontrara en las carpetas de dicho servidor en el sitemap.

Aunque tenía un archivo de configuración donde le dabas los filtos que querías para que no lo añadiera al sitemaps (gif, jppg, carpetas que no querías que fuesen publicadas, etc) era muy complicado de hacer correctamente, por lo menos en nuestro caso.

Ahora Google ha sacado un nuevo generador de sitemaps que se basa en los logs del servidor, otro método que posiblemente funcione mejor. Lo voy a probar a ver que tal va.

¿Alguien sabe de algún generador de sitemaps online que te deje crear uno de millones de URLs?. Creo que no lo hay pero si alguien conoce alguno le agradecería que lo mencionara a ver si me quito un problema de encima jeje.


 


Carloshace Hace más de 10 años y 156 días


Mira que intenté veces hacer un sitemap de un sitio gigantesco con Xenu, pero siempre se acaba bloqueando a partir de las 100.000 paginas creo recordar.

El nuevo generador no es mala idea, pero no acabo de confiar en que funcione bien la verdad.

Edgar Granadoshace Hace más de 10 años y 156 días

El limite de urls por sitemap de Google es de 50.000 urls, con lo que si tienes 1 millón deberás de crear un index de sitemap que apunte hacia los X sitempas con 50.000 urls cada una.

Raquelhace Hace más de 10 años y 156 días

no le hay...lo busqué pero no lo encontré ...así que no le hay... Hoy nos hemos puesto de acuerdo en el post??? saludos Lino :)

SrLanskyhace Hace más de 10 años y 155 días

Saludos, hombre del futuro... En serio, corrige lo de la fecha.

Errioxahace Hace más de 10 años y 155 días

@SrLansky jaja tienés razón!



Lea otros artículos de Google Search Console

Contacta

Lánzate y pregunta!


He leído y acepto la política de privacidad

Mecagoenlos.com te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por Lino Uruñuela. como responsable de esta web.

La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para enviar un correo con los datos que introduzcas, sin guardarse en ninguna base de datos.

Legitimación: Al marcar la casilla de aceptación, estás dando tu legítimo consentimiento para que tus datos sean tratados conforme a las finalidades de este formulario descritas en la política de privacidad.

Como usuario e interesado te informamos que los datos que nos facilitas estarán ubicados en los servidores de Linode.com (proveedor de hosting de Mecagoenlos.com) cumpliendo la ley de protección de datos. Ver política de privacidad de Linode.com.

Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en info@mecagoenlos.com, así como el derecho a presentar una reclamación ante una autoridad de control. Más información aquí.

Últimos posts

Últimos comentarios


Juan Francisco Gancia

Excelente artículo, gracias! Te encuentro de casualidad por un post de hace 10 años.
Post: Diferencias entre url indexada y url accesible

Lino Urnuela

@Emirodgar gracias! Pero parece que en tema de imágenes las pilla lo hagas cómo lo hagas parece, eso sí, siempre que no tengas un fall
Post: Indexar imágenes en Google usando Lazy Load

Emirodgar

Muy interesante el experimento. Yo estaba probando con los nuevos formatos webp y pero al final, como eran pocas imágenes y usaba Masonry,
Post: Indexar imágenes en Google usando Lazy Load

Lino Uruñuela

Completamente de acuerdo :) Pero en este experimento solo quería comprobar el método usado para hacer lazy load, en este caso con xmlht
Post: Indexar imágenes en Google usando Lazy Load

Francisco Morales

Lino muy interesante las distintas formas de cargar la imagen. Pero no crees que lo realmente interesante de aplicar Lazy Loading es cargar
Post: Indexar imágenes en Google usando Lazy Load

javier

Buenas , esto del onclik ha cambiado actuamente en algunas web que tengo las lee y sigue enlaces
Post: ¿Cómo ejecuta, interpreta e indexa Google el contenido cargado mediante javascript?

David Girona

Antes de Nada muchas gracias por la aportación. Estoy probando de poner en marcha este procedimiento y me surgen un par de dudas. En
Post: Cómo añadir el valor del meta Robots a Google Analytics via Google Tag Manager

Javier Espinoza

Gracias por la informacion!! Este tipo de blogs me parecen muy importantes, esto lo estudio en la universidad. gracias por la informacion. h
Post: Atacados por los .cn .cz .pl

juan

Hola Lino Uruñuela, una duda ¿aun funciona? porque no lo logro. Mira, en un index.php tengo este codigo: Camuflados
Post: Ofuscando enlaces para mejorar Link Juice

DUQUEredes

Google pasa del canonical bastante :-(
Post: Comprobando comportamiento de Google con meta canonical