Generador de sitemaps de Google

Publicado el 14 de enero del 2009

Una de las cosas que más dolores de cabeza nos pueden dar las páginas web muy muy grandes es la de creación de sitemaps generales. En páginas web normales es relativamente sencillo crear un sitemaps mediante programación php + MySql pero cuando detrás de un sitio hay muchos servidores distribuidos, millones de artículos, miles de artículos diarios es muy difícil hacer un sitemaps de toda la web cada día.

Hasta ahora se podía usar un Generador de Sitemaps de Google, que es un programa en phyton que se instala en el servidor y te metía TODO lo que encontrara en las carpetas de dicho servidor en el sitemap.

Aunque tenía un archivo de configuración donde le dabas los filtos que querías para que no lo añadiera al sitemaps (gif, jppg, carpetas que no querías que fuesen publicadas, etc) era muy complicado de hacer correctamente, por lo menos en nuestro caso.

Ahora Google ha sacado un nuevo generador de sitemaps que se basa en los logs del servidor, otro método que posiblemente funcione mejor. Lo voy a probar a ver que tal va.

¿Alguien sabe de algún generador de sitemaps online que te deje crear uno de millones de URLs?. Creo que no lo hay pero si alguien conoce alguno le agradecería que lo mencionara a ver si me quito un problema de encima jeje.


 


Carloshace Hace más de 11 años y 251 días


Mira que intenté veces hacer un sitemap de un sitio gigantesco con Xenu, pero siempre se acaba bloqueando a partir de las 100.000 paginas creo recordar.

El nuevo generador no es mala idea, pero no acabo de confiar en que funcione bien la verdad.

Edgar Granadoshace Hace más de 11 años y 251 días

El limite de urls por sitemap de Google es de 50.000 urls, con lo que si tienes 1 millón deberás de crear un index de sitemap que apunte hacia los X sitempas con 50.000 urls cada una.

Raquelhace Hace más de 11 años y 251 días

no le hay...lo busqué pero no lo encontré ...así que no le hay... Hoy nos hemos puesto de acuerdo en el post??? saludos Lino :)

SrLanskyhace Hace más de 11 años y 250 días

Saludos, hombre del futuro... En serio, corrige lo de la fecha.

Errioxahace Hace más de 11 años y 250 días

@SrLansky jaja tienés razón!



Lea otros artículos de Google Search Console

Últimos posts

Últimos comentarios


Lino

@pacorapidohace así es, este experimento fue hace 10 años... y sí, he comprobado lo mismo que tú, hace falta estar la palabra en la url
Post: Links de imagen y texto, como los trata Google

pacorapido

Hola @Errioxa todo esto ha cambiado por que creo que tiene que ver que la pagina destino no tiene en su contenido las palabras inventadas,
Post: Links de imagen y texto, como los trata Google

FunnelPunk

Complementando la respuesta (y aprovechando para comprobar mi "avisador" por Twitter), por si Google no pudiese acceder al robots.txt y no s
Post: Errores críticos originados por el robots.txt

Lino

Hola Miriam, crea un robots.txt vacío para probar, también podrías añadir uno básico con las dos siguientes líneas User-agent: * Allo
Post: Errores críticos originados por el robots.txt

Miriam

Buenas Lino, No sé si me podrás echar una mano, estoy intentando comprobar porque Google no puede acceder a mi robots.txt, incluso he
Post: Errores críticos originados por el robots.txt

Luis

Hola amigo, me gustaría saber si mi web www.tuguiapara.com puede recibir backlinks, gracias.
Post: Links desde la misma Ip

Lino

Hola @anna , creo que Fede Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

anna

donde se pone el php i jv para wordpress?
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

Anna


Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

Lino

@India eso es debido a que si no solicitas la dimensión de página siempre hace los cálculos por propiedad, que solo tiene en cuenta el pr
Post: Datos incoherentes y cálculo de la posición media en Search Console