Generador de sitemaps de Google

Publicado el 14 de enero del 2009

Una de las cosas que más dolores de cabeza nos pueden dar las páginas web muy muy grandes es la de creación de sitemaps generales. En páginas web normales es relativamente sencillo crear un sitemaps mediante programación php + MySql pero cuando detrás de un sitio hay muchos servidores distribuidos, millones de artículos, miles de artículos diarios es muy difícil hacer un sitemaps de toda la web cada día.

Hasta ahora se podía usar un Generador de Sitemaps de Google, que es un programa en phyton que se instala en el servidor y te metía TODO lo que encontrara en las carpetas de dicho servidor en el sitemap.

Aunque tenía un archivo de configuración donde le dabas los filtos que querías para que no lo añadiera al sitemaps (gif, jppg, carpetas que no querías que fuesen publicadas, etc) era muy complicado de hacer correctamente, por lo menos en nuestro caso.

Ahora Google ha sacado un nuevo generador de sitemaps que se basa en los logs del servidor, otro método que posiblemente funcione mejor. Lo voy a probar a ver que tal va.

¿Alguien sabe de algún generador de sitemaps online que te deje crear uno de millones de URLs?. Creo que no lo hay pero si alguien conoce alguno le agradecería que lo mencionara a ver si me quito un problema de encima jeje.


 


Carlos (@)hace Hace más de 16 años y 130 días


Mira que intenté veces hacer un sitemap de un sitio gigantesco con Xenu, pero siempre se acaba bloqueando a partir de las 100.000 paginas creo recordar.

El nuevo generador no es mala idea, pero no acabo de confiar en que funcione bien la verdad.

Edgar Granados (@)hace Hace más de 16 años y 130 días

El limite de urls por sitemap de Google es de 50.000 urls, con lo que si tienes 1 millón deberás de crear un index de sitemap que apunte hacia los X sitempas con 50.000 urls cada una.

Raquel (@)hace Hace más de 16 años y 130 días

no le hay...lo busqué pero no lo encontré ...así que no le hay... Hoy nos hemos puesto de acuerdo en el post??? saludos Lino :)

SrLansky (@)hace Hace más de 16 años y 129 días

Saludos, hombre del futuro... En serio, corrige lo de la fecha.

Errioxa (@)hace Hace más de 16 años y 129 días

@SrLansky jaja tienés razón!



Lea otros artículos de Google Search Console

Últimos posts

Últimos comentarios


JeffreyGit

Post: Experimento para comprobar la teoría del primer enlace

propecia psychiatric side effects
Herpes, Alaskan Marine Red Algae, 127 p220 generic propecia uk
Post: Cómo ver las URLs renderizadas por Google en Google Analytics

Andreasibl

Post: Google spam report

Victorscy

Post: Experimento para comprobar la teoría del primer enlace

propecia brand name cost
buy propecia 5mg usa benzac ivermectin z pack Yes there are a number of options available, you can set your browser either to reject all coo
Post: Carga de imagenes usando lazy load - Resultado del experimento

JulianEmise
Get a massive 200% bonus on your first deposit and boost your starting balance up to $ 200. betwinner registration bonus, Betwinner splits y
Post: Experimento para comprobar la teoría del primer enlace

Lino
@spamloco a tí r hacerme ver que no soy al único que le importa :p A ver si nos vemos!
Post: ¿Cómo decide Google que URL debe rastrear?

Alejandro
Gracias Lino, siempre investigando un poco más allá.
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
3,2,1... Gracias a ti Pedro!! y sí, parece que los humanos somos expertos en haciendo ruido cuando intentamos que alguien nos escuche... :p
Post: ¿Cómo decide Google que URL debe rastrear?

Pedro
1,2...1,2... probando. Gracias por el artículo, verdaderamente interesante ver cómo no paramos de generar ruido :)
Post: ¿Cómo decide Google que URL debe rastrear?