Decir a Google cuando no debe de pasar

Publicado el 26 de enero del 2010

Una de las cosas que no sabía cómo realizar es decir a Google cuando debe y cuando no debe pasar. Ayer gracias al test que han puesto (supongo que para motivar a los webmaster expertos a participar en el foro para liberarles trabajo, normal) hay una pregunta que me hizo dudar mucho. Bueno más que una hubo un par que me hicieron pensar.


29. Tu servidor dispone de un ancho de banda limitado y te gustaría que Google rastree tu sitio durante la noche. ¿Qué deberías hacer?
  • a) Enviar un correo electrónico a info@google.com
  • b) Añadir "Allow: 11pm-7am" a tu archivo robots.txt
  • c) Hacer que tu servidor responda con un código de estado HTTP 503 para todos los usuarios cuando no esté disponible
  • d) Cambiar dinámicamente el robots.txt para bloquear el rastreo durante el día
Dudé en si abrían actualizado el robots.txt para adoptar esta medida y así poder decir a Google cuando pasar. Pero si leemos la última, tenemos la solución, o eso creo.

Si queremos que Google no pase por nuestra página en una hora determinada del día porque por ejemplo somos una web con los picos de usuarios muy frecuentes a la misma hora y si entra a esa hora Google a rastrear puede poner en peligro el servidor, debemos modificar el robots.txt cuando no queramos que entre.

Parece que no pasa nada si impides el acceso todos los días a Google a una cierta hora en tu web, siempre que no sea demasiado supongo.

Así que haré una prueba con este post, a ver si pasa algo por impedir el paso a Google por medio de robots.txt que variará de 12 de la noche a 3 de la mañana, 3 horas al día. A ver si todo sigue igual.


 


jacasuhace Hace más de 10 años y 66 días

Muy interesante ver que pasa, aunque tal y como se estan poniendo las cosas, a veces hay que dejarlo pasar y casi hacerle una mamada para que indexe rápido.


Un saludo

Errioxahace Hace más de 10 años y 66 días

@jacasu la verdad es que yo sólo he trabajado un caso como este, en el que es necesario impedir el paso en unas horas debido al pico de usuarios que tiene justo en ese momento.



Pero si no, lo mejor es cambiar de server ;)

Isaachace Hace más de 10 años y 64 días

También puede ir bien para cambiar el servidor

Errioxahace Hace más de 10 años y 61 días

Pues igual sí, pero depende de cómo lo hagas. Si ya tienes todo preparado y bien, no haría falta, no?



Lea otros artículos de Links y experimentos

Últimos posts

Últimos comentarios


Lino

@errioxa probando desde comentarios del site :)
Post: El valor de los logs para el SEO

Lino

@Santy Jordi y Sergio muchas gracias! Irá mejorando, pero poco a poco :)
Post: Informes y gráficas usando la API de Google Search Console

sergio

Bravo! Gracias por compartir.
Post: Informes y gráficas usando la API de Google Search Console

Santy

Gracias Lino, muy útil para el día a día
Post: Informes y gráficas usando la API de Google Search Console

Jordi

Buenas tardes Lino, Felicidades por la herramienta, me parece algo espectacular y rápido de utilizar. Espero con muchas ganas ver las nue
Post: Informes y gráficas usando la API de Google Search Console

Joan marc

Muchísimas gracias @Lino!! Para acabar, sabes si con Varnish tendríamos problemas? Entiendo que al no hacerse siempre consultas al servid
Post: Monitorizar GoogleBot con Google Analytics

Lino

@Joan marc sí!, pero has de configurar el server para que cualquier URL que de 301 sea tratada por una única url del site (como la url de
Post: Monitorizar GoogleBot con Google Analytics

Joan marc

Excelento post Lino! Has podido trackear los 301 y 302?
Post: Monitorizar GoogleBot con Google Analytics

German

Hola amigo, lo cierto es que no me he enterado pajolera idea de lo que cuentas, aunque te felicito por aparecer en el Discovery de Google. M
Post: Google podria no querer el HTML de una URL

Lino

Una manera súper sencilla para comprobarlo: 1- Una URL, mirar un log de Googlrbot de esa UR cuando da 200 2- Comparar con otro log
Post: Google podria no querer el HTML de una URL