Decir a Google cuando no debe de pasar

Publicado el 26 de enero del 2010

Una de las cosas que no sabía cómo realizar es decir a Google cuando debe y cuando no debe pasar. Ayer gracias al test que han puesto (supongo que para motivar a los webmaster expertos a participar en el foro para liberarles trabajo, normal) hay una pregunta que me hizo dudar mucho. Bueno más que una hubo un par que me hicieron pensar.


29. Tu servidor dispone de un ancho de banda limitado y te gustaría que Google rastree tu sitio durante la noche. ¿Qué deberías hacer?
  • a) Enviar un correo electrónico a info@google.com
  • b) Añadir "Allow: 11pm-7am" a tu archivo robots.txt
  • c) Hacer que tu servidor responda con un código de estado HTTP 503 para todos los usuarios cuando no esté disponible
  • d) Cambiar dinámicamente el robots.txt para bloquear el rastreo durante el día
Dudé en si abrían actualizado el robots.txt para adoptar esta medida y así poder decir a Google cuando pasar. Pero si leemos la última, tenemos la solución, o eso creo.

Si queremos que Google no pase por nuestra página en una hora determinada del día porque por ejemplo somos una web con los picos de usuarios muy frecuentes a la misma hora y si entra a esa hora Google a rastrear puede poner en peligro el servidor, debemos modificar el robots.txt cuando no queramos que entre.

Parece que no pasa nada si impides el acceso todos los días a Google a una cierta hora en tu web, siempre que no sea demasiado supongo.

Así que haré una prueba con este post, a ver si pasa algo por impedir el paso a Google por medio de robots.txt que variará de 12 de la noche a 3 de la mañana, 3 horas al día. A ver si todo sigue igual.


 


jacasuhace Hace más de 10 años y 238 días

Muy interesante ver que pasa, aunque tal y como se estan poniendo las cosas, a veces hay que dejarlo pasar y casi hacerle una mamada para que indexe rápido.


Un saludo

Errioxahace Hace más de 10 años y 238 días

@jacasu la verdad es que yo sólo he trabajado un caso como este, en el que es necesario impedir el paso en unas horas debido al pico de usuarios que tiene justo en ese momento.



Pero si no, lo mejor es cambiar de server ;)

Isaachace Hace más de 10 años y 236 días

También puede ir bien para cambiar el servidor

Errioxahace Hace más de 10 años y 233 días

Pues igual sí, pero depende de cómo lo hagas. Si ya tienes todo preparado y bien, no haría falta, no?



Lea otros artículos de Links y experimentos

Últimos posts

Últimos comentarios


Lino

@pacorapidohace así es, este experimento fue hace 10 años... y sí, he comprobado lo mismo que tú, hace falta estar la palabra en la url
Post: Links de imagen y texto, como los trata Google

pacorapido

Hola @Errioxa todo esto ha cambiado por que creo que tiene que ver que la pagina destino no tiene en su contenido las palabras inventadas,
Post: Links de imagen y texto, como los trata Google

FunnelPunk

Complementando la respuesta (y aprovechando para comprobar mi "avisador" por Twitter), por si Google no pudiese acceder al robots.txt y no s
Post: Errores críticos originados por el robots.txt

Lino

Hola Miriam, crea un robots.txt vacío para probar, también podrías añadir uno básico con las dos siguientes líneas User-agent: * Allo
Post: Errores críticos originados por el robots.txt

Miriam

Buenas Lino, No sé si me podrás echar una mano, estoy intentando comprobar porque Google no puede acceder a mi robots.txt, incluso he
Post: Errores críticos originados por el robots.txt

Luis

Hola amigo, me gustaría saber si mi web www.tuguiapara.com puede recibir backlinks, gracias.
Post: Links desde la misma Ip

Lino

Hola @anna , creo que Fede Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

anna

donde se pone el php i jv para wordpress?
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

Anna


Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

Lino

@India eso es debido a que si no solicitas la dimensión de página siempre hace los cálculos por propiedad, que solo tiene en cuenta el pr
Post: Datos incoherentes y cálculo de la posición media en Search Console