¿Cómo trata Google el meta noindex? -- Round 3

Publicado el 16 de marzo del 2013 by

Hoy voy a tratar de enterder cómo funciona Google con el meta noindex. Según Google este meta noindex es tratado de la siguiente manera

Si Google detecta una metaetiqueta "noindex" en una página, elimina la página por completo de los resultados de búsqueda, incluso en el caso de que otras páginas enlacen con ella. Sin embargo, otros motores de búsqueda pueden interpretar esta directiva de forma distinta. Como consecuencia, es posible que todavía aparezca un enlace en sus resultados de búsqueda.

Según las palabras de Google esta url de este artículo nunca debería aparecer en sus serps, por muchos links que esta URL reciba...

Esto es lo lógico, pero Sergio Simarro comentó un caso en el que tenía duda. Pero en su caso también usa el robots.txt para restringir el acceso a Google a todo el site porque es nuevo y aún no estará terminado y no quiere que lo indexe.

Se ha dado cuenta de que si hace un site:sudominio.com sale la home sin descripción y nada más, pero si le da a "Mostrar resultados omitidos" le salen todas las URLs.

Creo que este problema viene de que Google sigue unos pasos para saber si tiene permiso o no para ver una URL y si tiene permiso que tipo de permiso. Google primero mira el robots.txt que lo que hace es impedir el acceso al bot de Google al conentenido de cualquier ulr que esté en él y luego si tiene acceso, y sólo si no se lo restringe el robots.txt va cargando la url. Este es el paso en el que se dará cuenta de que tiene un meta noindex y entonces no mostrará los resultados en sus serps. Pero si restringimos también por robots.txt como en su caso este tiene "preferencia" y por lo tanto Google nunca llegará a intentar cargar esa URL y por lo tanto no se dará cuenta de ese meta. Con esto ya tengo otro interesante experimento a realizar, gracias Sergio Smile

Ya hice algún experimento para ver cómo funcionaba el meta noindex, pero fue hace bastante tiempo y los resultados no han sido del todo relevantes. Recordemos aquel experimento

  • Desde una url con noindex escribíamos 4 palabras inventadas, además estas palabras eran links ya que en principio quería comprobar cómo trataba estos dos metas a la vez, algo muy común en muchos sites.

  • Si buscamos la primera KW, sale en las serps el dominio al que enlazamos con esa KW desde la url con noindex (cuenta el link que hay dentro de una url con meta noindex,follow 

  • No ocurre lo mismo para las otras KW, por las que no obtenemos ningún resultado

  • Si buscamos con el comando site:mecagoenlos.com no parece que indexe esa url 



También otra prueba parece indicar que no lo indexa, pero para asegurarnos vamos a volver a probar.

Nos inventamos una palabra, y veremos si la indexa. no será link ni nada, y la anotaré un par de veces. Por ejemplo ploalskoe, es nuestra keyword. La palabra ploalskoe hoy en día no arroja ningún resultado en las serps de Google. A ver qué ocurre en unos días.

Yo creo que no indexará esta URL ni ninguna KW que haya en ella, pero por si acaso vamos a probar, así que ya sabemos, nuestra palabrita es ploalskoe. ¿LLegará Google a indexarla?

Y como estamos de rebajas vamos a hacer dos tests en uno, voy a invetar otra KW y esta vez la pondré un link a otro site. Si Google consigue relacionar esta kw, ijanksepor, con la página a la cual enlaza será que sí que rastrea el contenido de la URL aunque lleve noindex, supongo que lo rastreará porque este meta no indica que no la rastree, sino que no la indexe y muestre en los resultados de Google, pero no dice nada de no rastrearla, así que lo hará verá el link y asociará esa KW con la web a la que enlaza... o eso creo!! todo se verá :)

 



Contacta

Lánzate y pregunta!


He leído y acepto la política de privacidad

Mecagoenlos.com te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por Lino Uruñuela. como responsable de esta web.

La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para enviar un correo con los datos que introduzcas, sin guardarse en ninguna base de datos.

Legitimación: Al marcar la casilla de aceptación, estás dando tu legítimo consentimiento para que tus datos sean tratados conforme a las finalidades de este formulario descritas en la política de privacidad.

Como usuario e interesado te informamos que los datos que nos facilitas estarán ubicados en los servidores de Linode.com (proveedor de hosting de Mecagoenlos.com) cumpliendo la ley de protección de datos. Ver política de privacidad de Linode.com.

Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en info@mecagoenlos.com, así como el derecho a presentar una reclamación ante una autoridad de control. Más información aquí.

Últimos posts

Últimos comentarios


@funnelpunk

Última prueba de menciones en comentarios del blog.. este para @errioxa desde otra cuenta
Post: Google podria no querer el HTML de una URL

German

Hola amigo, lo cierto es que no me he enterado pajolera idea de lo que cuentas, aunque te felicito por aparecer en el Discovery de Google. M
Post: Google podria no querer el HTML de una URL

Lino

Una manera súper sencilla para comprobarlo: 1- Una URL, mirar un log de Googlrbot de esa UR cuando da 200 2- Comparar con otro log
Post: Google podria no querer el HTML de una URL

Jose Antonio Gil

En primer lugar agradecerte tus palabras, he sido alumno tuyo este año en el Máster de Webpositer en Alicante por lo que algo de culpa ten
Post: Google podria no querer el HTML de una URL

Lino

Uppsss cierto, la culpa es de tantas elecciones consecutiva... hacen remarketing en mi cerebro
Post: Google podria no querer el HTML de una URL

José

Buenas Lino! Sólo comentar que el apellido de Gastón es RIERA (no Rivera). Saludos y gracias por compartir!
Post: Google podria no querer el HTML de una URL

Fran Javietr

Hola Lino como podemos añadir a este código la identificación de la ip del bot, como sabes hay falsos bots y una forma de saber si son l
Post: Monotorizar GoogleBot con Google Analytics

Javier

Buenas Lino, ¿Alguna novedad sobre cómo considera Google los links en PDFs? Se me ocurre que, siguiendo con este experimento, se po
Post: Link building con PDF

Francisco

Flaco. Por lo general, no dejo comentarios pero, en tu caso, voy a hacer una excepción pues, sencillamente... ¡sos un genio!, Gracias.
Post: Cómo cargar css y js y no bloquear la carga de contenido

Juan Francisco Gancia

Excelente artículo, gracias! Te encuentro de casualidad por un post de hace 10 años.
Post: Diferencias entre url indexada y url accesible