¿Cómo trata Google el meta noindex? -- Round 3

Publicado por Lino Uruñuela 16 de marzo de 2013 (2013-03-16)

Publicado el 16 de marzo del 2013 by Lino Uruñuela

Hoy voy a tratar de enterder cómo funciona Google con el meta noindex. Según Google este meta noindex es tratado de la siguiente manera

Si Google detecta una metaetiqueta "noindex" en una página, elimina la página por completo de los resultados de búsqueda, incluso en el caso de que otras páginas enlacen con ella. Sin embargo, otros motores de búsqueda pueden interpretar esta directiva de forma distinta. Como consecuencia, es posible que todavía aparezca un enlace en sus resultados de búsqueda.

Según las palabras de Google esta url de este artículo nunca debería aparecer en sus serps, por muchos links que esta URL reciba...

Esto es lo lógico, pero Sergio Simarro comentó un caso en el que tenía duda. Pero en su caso también usa el robots.txt para restringir el acceso a Google a todo el site porque es nuevo y aún no estará terminado y no quiere que lo indexe.

Se ha dado cuenta de que si hace un site:sudominio.com sale la home sin descripción y nada más, pero si le da a "Mostrar resultados omitidos" le salen todas las URLs.

Creo que este problema viene de que Google sigue unos pasos para saber si tiene permiso o no para ver una URL y si tiene permiso que tipo de permiso. Google primero mira el robots.txt que lo que hace es impedir el acceso al bot de Google al conentenido de cualquier ulr que esté en él y luego si tiene acceso, y sólo si no se lo restringe el robots.txt va cargando la url. Este es el paso en el que se dará cuenta de que tiene un meta noindex y entonces no mostrará los resultados en sus serps. Pero si restringimos también por robots.txt como en su caso este tiene "preferencia" y por lo tanto Google nunca llegará a intentar cargar esa URL y por lo tanto no se dará cuenta de ese meta. Con esto ya tengo otro interesante experimento a realizar, gracias Sergio

Ya hice algún experimento para ver cómo funcionaba el meta noindex, pero fue hace bastante tiempo y los resultados no han sido del todo relevantes. Recordemos aquel experimento

Desde una url con noindex escribíamos 4 palabras inventadas, además estas palabras eran links ya que en principio quería comprobar cómo trataba estos dos metas a la vez, algo muy común en muchos sites.
Si buscamos la primera KW, sale en las serps el dominio al que enlazamos con esa KW desde la url con noindex (cuenta el link que hay dentro de una url con meta noindex,follow
No ocurre lo mismo para las otras KW, por las que no obtenemos ningún resultado
Si buscamos con el comando site:mecagoenlos.com no parece que indexe esa url

También otra prueba parece indicar que no lo indexa, pero para asegurarnos vamos a volver a probar.

Nos inventamos una palabra, y veremos si la indexa. no será link ni nada, y la anotaré un par de veces. Por ejemplo ploalskoe, es nuestra keyword. La palabra ploalskoe hoy en día no arroja ningún resultado en las serps de Google. A ver qué ocurre en unos días.

Yo creo que no indexará esta URL ni ninguna KW que haya en ella, pero por si acaso vamos a probar, así que ya sabemos, nuestra palabrita es ploalskoe. ¿LLegará Google a indexarla?

Y como estamos de rebajas vamos a hacer dos tests en uno, voy a invetar otra KW y esta vez la pondré un link a otro site. Si Google consigue relacionar esta kw, ijanksepor, con la página a la cual enlaza será que sí que rastrea el contenido de la URL aunque lleve noindex, supongo que lo rastreará porque este meta no indica que no la rastree, sino que no la indexe y muestre en los resultados de Google, pero no dice nada de no rastrearla, así que lo hará verá el link y asociará esa KW con la web a la que enlaza... o eso creo!! todo se verá :)

Comentarios

Todavía no hay comentarios publicados.

Lee otros artículos

Diferencias entre url indexada y url accesible

Publicado el 18 de marzo del 2019 por Lino Uruñuela Siempre ha habido debates sobre cómo indexar urls en Google, ¿cuántas urls tiene Google indexadas de mi web ? ¿cuántas urls crawleadas tiene mi site? ¿es mejor usar el robots.txt o es mejor usar el meta noindex para no indexar determinadas urls?.... el debate continu…

18 de marzo de 2019

Seguir leyendo

Resultados del experimento con meta noindex

Publicado el 24 de marzo del 2013 El otro día hicimos un experimento para ver cómo se compartaba Google ante una url con el meta noindex . Los objetivos eran dos: Saber si Google accede a esa URL Saber si Google indexa y almacena el contenido de esa URL Saber si Google rastrea los enlacecs que hay en ella (este test y…

24 de marzo de 2013

Seguir leyendo

¿Cómo valora google una url con meta noindex y canonical?

Publicado el 27 de julio del 2012 Ya era hora! después de no sé cuánto tiempo vuelvo a escribir un post! Espero poder cumplir mi promesa de principios de año de escribir dos por semana, creo que ya me he cargado las pilas otra vez. Esta vez voy a hacer un test un poco irrelevante pero que últimamente me han preguntado…

27 de julio de 2012

Seguir leyendo

¿Contará Google el texto de los enlaces en páginas con noindex/follow?

Publicao el 22 de agosto del 2010 El otro día discutíamos en twitter José B. Moreno , Carlos Redondo , Javier Ortiz , Aina Lluna y yo sobre cuando usar la meta canonical y si sería mejor usar el meta noindex/follow para contenidos que a Google le pudiese parecer duplicados, como por ejemplo distintos tipos de listados…

Seguir leyendo

Google se salta el noindex nofollow

Publicado el 28 de noviembre del 2008 Google está haciendo caso omiso a la etiqueta < meta name = "robots" content = "noindex,nofollow" / > Tengo páginas que tienen esa etiqueta pero sí las está mostrando en caché, o sea, que sí las está indexando. Esto en mi caso particular me podría traer muchos problemas ya q…

28 de noviembre de 2008

Seguir leyendo