no ☞ 📈 Meta Robots Noindex _ â–‚ â–ƒ â–… â–† â–ˆ

Meta Robots Noindex

Publicado el 29 de Noviembre del 2017 por Lino Uruñuela

Índice

 

¿Qué es el meta noindex?

La metaetiqueta "robots" es una directiva que sirve para controlar cómo se debe indexar una url en concreto y cómo debe ser mostrada en los resultados de búsqueda de los buscadores.

¿Cómo se crea?

Meta noindex para todos los buscadores

Se puede definir para todos los bots o rastreadores, con name="robots" por ejemplo;
<meta name="robots" content="noindex" />

Esto le dirá a todos los bots de buscadores y otros rastreadores que está url no debe ser mostrada en los resultados de búsqueda en los buscadores.

Meta noindex solo para Google

También se puede definir para un bot en concreto, poniendo en el atributo "name" el nombre de ese bot
<meta name="googlebot" content="noindex" />
Esto le dirá a Google (pero no a otros buscadores) que está url no debe ser mostrada en los resultados de búsqueda de Google.

Posibles valores para el meta robots

En la siguiente tabla verás todas las directivas que Google reconoce para el meta robots,.

Directiva
Significado
 all No hay restricciones de indexación ni de presentación de contenido. Nota: Esta directiva es el valor predeterminado y no tiene ningún efecto si se muestra de forma explícita.
 noindex No se muestra ni esta página ni un enlace "en caché" en los resultados de búsqueda.
 nofollow No se siguen los enlaces de esta página.
 none Equivalente a noindex, nofollow.
 noarchive No se muestra ningún enlace "en caché" en los resultados de búsqueda.
 nosnippet No se muestra ningún fragmento en los resultados de búsqueda de esta página.
 noodp No se utilizan metadatos del proyecto de Open Directory para los títulos o los fragmentos que se muestran en esta página.
 notranslate No se ofrece una traducción de esta página en los resultados de búsqueda.
 noimageindex No se indexan las imágenes de esta página.
 unavailable_after No se muestra esta página en los resultados de búsqueda después de la fecha y la hora especificadas. La fecha y la hora deben especificarse en el formato RFC 850.

Hoy vamos a ver uno de estos valores, el noindex, ya que posiblmente junto al valor de follow y nofollow son los más usados en SEO.

Meta robots Noinidex

El meta robots con valor NoIndex es uno de los más usados por los SEOs. Se suele usar en estos casos

  • Cuándo tenemos contenido de poco valor (Thin content)
    Por ejemplo es habitual verlo en filtros de poco valor, que no generan apenas diferenciación, o en urls con contenido generado por los usuarios y que se cree que es de baja calidad.

  • Cuándo ese contenido es duplicado
    Aunque en este segundo caso se suele usar meta canonical, hay casos en los que no se sabe la url homóloga donde apuntaría ese canonical y para evitar una posible baja valoración del contenido de esa urls por parte de Google se usa el meta robots noindex.


¿Qué hace y qué no hace el meta noindex?

Una de las crencias más difundidas sobre el meta noindex es que al ponerlo Google accederá menos o no accederá a urls que contengan el meta robots noindex, y que por ello mejorará el crawl budget o frecuencia de rastreo, pero cómo vamos a ver a continuación no ocurre esto.

Hace poco tiempo, desupués de una subida a producción de un site, se subió sin querer la home del site con un meta noindex, vamos a tratar de analizar este caso e intentar sacar algunas conclusiones.

  • El meta robots noindex sí impide que la url se muestre en los resultados de búsqueda
    El tener este meta impedirá que salga en las serps de Google, lo que es lo mismo impedirá que tenga tráfico orgánico desde resultados normales, es decir, sin contar resultados de imágenes por ejemplo.

    Cómo vemos en la siguiente gráfica el tráfico orgánico proveniente de Google descendió casi a cero.


    meta noindex

    El tráfico que aun llegaba podría ser por búsquedad de imágenes, ya que el meta noindex no indica que las imágenes que haya en esa url no sean indexadas.

    Posiblemente las otras dos crestas, anterior y posterior al periodo indicado por las flechas, también hubiese ocurrido el subir a producción la home con el meta noindex, pero no puedo asegurarlo.

  • El meta robots noindex NO impide el acceso de Google a estasurls
    La siguiente gráfica son los accesos diarios de Googlebot a la url de la home, cómo vemos, durante ese perioro de tiempo Google siguió accediendo a esa url, y con una frecuancia similar a cuándo no lo tenía.


    Meta noindex crawl budget rastreo

    Por lo que podríamos decir (al menos en este caso) que el meta noindex no impide el acceso de Google a estas urls, y tampoco se aprecia que reduzca su frecuencia de acceso, por lo que no nos vale para mejorar nuestro crawl budget.

Casos de uso del meta robot="noindex"

Viendo cómo actua Google, ¿dónde y cuándo debemos usar el meta noindex?. Siempre digo que los metas como el noindex o el meta canonical son parches que usamos para solucionar algún problema detectado o un posible problema, pero realmente en una web ideal no deberíamos tener que usarlos.

Dicho esto, muchas veces no nos queda más remedio que usar estos parches metas para minimizar un error de arquitectura de la información o arquitectura web, y debemos enviar señales a Google para indicarle determinadas cosas como que un contenido es igual a otro.

¿Cuándo usar el meta noindex?

En el caso del meta noindex los casos para los que yo lo usaría serían los siguientes;

  • No quiero que una url sea mostrada en Google.
    Podría ser por cuestiones de derechos de autor, o por privacidad de usuarios o por otras cuestiones.
    Para esto es esencialmente este meta, para indicar a Google y otros buscadores que no muestren esta url y su contenido en los resultados del buscador.

  • Contenido de baja calidad que no queremos que Google indexe y valore.
    Hemos visto antes que realmente Google accederá, y posiblementer evalue el contenido que en la url encuentre, por lo que no es una solución optima ya que no sabemos si Google lo evaluará o no, y en el caso de evaluarlo no sabemos si tener el meta noindex en contenido que sea thin content evitará o no el contagio al resto del dominio. Pero a veces no tenemos más alternativas que realizar esto.

    Por ejemplo si tenenmos un site en el que determinado contenido es creado por los usuarios, y hay algún contenido de usuarios que sí proporciona valor (por ejemplo si contiene más de 100 palabras) y otro que no (por ejemplo si NO contiene más de 100 palabras) .

    Si tenemos este escenario posiblemente no podremos crear una regla por robots.txt para impedir el acceso a estas urls, ya queremos que acceda o no según determinadas variables entorno al contenido introducido por el usuario y no en base a un patrón de urls.

    En este caso el poner noindex en contenido calificado de baja calidad, que conenga menos de 100 palabras, en muchas urls podría salvarnos de que Googe nos valore nuestro site como de baja calidad al tener muchas urls de baja calidad, pero de esto no estamos seguros, aunque por si acaso, ¿por qué no ponerlo?.
 

¿Cuándo NO usar el meta noindex?

Hay casos en los que no creo que se deba usar este meta pero que veo a menudo utilizar a muchos SEOs.

  • Contenido parcial o duplicado de otra url
    Para este caso tendríamos el meta canonical o una redirección 301. Si la causa es la duplicidad del contenido el noindex no será la solución idónea ya que lo único que parece hacer es impedir salir en los resultados orgánicos del buscador, y no tenemos certeza que valga para evitar que Google califique como thin content estas urls.

  • URLsde baja calidad que no queremos indexar
    Pongamos por ejemplo que tenemos diferentes filtros para un listado, unos filtros son potenciales y diferenciales y los quermos indexar pero otros no lo son y no queremos indexarlos.

    Si los filtros que no queremos indexar tienen un patrón en la url creo que es mucho mejor impedir el acceso a los buscadores mediante el robots.txt que usar el meta noindex por las siguientes razones

    • Nos aseguramos que Google no accede al contenido, por lo que mejora la frecuencia de rastreo del resto de urls que sí creemos potenciales y sí queremos que Google las rastree.
    • Nos aseguramos que Google no valora el contenido de esa url, y así evitar que Google califique esas urls, y puede que otras también por contagio, como de thin content.

  • Si queremos evitar que no se indexen las imágenes que hay en estas urls
    El meta robots name="noindex" no impide que Google acceda, indexe y muestre las imágenes en sus resultados. El meta noindex impide que se muestre la url donde aparece el meta noindex, pero no sus imágenes.

Conclusiones

Hemos visto algunos aspectos que yo creo importantes sobre el meta noindex, y de los cuales saco estas conclusiones

  1. El meta noindex impide que la url salga en los resultados de los buscadores.
    Es su cometido, para esto se creó esta directiva, y como directiva los buscadores (o la mayoría de ellos) lo cumplen.

  2. El meta noindex no impide el acceso a esa url por parte de Google ni otros buscadores.
    Google y otros buscadores, accederán a urls que contengan el noindex.

  3. El meta noindex no varia la frecuencia de rastreo para las urls que lo llevan.
    Como hemos visto, en este caso, Google no varia su frecuencia de rastreo hacia esta url.

    Se podría pensar que quizás con esta url (la url de la home) no varie la frecuencia de rastreo porque esta url es la home y recibe una gran cantidad de enalces tanto internos como externnos.

    Podria ser, pero eso querría decir que la frecuencia con que Google visita una url no depende del meta noindex, o al menos no depende solo del meta noindex, sino de otros factores.

    Yo me atrevería a decir que depende del número de enlaces entrantes tanto internos como externos y la autoridad de estos.

  4. El meta noindex no impide que se muestren las imágenes en los resultados

 

Posiblemente haya más casos creais que se debería usar el noindex, y también haya más casos para los que no usariais el meta noindex, comantar cuáles son para vosotros esos otros casos e iremos actualizando a lista sobre cuándo usar y cuándo no usar el meta noindex.

 



Space Needle
Publicado el 24 de marzo del 2013 El otro día hicimos un experimento para ver cómo se compartaba Google ante una url con el meta noindex.  Los objetivos eran dos: Saber si Google accede a esa URL Saber si Google indexa y almacena el contenido de esa URL Saber si G

Seguir leyendo

Space Needle
Publicado el 16 de marzo del 2013 by Lino Uruñuela Hoy voy a tratar de enterder cómo funciona Google con el meta noindex. Según Google este meta noindex es tratado de la siguiente manera Si Google detecta una metaetiqueta "noindex" en una p&a

Seguir leyendo

  • 0000-00-00 00:00:00

Publicado el 27 de julio del 2012 Ya era hora! después de no sé cuánto tiempo vuelvo a escribir un post! Espero poder cumplir mi promesa de principios de año de escribir dos por semana, creo que ya me he cargado las pilas otra vez. Esta vez voy a hacer un test un po

Seguir leyendo

Space Needle
Publicao el 22 de agosto del 2010 El otro día discutíamos en twitter José B. Moreno, Carlos Redondo, Javier Ortiz, Aina Lluna y yo sobre cuando usar la meta canonical y si sería mejor usar el meta noindex/follow para contenidos que a Go

Seguir leyendo

  • 0000-00-00 00:00:00

Publicado el 28 de noviembre del 2008 Google está haciendo caso omiso a la etiqueta <meta name="robots" content="noindex,nofollow" /> Tengo páginas que tienen esa etiqueta pero sí las está mostrando en caché, o sea, que sí la

Seguir leyendo


Posts anteriores en On Page


Space Needle
Publicado el viernes 26 de febrero del 2016 por Lino Uruñuela El otro día, mi socio Natzir me pasó el tweet de John Muller donde indicaba que la directiva Disallow del robots.txt debía comenzar siempre con un slash "/". Esto ha provocado cierto r

Seguir leyendo
Space Needle
Publicado el 26 de enero del 2016, por Lino Uruñuela Desde hace tiempo Google va evangelizando sobre el uso de https en internet, para ello lo hace de la manera más efectiva que conoce, EL MIEDO!. Un gran porcentaje de negocios online a día de hoy son Googledependient

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado por Lino Uruñuela (Errioxa) el 16 de abril del 2014 Ha habido grandes debates en el mundo SEO sobre cómo trata Google los errores 404 y 410 del servidor. Puede parecer que "da un poco igual" el cómo trate Google los errores 404 y 410 y de si hay

Seguir leyendo
Space Needle
Publicado el 19 de marzo del 2014 por Lino Uruñuela (Errioxa) Cuando manejamos un site muy grande en el que tenemos cientos o miles de categorías para clasificar el contenido, como podría ser un e-commerce, puede que haya categorías muy distintas entre si. Por ejemp

Seguir leyendo
Space Needle
Publicado el 14 de febrero del 2014 porLino Uruñuela (Errioxa) Hoy leo en SEOby the Sea que Google incluye en una de sus patentes la velocidad de una página web como factor de relevancia en sus resultados. Esto no es nuevo, desde hace mucho se viene diciendo, casi casi lo mismo q

Seguir leyendo
Space Needle
Publicado el 10 de abril del 2013, by Lino Uruñuela Ayer Google publicó los 5 errores más comunes al usar el meta rel=canonical, de ellos el que más me llama la atención es  "canonical en la primera página de una serie paginada" donde nos d

Seguir leyendo
Space Needle
Publicado el 4 de julio del 2011 Desde la salida del oso de Google cada vez hay más gente que cree que Google ahora le da valor a determinadas experiencias de usuarios en una página web, como puede ser la tasa de rebote o la estancia del usuario en la web. Igual podemos demostrar

Seguir leyendo
  • 0000-00-00 00:00:00

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado el 5 de febrero del 2010 Hoy quería explicar mi opinión sobre distintas formas de cómo podemos evitar el contenido duplicado, en algunos casos. Pongo un cuadro con algunos métodos que podemos utilizar para solucionar nuestros problemas.   

Seguir leyendo
  • 0000-00-00 00:00:00

Ya lo dijo Telendro en blog como era el Seo Hotlinking así que me puse a probarlo, y fenomenal. La prueba la hice en la página sobre Fernando Alonso, que es dónde hago muchos "experimentos" ya que no creo que merezca dedicarla demasiado esfuerzo, igual me equivoco.

Seguir leyendo
  • 0000-00-00 00:00:00

Aunque yo sea republicano tengo que decir que el contenido es mi rey. Y es que el contenido de nuestra página web es una de las cosas más importantes a la hora de posicionarla en los buscadores. Pero no vale un contenido cualquiera, deberá de ser un contenido original y que le de a

Seguir leyendo
  • 0000-00-00 00:00:00

En los próximos días intentaré exponer aquí cómo se debe hacer una web para que esté al máximo optimizada para posicionarse en los buscadores, desde el diseño HTML hasta cómo deben ser redactados los contenidos. Lo primero que hay que tener muy claro al comenzar un proyecto web, es saber q

Seguir leyendo

Últimos posts

Últimos comentarios


Lino Urunuela

probando https
Post: Consultor SEO en Donosti

Lino Uruñuela

ll
Post: ¿Cómo ejecuta, interpreta e indexa Google el contenido cargado mediante javascript?

Javier

Bueenas Lino! Gracias por tu respuesta! Efectivamente, cogiendo texto de una página hecha con javascript y poniéndolo en Google entre comi
Post: Meta Robots Noindex

Lino Uruñuela

Hola @Javier repondiendo a tu pregunta "¿significa eso que google no está viendo el contenido en texto y no lo posicionará?" con el mismo
Post: Meta Robots Noindex

Lino Uruñuela

@Alex R , lo primero graciias por a ti por participar :) Sobre tu prebunta ¿Dentro de un mismo artículo o entrada podemos hacer que no s
Post: Meta Robots Noindex

Javier

Buenas Lino Mecagoenlos! (vaya apellido tienes...) Tu artículo me ha dado mucho que pensar... acaban de hacerme una web en una agencia y
Post: Meta Robots Noindex

Alex R

Hola Lino! Te leo desde hace algún tiempo (genial el cambio de look) y casualmente he venido aquí con una duda sobre indexación. Lo
Post: Meta Robots Noindex

Lino Uruñuela

@javier Lorente Aupa Javi, en algún proyecto en el que he aplicado el noindex y que podía analizar los accesos del bot (tenina cierto p
Post: Meta Robots Noindex

Javier Lorente

Kaixo Lino! Habría que ver si baja la frecuencia de rastreo en otras urls que no fuesen la home, muy difícil de medir por cierto. Po
Post: Meta Robots Noindex

pSeo

va como un tiro con el onready!!!
Post: Cómo cargar css y js y no bloquear la carga de contenido

Contacta

Lánzate y pregunta!

Nos gustan los robots, pero no tanto
7 + 3