Prueba con ficheros txt

Publicado el 10 de octubre del 2012, by Lino Uruñuela

Desde hace bastante tiempo tengo una duda sobre cómo valora Google los distintos tipos de documentos, HTML, PDF, Flash, txt.

Con los documentos PDF ya he realizado alguna prueba, no sacando nada concluyente en cuanto a que prefiere, sí sacamos en claro que los links en esos documentos cuentan. Pensando lógicamente, veo que en los resultados Google a veces muestra resultados de documentos PDF, cosa que no suele ocurrir con txt, por lo que creo que no los tiene muy bien valorados.




¿Para que probar si Google valora más un txt o un HTML?.

A priori supongo que preferirá un documento HTML, ya que al ser un formato de hipertexto es muy probable que tenga más cosas que aportar al usuario. Muchos de estos txt provienen de un archivo PDF, depende del tema que busques encontrarás este tipo de txt que proviene de pdf (como es el caso de universidades que no sé cómo lo hacen pero indexan el txt y no el PDF) y otros muchos txt que son listas de correo, datos del boe y otro sin fín de documentos olvidados por la mano de dios.


Vamos a buscar un documento de texto, ya que estamos, sigamos con la marihuana, por ejemplo de esta búsqueda (he añadido el -filetype:pdf sin darme cuenta de la inutilidad de ese parámetro ya que en el anterior le digo que sólo quiero TXT, pero por no cambiar la imagen de abajo, lo dejo así) como veís voy a coger el siguiente resultado para hacer esta prueba, os lo muestro con una imagen para no enlazarlo desde aquí y así no influír en el experimento.


documento a probar




Acciones realizadas
He copiado el documento y le he dado sólo unos saltos de línea.
El documento lo he publicado y lo podemos ver aquí, es el primer resultado, no lo quiero linkar desde aqiuí

Mi idea es que para la búsqueda del título se posicione el copiado antes que el original, en este caso la url de la web que linka al pdf, que es la que sale la primera, aunque realmente esa página no contiene la tesis :).

Si fuese así, para los que practican black hat SEO puede ser un filón, ya que documentos txt indexados hay de todos los temas, así que podría considerarse "contenido casi gratis", pero como siempre digo se corre un riesgo, así que yo no lo haría en una web que quieras que tenga futuro.




 




Lea otros artículos de Links y experimentos

Contacta

Lánzate y pregunta!


He leído y acepto la política de privacidad

Mecagoenlos.com te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por Lino Uruñuela. como responsable de esta web.

La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para enviar un correo con los datos que introduzcas, sin guardarse en ninguna base de datos.

Legitimación: Al marcar la casilla de aceptación, estás dando tu legítimo consentimiento para que tus datos sean tratados conforme a las finalidades de este formulario descritas en la política de privacidad.

Como usuario e interesado te informamos que los datos que nos facilitas estarán ubicados en los servidores de Linode.com (proveedor de hosting de Mecagoenlos.com) cumpliendo la ley de protección de datos. Ver política de privacidad de Linode.com.

Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en info@mecagoenlos.com, así como el derecho a presentar una reclamación ante una autoridad de control. Más información aquí.

Últimos posts

Últimos comentarios


Fran Javietr

Hola Lino como podemos añadir a este código la identificación de la ip del bot, como sabes hay falsos bots y una forma de saber si son l
Post: Monotorizar GoogleBot con Google Analytics

Javier

Buenas Lino, ¿Alguna novedad sobre cómo considera Google los links en PDFs? Se me ocurre que, siguiendo con este experimento, se po
Post: Link building con PDF

Francisco

Flaco. Por lo general, no dejo comentarios pero, en tu caso, voy a hacer una excepción pues, sencillamente... ¡sos un genio!, Gracias.
Post: Cómo cargar css y js y no bloquear la carga de contenido

Juan Francisco Gancia

Excelente artículo, gracias! Te encuentro de casualidad por un post de hace 10 años.
Post: Diferencias entre url indexada y url accesible

Lino Urnuela

@Emirodgar gracias! Pero parece que en tema de imágenes las pilla lo hagas cómo lo hagas parece, eso sí, siempre que no tengas un fall
Post: Indexar imágenes en Google usando Lazy Load

Emirodgar

Muy interesante el experimento. Yo estaba probando con los nuevos formatos webp y pero al final, como eran pocas imágenes y usaba Masonry,
Post: Indexar imágenes en Google usando Lazy Load

Lino Uruñuela

Completamente de acuerdo :) Pero en este experimento solo quería comprobar el método usado para hacer lazy load, en este caso con xmlht
Post: Indexar imágenes en Google usando Lazy Load

Francisco Morales

Lino muy interesante las distintas formas de cargar la imagen. Pero no crees que lo realmente interesante de aplicar Lazy Loading es cargar
Post: Indexar imágenes en Google usando Lazy Load

javier

Buenas , esto del onclik ha cambiado actuamente en algunas web que tengo las lee y sigue enlaces
Post: ¿Cómo ejecuta, interpreta e indexa Google el contenido cargado mediante javascript?

David Girona

Antes de Nada muchas gracias por la aportación. Estoy probando de poner en marcha este procedimiento y me surgen un par de dudas. En
Post: Cómo añadir el valor del meta Robots a Google Analytics via Google Tag Manager