Por qué Google no identifica la fuente original

Publicado el 14 de junio del 2010

Muchas veces Google ha comentado que lucha contra el contenido duplicado y que cada vez identifica mejor la fuente original, pero ¿que de cierto hay en esto?

Yo comienzo a dudar que Google haga un esfuerzo claro por identificar  cuál es la fuente original de un contenido (texto, imagen, vídeo, etc) , y es que puede que eso le de igual.

Google quiere satisfacer a su usuario (que no se nos olvide), a ese usuario que ha entrado a buscar algo y al cual Google intentará ofrecer los resultados que crea mejores para satisfacerle, no es su objetio mostrarle la fuente original sino la información más útil y puede que una página plagiadora tenga, además de ese contenido (copiado), otro contenido relacionado (también copiado) en otra sección que pueda complementar la información que busca el usuario. Si lo hace, Google habrá cumplido su función, dar al usuario lo que buscaba.

Vale que intente identificar páginas que copian webs enteritas de arriba abajo ya que esas páginas realmente no aportan nada, son meras copias. Pero no hace nada contra las páginas que van copiando de poco en pcoo, de aquí, de allá y que tienen más autoridad, más contenido y unos cuantos links más.

Si lo pensamos no sería muy difícil saber por parte de Google saber cuál es el contenido original, por ejemplo viendo la fecha que descubrió ese contenido. Vale  que se equivoque alguna vez porque haya rastreado antes la página plagiadora que la fuente original pero serían la minoría de veces.

Otro método que podrían usar sería mirando los pings, ahí no habría ninguna duda, la página que antes envie el ping es la original sí o sí. Es cierto que para usar este método tendría que comenzar anunciándolo antes de ponerlo en práctica y evangelizando a los webmasters para que actualizasen sus sistemas y envien ping cada vez que se publica algo. No creo que los webmsaters tardasen mucho tiempo en hacerlo cuando se juegan el salir o no en los buscadores, al cabo de poco tiempo todas las páginas webs lo harían, de hecho la mayoría de gestores ya lo hacen como Worpress por ejemplo.

Entonces ¿por qué no hacen todo lo posible por identificar la fuente original? pues porque no es necesario para Google, aunque sea una putada para los creadores de contenido original.




 




Posts anteriores en Como evitar contenido duplicado


Space Needle
Publicado el lunes 10de junio del 2013, By Lino Uruñuela Hoy debatiendo en una lista de correo me ha hecho pensar en cuál es el mejor método para desindexar una url, y claro todo depende de en cómo definamos lo que es desindexar una página y para que lo estamo

Seguir leyendo
Space Needle
Publicado el día 1 de junio del 2011, by Lino Uruñuela Ultimamente vivo obsesionado con diferenciar mi contenido del resto, algunas veces se me ocurren cosas ingeniosas y otras tengo que tirar por el medio como los burros, como en este caso... Con la nueva salida de Google Shopp

Seguir leyendo

Últimos posts

Últimos comentarios


Lino Uruñuela

Hola Ana! Si esas urls no tenían tráfico orgánico, o este es despreciable yo usaría un 410. Si no hay más enlaces hacia estas urls p
Post: Ofuscando enlaces para mejorar Link Juice

Ana

Muy interesante el artículo, pero tengo una cuestión. ¿Qué se haría con todos esos enlaces que desaparecen si ya han sido indexados por
Post: Ofuscando enlaces para mejorar Link Juice

Lino Uruñuela

@Javier Lorente mañana te contesto poco a poco, de momento la sugerencia de "Pon algo para enterarnos de las respuestas de los comentarios
Post: Cuando restringes por robots.txt puedes aumentar el número de URLs indexadas

Javier Lorente

Siempre sospeché de https://www.seroundtable.com/amp/google-long-term-noindex-follow-24990.html tiene toda la lógica. En alguno de tus exp
Post: Meta Robots Noindex

Javier Lorente

Creo que deberíamos empezar a diferenciar ya de una vez por todas "indexadas" y "en el index server". Personalmente por indexadas entien
Post: Cuando restringes por robots.txt puedes aumentar el número de URLs indexadas

Javier

Bueenas Lino! Gracias por tu respuesta! Efectivamente, cogiendo texto de una página hecha con javascript y poniéndolo en Google entre comi
Post: Meta Robots Noindex

Lino Uruñuela

Hola @Javier repondiendo a tu pregunta "¿significa eso que google no está viendo el contenido en texto y no lo posicionará?" con el mismo
Post: Meta Robots Noindex

Lino Uruñuela

@Alex R , lo primero graciias por a ti por participar :) Sobre tu prebunta ¿Dentro de un mismo artículo o entrada podemos hacer que no s
Post: Meta Robots Noindex

Javier

Buenas Lino Mecagoenlos! (vaya apellido tienes...) Tu artículo me ha dado mucho que pensar... acaban de hacerme una web en una agencia y
Post: Meta Robots Noindex

Alex R

Hola Lino! Te leo desde hace algún tiempo (genial el cambio de look) y casualmente he venido aquí con una duda sobre indexación. Lo
Post: Meta Robots Noindex

Contacta

Lánzate y pregunta!

Nos gustan los robots, pero no tanto
7 + 3