Por qué Google no identifica la fuente original

Publicado el 14 de junio del 2010

Muchas veces Google ha comentado que lucha contra el contenido duplicado y que cada vez identifica mejor la fuente original, pero ¿que de cierto hay en esto?

Yo comienzo a dudar que Google haga un esfuerzo claro por identificar  cuál es la fuente original de un contenido (texto, imagen, vídeo, etc) , y es que puede que eso le de igual.

Google quiere satisfacer a su usuario (que no se nos olvide), a ese usuario que ha entrado a buscar algo y al cual Google intentará ofrecer los resultados que crea mejores para satisfacerle, no es su objetio mostrarle la fuente original sino la información más útil y puede que una página plagiadora tenga, además de ese contenido (copiado), otro contenido relacionado (también copiado) en otra sección que pueda complementar la información que busca el usuario. Si lo hace, Google habrá cumplido su función, dar al usuario lo que buscaba.

Vale que intente identificar páginas que copian webs enteritas de arriba abajo ya que esas páginas realmente no aportan nada, son meras copias. Pero no hace nada contra las páginas que van copiando de poco en pcoo, de aquí, de allá y que tienen más autoridad, más contenido y unos cuantos links más.

Si lo pensamos no sería muy difícil saber por parte de Google saber cuál es el contenido original, por ejemplo viendo la fecha que descubrió ese contenido. Vale  que se equivoque alguna vez porque haya rastreado antes la página plagiadora que la fuente original pero serían la minoría de veces.

Otro método que podrían usar sería mirando los pings, ahí no habría ninguna duda, la página que antes envie el ping es la original sí o sí. Es cierto que para usar este método tendría que comenzar anunciándolo antes de ponerlo en práctica y evangelizando a los webmasters para que actualizasen sus sistemas y envien ping cada vez que se publica algo. No creo que los webmsaters tardasen mucho tiempo en hacerlo cuando se juegan el salir o no en los buscadores, al cabo de poco tiempo todas las páginas webs lo harían, de hecho la mayoría de gestores ya lo hacen como Worpress por ejemplo.

Entonces ¿por qué no hacen todo lo posible por identificar la fuente original? pues porque no es necesario para Google, aunque sea una putada para los creadores de contenido original.




 




Posts anteriores en Como evitar contenido duplicado


Space Needle
Publicado el lunes 10de junio del 2013, By Lino Uruñuela Hoy debatiendo en una lista de correo me ha hecho pensar en cuál es el mejor método para desindexar una url, y claro todo depende de en cómo definamos lo que es desindexar una página y para que lo estamo

Seguir leyendo
Space Needle
Publicado el día 1 de junio del 2011, by Lino Uruñuela Ultimamente vivo obsesionado con diferenciar mi contenido del resto, algunas veces se me ocurren cosas ingeniosas y otras tengo que tirar por el medio como los burros, como en este caso... Con la nueva salida de Google Shopp

Seguir leyendo

Últimos posts

Últimos comentarios


Javier Galán

Este post es una auténtica genialidad. Muy útil.
Post: Medir cuántos usuarios hacen click para ampliar la imagen en Google Imágenes, aunque no entren en nuestra web

Antonio

Hola Lino, Sabes si añadiendo como robot Googlebot ya incluye tanto al robot de desktop como de mobile? O se tendria que añadir Googlebot
Post: Monotorizar GoogleBot con Google Analytics

unoquepasa

Que pasaria si haces varias paginas y cambias el orden de las palabras en los titulos ¿cual se mostrara primero? las que esten mas cerca de
Post: ¿Cuántas palabras valorará Google en el title?

Alex Rodríguez

Muy buenas Lino! Me pasaba por aquí por casualidad a ver si encontraba algo de info de lo que pasó estos días y bueno... Parece que al
Post: Google comienza el año con dos updates

Lino Uruñuela

@Javi sí, sobre que hay mucho cafre por ahí, tienes razón, pero es como el robots.txt es "peligroso" en manos inadecuadas, igual que el n
Post: Nuevo Google Search Console ¿qué información nos ofrecerá?

Javier Lorente

Gracias Lino! Para "ocultar" errores en plan de andar por casa tiro de robots. Por otro lado, estamos ante una genial actualización que
Post: Nuevo Google Search Console ¿qué información nos ofrecerá?

Lino Uruñuela

Hola Ana! Si esas urls no tenían tráfico orgánico, o este es despreciable yo usaría un 410. Si no hay más enlaces hacia estas urls p
Post: Ofuscando enlaces para mejorar Link Juice

Ana

Muy interesante el artículo, pero tengo una cuestión. ¿Qué se haría con todos esos enlaces que desaparecen si ya han sido indexados por
Post: Ofuscando enlaces para mejorar Link Juice

Lino Uruñuela

@Javier Lorente mañana te contesto poco a poco, de momento la sugerencia de "Pon algo para enterarnos de las respuestas de los comentarios
Post: Cuando restringes por robots.txt puedes aumentar el número de URLs indexadas

Javier Lorente

Siempre sospeché de https://www.seroundtable.com/amp/google-long-term-noindex-follow-24990.html tiene toda la lógica. En alguno de tus exp
Post: Meta Robots Noindex

Contacta

Lánzate y pregunta!


He leído y acepto la política de privacidad

Mecagoenlos.com te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por Lino Uruñuela. como responsable de esta web.

La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para enviar un correo con los datos que introduzcas, sin guardarse en ninguna base de datos.

Legitimación: Al marcar la casilla de aceptación, estás dando tu legítimo consentimiento para que tus datos sean tratados conforme a las finalidades de este formulario descritas en la política de privacidad.

Como usuario e interesado te informamos que los datos que nos facilitas estarán ubicados en los servidores de Linode.com (proveedor de hosting de Mecagoenlos.com) cumpliendo la ley de protección de datos. Ver política de privacidad de Linode.com.

Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en info@mecagoenlos.com, así como el derecho a presentar una reclamación ante una autoridad de control. Más información aquí.