Evita Contenido Duplicado

Se ve que Google no deja de cuidar su buscador, y es normal ya que como dice Dirson es la joya de la corona Google.
Ayer os hablábamos del nuevo formulario puesto por Google en la zona de sitemaps para que los webmasters podamos denunciar los links que se venden o se compran para alterar los resultados del buscador, hoy, nos podemos leer cómo Google hace por resolver una preocupación de muchos webmasters, el contenido duplicado.

Hoy Google ha publicado un nuevo artículo en su blog sobre el contenido duplicado, las maneras de evitarlo y las soluciones que está escuchando desde diversas fuentes. Por lo que leo y lo que entiendo, está dando algunos consejos a los webmasters para que no tengan contenido duplicado creados por ellos mismos, pero no llega a tener una solución para evitar el contenido duplicado por otros webmasters que se aprovechan de otras páginas, copiando y pegando.

Os resumo un poco los puntos del artículo, estos son las aclaraciones de Google sobre el contenido duplicado:
  • Google quiere servir resultados únicos y hace un buen trabajo al escoger una versión de su contenido, cuando hay más de uno igual en un mismo dominio. Si usted no quiere preocuparse de revisar la duplicación sobre su sitio, Google lo hará por ti.

  • El contenido duplicado no hace que su sitio sea castigado. Si páginas dobles son descubiertas, una versión será mostrada en los resultados. Dice que no es lo más óptimo para el posicionamiento ya que lo que ocurre es que el PageRank se dispersa en lugar de concentrarse en una sola página

  • El contenido duplicado no hace que su sitio sea colocado en el índice suplemental. La duplicación sí puede influir indirectamente en esto sin embargo, si se vincula a sus páginas son hendidos entre varias versiones, causando PageRank más abajo por página.
Y también nos dice cómo evitar este contenido duplicado:
  • Especificando la versión preferida de una URL en el archivo Sitemap del sitio. Una cosa de la que hablamos era la posibilidad de especificar la versión preferida de un URL en un archivo Sitemap, con la sugerencia que si encontráramos múltiple URLS que indica el mismo contenido.

  • Usando el robots.txt. Proporcionando un método para indicar los parámetros que deberían ser quitados de un URL dinámica  desde ael archivo robots.txt. Por ejemplo, si un URL contiene sesiones IDs, el administrador del sitio web podría indicar la variable para la sesión ID en el archivo robots.txt para que no fuesen indexadas las páginas con este parámetro.

  • Proporcionando un modo de autenticar la propiedad de contenido por ejemplo usar la página con la fecha más temprana, pero las fechas de creación son no siempre fiables. Alguien también aconsejó permitir a dueños de sitio registrar el contenido, esto se lo propuse yo a Mutt Cutts, en los comentarios de uno de sus posts y fue borrado al cabo de unos días pero parece que lo escucharon, también lo describí aquí. La pega que le ponen a esto es que muchos no sabrían que habría que hacer esto y otros webmasters se podrían aprovechar de ellos, autentificando los contenidos antes que los originales. Yo creo que esto se podría dar, pero sólo al comienza de este sistema, luego todos lo haríamos cada vez que escribiésemos algo.
    Según Google actualmente confían en varios factores como la autoridad del sitio y el número de links que vinculan a la página. Si el contenido es sindicado, no ssugieren que usted pregunte los sitios que usan su contenido para bloquear su versión con un archivo robots.txt .

  • Hacer un duplicate content report, o sea que pusieran un formulario para denunciar el contenido duplicado por los propietarios de ese contenido.

  • Hablar con los creadores de software para la creación de blogs, para llegar a un acuerdo de cómo identificar este contenido, por ejemplo en WordPress.
También intentan aclararnos unas cuantas cuestiones:
  • ¿Si pongo muchos links con rel="nofollow" podría ser penalizado?
    Según Google, no. Pero dice que no es la mejor manera de hacerlo y nos dice de nuevo que la mejor manera es usar el robots.txt para evitar esa indexación, haciendo por ejemplo una página intermedia en nuestro dominio que esté "capada" en el robots.txt, así el buscador nunca llegará a esas pñaginas y por lo tanto tampoco a la de destino.

  • ¿Siguen los motores de búsqueda la alianza Sitemaps?
    Supuestamente dicen que sí, y que han hecho avances como por ejemplo poder poner en el archivo robots.txt la localización de nuestro sitemaps.

  • ¿Cómohacer en páginas que muestran imágenes o gráficos sin texto que identifiquen el contenido?
    Pues como era de preveer, nos insta a crear en estás páginas, que los metas títle y description sean únicos, al igual que el alt de las imágenes.

  • Tengo sindicado mi contenido a muchos afiliados y ahora algunos de aquellos sitios están para este contenido más bien que mi sitio. ¿Qué puedo hacer?
    No dice que si usted libremente ha distribuido su contenido, usted debe tener que realzar y ampliar el contenido sobre su sitio para hacerlo único.

  • Como un investigador, quiero ver duplicados en resultados de búsqueda. ¿Puede usted añadir esto como una opción?
    Y nos dicen, hemos encontrado que la mayor parte de investigadores prefieren no tener resultados dobles. Un miembro de audiencia en particular comentó que ella no quiere conseguir la información de un solo sitio y le gustarían otras opciones, pero para este caso, otros sitios probablemente no tengan la información idéntica y por lo tanto se mostrarán en los resultados. Tenga en cuenta que usted puede añadir el parámetro "*filter=0" al final de una búsqueda Google de web URL para ver los resultados adicionales que podrían ser similares.
Está muy bien que Google se moje un poco en este tema, pero creo que el problema principal no está subsanado, ya que realmente nuestro problema con el contenido duplicado no suele ser el contenido duplicado de nuestras propias páginas sino que otros nos copian el contenido y son ellos los que salen en los resultados de Google con nuestras redacciones. Para ello sigo pensando que una solución podría ser el autentificar los contenidos directamente contra el buscador cada vez que creemos algún artíuculo como explique hace un tiempo.

 




Posts anteriores en Google


Space Needle
Publicado el 14 de julio del 2017 por Lino Uruñuela El otro día, buscando algo con lo que entretenerme mientras estaba en el baño (sí, los botes de champú ya me los he leído todos.... tres veces) estaba inetntando resolver un reto lanzado por Gary Ullyes

Seguir leyendo
Space Needle
Publicado el 19 de enero del 2015 por Lino Uruñuela Este es el primer post del 2015, y vaticino que este año va a ser un año muy movido para los SEOs!! El segundo semestre del 2014 ha sido una auténtica locura, sobretodo a partir de Octubre y sin descanso por Navida

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado el 7 de marzo del 2014, by Lino Uruñuela Ya sabemos que la gente de Google es muy visionaria y es capaz de adelantarse en el tiempo a muchas cosas, pero esta vez se han equivocado.... Hoy día 7 de Marzo nos ofrece un Doodle reivindicativo, un vídeo como homenaje

Seguir leyendo
Space Needle
Publicado por Errioxa el 24 de enero del 2014 Desde hace un tiempo se viene viendo como Google usa cada vez más su Knowledge Graph para insertar determinados resultados específicos para el tipo  de búsqueda que se haya hecho. Por ejemplo si realizamos una búsqu

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado el 6 de abril del 2013 by Lino Uruñuela Hoy leo una noticia, o más bien debería llamarlo una opinión, sobre la tasa que se quiere imponer a Google por parte de algunos medios de comunicación europeos sobretodo los grandes periódicos. Des

Seguir leyendo
Space Needle
Publicado el 29 de enero del 2013 por Lino Uruñuela El otro día Google modificó el inteface de Google Images. El cambio es bastante significativo debido a que ahora no carga la url original de la imagen al hacer el primer click en la imagen de los resultados.

Seguir leyendo
Space Needle
Publicado el 21 de octubre del 2012 ACTUALIZACIÓN: Este experimento ha sido un total fracaso por mi parte ya que tengo un puñetero canonical en la landing page... así que no vale para nada. Volveré a repetirlo en cuanto vuelva de VACACIONES!!!! Esta sema

Seguir leyendo
Space Needle
Publicado el 21 de mayo del 2012 Como muchos ya saben la palabra Google que da nombre a nuestro Dios en la red proviene de Googol, que es el término que se le da a un uno seguido de cien ceros 1 googol = 10100 Vamos a escribirlo aquí 10 000 000 000 000 000 000 000 000 000 000

Seguir leyendo
Space Needle
Publicado el 10 de mayo del 2011, by Errioxa Parece que Google Analytics ha decidido aclarar a Joaquin Sabina quien le robó el mes de abril, Google Analytics. Prueba a hacer esto en Analytics, pon las fechas desde el 1 de marzo hasta la de hoy (por ejemplo...) y ve a fuentes de traf

Seguir leyendo
Space Needle
Publicado el jueves 5 de mayo del 2011, by Errioxa No sé si esto le ocurrirá a todo el mundo o si sólo me pasa a mi con la nueva interface de Google Analytics. Si vamos a Fuentes de Tráfico -> Fuentes de ingresos -> Organico    (por ejemplo) nos

Seguir leyendo
Space Needle
Publicado el miércoles 4 de mayo del 2011, by Errioxa Google ha lanzado con fuerza su nuevo servicio de comparación de precios, poniéndolo muy visible en su web y con bastantes productos disponibles... y sospechosamente sus competidores han sido afectados brutalemte por las &

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado el 9 de septiembre del 2010 Ya hemos visto todos lo que es Google Instant, así que ¿cuales son las implicaciones que puede tener esto para el SEO? Sin duda muchas, pero intentaré poner las que yo ahora mismo y sin ver datos (algo muy important

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado el 12 de mayo del 2010 Siempre tuve interés en cómo se escucharía MeCagoEnLos.com en Griego y ya puedo hacerlo! Google ha sacado como parte de su traductor un sistema que le pone voz a las palabras. Así que si vemos esta búsqueda y le damos al i

Seguir leyendo
  • 0000-00-00 00:00:00

Pues eso, Google recueda el 11M con una vela roja. He pillado esta captura de pantalla el día 10 de marzo a las 23:55 a veces sale y a veces no, supongo que a las 00:00 saldrá a todos en Google.es

Seguir leyendo
  • 0000-00-00 00:00:00

Google ha anunciado que quitará la autocensura que tenía en China y que le permitía operar en ese país. Bien por Google. Esto lo hace porque ha detectado ataques del gobierno chino a su servicio de correo Gmail, en un intento de sutraer información de personas p

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado el 13 de enero del 2010 Una de las cosas que más tiempo lleva rumoreándose por la web es la de un servicio de Google llamado GDrive, el cual sería un disco duro virtual para los usuarios en los servidores de Google para el almacenamiento de cualquier tipo de documen

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado el 30 de noviembre del 2009 Pues si queréis examinar cómo se podría ver en Google cuando apliquen las mejoras en su algoritmo, a las cuales las han llamado caffeine, se puede hacer a través de este data center de Google 209.85.225.103 aunque la verdad yo no m

Seguir leyendo
  • 0000-00-00 00:00:00

El otro día Google anunció que el formato de los sitemaps de Google News han cambiado y que tenemos 6 meses para modificarlos. Si aún tienes el formato viejo te salrá un icono de advertencia en webmsater tools, pero según Google hasta dentro de 6 meses seguir&aa

Seguir leyendo
Space Needle
Publicado el 21 de octubre del 2008 Se están viendo algunos nuevos diseños en el aspecto de los resultados de Google. Ahora en vez de salir como máximo 2 resultados de cada dominio, pueden aparecer bien si estás el posicionamiento es sólido. Podemos ver un ej

Seguir leyendo
  • 0000-00-00 00:00:00

Publicado el 17 de agosto del 2009 Google ha realizado otra mejora en Webmaster Tools, se trata del organizador de parámetros y sirve para ignorar determinados paramatros. Está en "Organización -> Organización de parámetros" Por ejemplo si tenemo

Seguir leyendo

Últimos posts

Últimos comentarios


Javier Galán

Este post es una auténtica genialidad. Muy útil.
Post: Medir cuántos usuarios hacen click para ampliar la imagen en Google Imágenes, aunque no entren en nuestra web

Antonio

Hola Lino, Sabes si añadiendo como robot Googlebot ya incluye tanto al robot de desktop como de mobile? O se tendria que añadir Googlebot
Post: Monotorizar GoogleBot con Google Analytics

unoquepasa

Que pasaria si haces varias paginas y cambias el orden de las palabras en los titulos ¿cual se mostrara primero? las que esten mas cerca de
Post: ¿Cuántas palabras valorará Google en el title?

Alex Rodríguez

Muy buenas Lino! Me pasaba por aquí por casualidad a ver si encontraba algo de info de lo que pasó estos días y bueno... Parece que al
Post: Google comienza el año con dos updates

Lino Uruñuela

@Javi sí, sobre que hay mucho cafre por ahí, tienes razón, pero es como el robots.txt es "peligroso" en manos inadecuadas, igual que el n
Post: Nuevo Google Search Console ¿qué información nos ofrecerá?

Javier Lorente

Gracias Lino! Para "ocultar" errores en plan de andar por casa tiro de robots. Por otro lado, estamos ante una genial actualización que
Post: Nuevo Google Search Console ¿qué información nos ofrecerá?

Lino Uruñuela

Hola Ana! Si esas urls no tenían tráfico orgánico, o este es despreciable yo usaría un 410. Si no hay más enlaces hacia estas urls p
Post: Ofuscando enlaces para mejorar Link Juice

Ana

Muy interesante el artículo, pero tengo una cuestión. ¿Qué se haría con todos esos enlaces que desaparecen si ya han sido indexados por
Post: Ofuscando enlaces para mejorar Link Juice

Lino Uruñuela

@Javier Lorente mañana te contesto poco a poco, de momento la sugerencia de "Pon algo para enterarnos de las respuestas de los comentarios
Post: Cuando restringes por robots.txt puedes aumentar el número de URLs indexadas

Javier Lorente

Siempre sospeché de https://www.seroundtable.com/amp/google-long-term-noindex-follow-24990.html tiene toda la lógica. En alguno de tus exp
Post: Meta Robots Noindex

Contacta

Lánzate y pregunta!


He leído y acepto la política de privacidad

Mecagoenlos.com te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por Lino Uruñuela. como responsable de esta web.

La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para enviar un correo con los datos que introduzcas, sin guardarse en ninguna base de datos.

Legitimación: Al marcar la casilla de aceptación, estás dando tu legítimo consentimiento para que tus datos sean tratados conforme a las finalidades de este formulario descritas en la política de privacidad.

Como usuario e interesado te informamos que los datos que nos facilitas estarán ubicados en los servidores de Linode.com (proveedor de hosting de Mecagoenlos.com) cumpliendo la ley de protección de datos. Ver política de privacidad de Linode.com.

Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en info@mecagoenlos.com, así como el derecho a presentar una reclamación ante una autoridad de control. Más información aquí.