Cómo agrupar URLs para evitar contenido duplicado

Publicado el 4 de julio del 2022 por Lino Uruñuela

El otro día pariticipé en el evento SEO más familiar organizado por Sico de Andrés, el Seonthebeach, al que ya tenía ganas de volver tras dos años de espera a causa de la pandemia.

La ponencia trata sobre un caso real en el que debido a la indexación de búsquedas internas el site tenía cientos de millones de URLs y desde hace años venía cayendo update tras update.

Como veréis también utilizo la agrupación que vimos en los anteriores posts de este blog que trataban sobre agrupación / clusterizaciónde keywords, con la diferencia de que esta vez en vez de utilizar y agrupar keywords lo hago con URLs, para agrupar posible contenido duplicado y determinar qué URL redirige a qué URL en base a datos.

Además, también comparo la misma tarea pero con diferentes tecnologías, concretamente Python Vs SQL, y haciendo un poco de spoiler os adelanto que gana SQL por muchos órdenes de magnitud... ¿estará Python sobrevalorado?

Vídeo SEO sobre cómo resolver problemas de contenido duplicado agrupando URLs

Así que sin más dilación aquí os dejo el vídeo (link, tarda unos segundos en comenzar) que he subido a mi canal SEO, el cuál espero comenzar a nutrir de vídeos con ejemplos SEO, avanzados y reales.

Presentación SEO en el SOB22

También la presentación SEO que realicé este año en el Seonthebeach, espero que os sea útil :)

Agrupa y vencerás - SEO técnico from Lino Uruñuela

Lea otros artículos de Como evitar contenido duplicado

Categorias

Últimos posts

Las personalidades de Gemini

10 de Septiembre del 2025

Extracción y comparación de pasajes con IA en Google Chrome

19 de Agosto del 2025

Ejecutar LLMs desde el terminal

05 de Agosto del 2025

Como uso la IA en mi día a día

05 de Agosto del 2025

¿Se puede medir la visibilidad en asistentes de IA?

18 de Julio del 2025

aNótame: extensión para guardar notas y generar resumenes usando Gemini de manera local

03 de Julio del 2025

¿Qué es Query Fan Out?

02 de Julio del 2025

Últimos comentarios

Lino

@Emil8ano, no son tokens, son caracteres... Pero estoy casi seguro que el limite de texto en cada llamada aumentará rápidamente.

Post: aNótame: extensión para guardar notas y generar resumenes usando Gemini de manera local

Emiliano

Gran idea! Pregunta. Los 8000 caracteres no son tokens no? Si es así ojo que sin 8000 entre entrada y salida. O sea si te comes 6000 de ent

Post: aNótame: extensión para guardar notas y generar resumenes usando Gemini de manera local

Lino

@spamloco a tí r hacerme ver que no soy al único que le importa :p A ver si nos vemos!

Post: ¿Cómo decide Google que URL debe rastrear?

Alejandro

Gracias Lino, siempre investigando un poco más allá.

Post: ¿Cómo decide Google que URL debe rastrear?

Lino

3,2,1... Gracias a ti Pedro!! y sí, parece que los humanos somos expertos en haciendo ruido cuando intentamos que alguien nos escuche... :p

Post: ¿Cómo decide Google que URL debe rastrear?

Pedro

1,2...1,2... probando. Gracias por el artículo, verdaderamente interesante ver cómo no paramos de generar ruido :)

Post: ¿Cómo decide Google que URL debe rastrear?

Lino

Funcionan!! Ahora solo tengo que generar engagement :D A ver si quito lo de avisar por Twitter... no sé cuántos años llevará sin funcio

Post: ¿Cómo decide Google que URL debe rastrear?

Juanan Carapapa

Yo también vengo a probar los comentarios, probando probando xD

Post: ¿Cómo decide Google que URL debe rastrear?

Lino2

Hola @errioxa que tal

Post: ¿Cómo decide Google que URL debe rastrear?

Lino2

Hola

Post: ¿Cómo decide Google que URL debe rastrear?