¿Repartiendo el long tail?

Publicado el 29 de septiembre del 2009

Desde ayer se están viendo un número muy elevado en el número de resultados de páginas indexadas de muchos dominios cuando haces la búsqueda site:dominio.com . Creo que todo apunta a que tiene que ver con Google caffeine.

Decía que estaba actualizando la estructura de sus índices, para que estos fuesen mucho mayores y más rápidos.

Creo además que con este cambio veremos un gran cambio en el algoritmo que clasifica el orden de los resultados, como puede ser links el que ignore algunos wide-links (links en todas las URLs de un dominio), resultados más geolocalizados para determinadas temáticas y cosas como estas para intentar hacer menos manipulables sus resultados.

Yo creo que el cambio de algoritmo que llevará a cabo Google se irá viendo poco a poco, lo primero que ha hecho ha sido modificar su infraestructura para poder acometer estas mejoras a la hora de mostrar resutados.

Antaño, si se me permite este expresión para hace menos de 2 años, existía lo que llamábamos índice suplementario. Era un índice en el que estaban las URLs que menos veces se mostraban como posibles resultados y que para que saliesen se tenía que haber hecho una búsqueda que no tuviera muchos resultados, por ejemplo con frases largas, o con algún truquito (poniendo por ejemplo site:mecagoenlos.com *** -patatinpatatan).

En su día nos dijeron que ese índice iba a actualizarse diariamente para luego decirnos que iba a desaparecer, y de repente dejaron de funcionar esos truquitos para ver si una URL estaba o no en el índice supementario, pero yo creo que en realidad nunca dejó de existir.

Ahora creo que el índice general será mucho más amplio, y además, tendrá capacidad para aplicar determinados filtros para evitar spam.

Creo que esto conllevará a que por los términos de long tail haya muchas más URLs que compitan, y no como antes, que había determinadas URLs que tenían ventaja sobre otras al estar en ese índice principal. Por eso, creo que páginas con gran tráfico por long tail pueden verse perjudicadas si esta actualización fuese como digo.

La verdad es que puedo estar muy confundido y no ser nada así, esto es como la teología, si Dios no nos dice nada, crearemos nuestras propias teorías para intentar explicar lo que vemos. Lo bueno es que podremos comprobarlo en un espacio de tiempo cercano... y sin tener que morirnos!


 


Dani Pinilloshace Hace más de 10 años y 184 días

Joder Lino la has clavao.

Siguiendo tu lógica que tiene mucho sentido creo que pronto veremos algo gordo que esta pasando.

Es cierto que el índice nunca ha dejado de existir, de hecho según recuerdo Google no comento que desapareciera físicamente sino que se dejaría de ver.

Tiene mucha lógica porque esta indexando contenidos duplicados que antes entraban en el suplementario.

Bueno en breve tendremos que ver las consecuencias de la cafeina, mas vale que yo deje el café hace años y tomo té, jajaja ;-)

Saludos!

Errioxahace Hace más de 10 años y 184 días

@Dani el té tiene teina! no sé que será peor jajaja.
Ya te digo que a saber que es lo que se cuece, esto podría ser una consecuencia de ello, pero eso... a saber!

José Kontrerashace Hace más de 10 años y 184 días

Yo creo que con eso al menos el SEO se volvería más interesante que solo optimizar para aparecer en la cola larga, ya que entonces si se tendría lo que llamamos "Posicionamiento" XD

Por cierto q para una web q tenia 2000 resultados en el indice ayer que ustedes comentaban esto, revise y ahora tiene 6000!

Slds desde Guatemala!

Dani Pinilloshace Hace más de 10 años y 184 días

Jajaja por eso pero a Google le gusta el café y no el té al menos por ahora.

Has podido comprobar si indexa urls duplicadas o con variables largas o cosas raras que antes se comía el índice suplementario? Voy a mirarlo ;-)

Por cierto como comenta @elqudsi en Google images también esta afectando y están de baile por la cafeína.

Pedro Serranohace Hace más de 10 años y 184 días

Hola Errioxa!
Más que cuánto, la pregunta es qué está indexando Google. En función de qué sea lo que esté indexando, tendrá sentido tu afirmación de que va a afectar al longtail.
Es decir, si todo ese contenido que se está indexando es duplicado ¿porqué debería afectar al longtail?
En cambio, si el contenido indexado es gracias a que google puede navegar a través de js. y está accediendo a la web invisible, sí que es posible que afecte al longtail.
Por cierto, a ver si me aceptas como follower tuyo en twitter (pserrano) ;)

emmahace Hace más de 9 años y 332 días

Dani Pinillos: Y el té no lleva cafeína?



Lea otros artículos de Google Updates

Últimos posts

Últimos comentarios


Lino

@errioxa probando desde comentarios del site :)
Post: El valor de los logs para el SEO

Lino

@Santy Jordi y Sergio muchas gracias! Irá mejorando, pero poco a poco :)
Post: Informes y gráficas usando la API de Google Search Console

sergio

Bravo! Gracias por compartir.
Post: Informes y gráficas usando la API de Google Search Console

Santy

Gracias Lino, muy útil para el día a día
Post: Informes y gráficas usando la API de Google Search Console

Jordi

Buenas tardes Lino, Felicidades por la herramienta, me parece algo espectacular y rápido de utilizar. Espero con muchas ganas ver las nue
Post: Informes y gráficas usando la API de Google Search Console

Joan marc

Muchísimas gracias @Lino!! Para acabar, sabes si con Varnish tendríamos problemas? Entiendo que al no hacerse siempre consultas al servid
Post: Monitorizar GoogleBot con Google Analytics

Lino

@Joan marc sí!, pero has de configurar el server para que cualquier URL que de 301 sea tratada por una única url del site (como la url de
Post: Monitorizar GoogleBot con Google Analytics

Joan marc

Excelento post Lino! Has podido trackear los 301 y 302?
Post: Monitorizar GoogleBot con Google Analytics

German

Hola amigo, lo cierto es que no me he enterado pajolera idea de lo que cuentas, aunque te felicito por aparecer en el Discovery de Google. M
Post: Google podria no querer el HTML de una URL

Lino

Una manera súper sencilla para comprobarlo: 1- Una URL, mirar un log de Googlrbot de esa UR cuando da 200 2- Comparar con otro log
Post: Google podria no querer el HTML de una URL