Google Vs JavaScript - Round 3

Publicado por Lino Uruñuela el 8 de abril del 2016


Hoy en una conversación con Duque me ha hecho volver a dudar de hasta que punto es capaz Google de interpretar JavaScript, cosa que hemos visto aquí en numerosas ocasiones

Uno de los test que mas me ha llamado la atención es este, concretamente el segundo test. Y es que Google ha sido capaz de resolver el "problema" y ha conseguido acceder a la url. Pero no sé si realmente ha ejecutado la función y por eso lo ha descubierto, o si ha dentificado la cadena  "archivoAjax_php?otroContenido=coneval", y como acostumbra cuando encuetra un patrón de url en un texto, ha intentado acceder a esa url.

Así que vamos a volver a probar el test, tanto en este post como en otros sites para así asegurarnos que de ninguna otra manera Google pudiese acceder, a fin de corraborar el test.

En este test he trabajado otra función, parecida a la del experimento anterior, pero con cadenas de texto que en principio no tiene formato de url


Ejemplo de la función JavaScript

function OcultaEnlace(cadena1,cadena2){
  cadena3=cadena1.replace("|","/")+cadena2.replace("|","/"); eval('document.' + '
  window' + '.location' + '.href '+'=http://'+cadena3.replace("^",".");
}

 

   Y el elemento HTML que hará de enlace 

 

Ejemplo del código HTML

<span onclick="OcultaEnlace('mecagoenlos','.com|experimento425^php');" >Texto de enlace</span>
  

Con esto queremos conseguir que Google no vea ese enlace. Las causas de que no queamos que "descubra" ese enlace pueden ser varias
  • Evitar enlazado a contenido que no queremos indexar (aunque podríamos usar otros métodos como el robots.txt)
  • Para hacer PR sculpting y así maximizar la efectividad de nuestros enlaces sin diluír su "poder" hacia urls que no nos interesa posicionar
  • Para evitar el rastreo automático de nuestro site ya sea por otros motores de búsqueda o por algún software de la competencia o de quien sea.
  • Eviar que nos relacione con el contenido enlazado, podría ser que enlazamos a una página porno y no queremos que Google haga esa relación...
  • etc

 

Así que vamos a probar con esta nueva función, a ver si Google es que ha mejorado en cómo renderiza y es capaz de interpretar el contenido obtenido en esa renderización.

En el fondo conocer esto es muy importante de cara al futuro, si Google algún día fuese capaz de ejecutar JavaScript como cualquier navegador, y sobretodo, fuese capaz de extraer y comprender el contenido devuelto al ejecutarlo para así poder procesarlo y valorarlo estaríamos ante un cambio de inflexión muy grande.

Y es que hoy en día parece ser que la tendencia va por usar Json como formato para la exrtacción de datos tanto en entornos web como otro tipo de aplicaciones y el gran avance en frameworks como AngularJS. Pero no solo eso, incluso podemos programar nuestros propios servidores usando JavaScript gracvias Node.js

Parece ser que la evolución va por ahí, y Google no podrá/deberá ser menos, si no es capaz de recorrer internet no podrá extraer, guardar y procesar el contenido de la red por lo que su gran negocio se podría ver seriamente afectado porque si no es capaz de comprender lo que su máquina JavaScript ejecuta no podrá ordenar los resultados.. a no ser que le de a la tecla del random.

Así que vamos a ello!

Ejemplo del código HTML

Cuando un usuario haga click en este enlace se ejecutará la función que hemos creado en JavaScript y abrirá en el navegador la págnia de destino de este experimento

  

Veamos como va este test, que lo haré tabién en otros sites para cercionarnos que el resultado es correcto.

 

 



Últimos posts

Últimos comentarios


Lino

@errioxa probando desde comentarios del site :)
Post: El valor de los logs para el SEO

Lino

@Santy Jordi y Sergio muchas gracias! Irá mejorando, pero poco a poco :)
Post: Informes y gráficas usando la API de Google Search Console

sergio

Bravo! Gracias por compartir.
Post: Informes y gráficas usando la API de Google Search Console

Santy

Gracias Lino, muy útil para el día a día
Post: Informes y gráficas usando la API de Google Search Console

Jordi

Buenas tardes Lino, Felicidades por la herramienta, me parece algo espectacular y rápido de utilizar. Espero con muchas ganas ver las nue
Post: Informes y gráficas usando la API de Google Search Console

Joan marc

Muchísimas gracias @Lino!! Para acabar, sabes si con Varnish tendríamos problemas? Entiendo que al no hacerse siempre consultas al servid
Post: Monitorizar GoogleBot con Google Analytics

Lino

@Joan marc sí!, pero has de configurar el server para que cualquier URL que de 301 sea tratada por una única url del site (como la url de
Post: Monitorizar GoogleBot con Google Analytics

Joan marc

Excelento post Lino! Has podido trackear los 301 y 302?
Post: Monitorizar GoogleBot con Google Analytics

German

Hola amigo, lo cierto es que no me he enterado pajolera idea de lo que cuentas, aunque te felicito por aparecer en el Discovery de Google. M
Post: Google podria no querer el HTML de una URL

Lino

Una manera súper sencilla para comprobarlo: 1- Una URL, mirar un log de Googlrbot de esa UR cuando da 200 2- Comparar con otro log
Post: Google podria no querer el HTML de una URL