Test 2 sobre indexacion de Google usando JavaScript , y resultado del Test 1

Publicado por Lino Uruñuela el 7 de julio del 2015

El otro día comenzamos una nueva tanda de experimentos para saber hasta dónde es capaz de Google de rastrear e interpretar el código JavaScript de nuestros sites.

El pimer experimento sobre si es capaz de rastrear contenidos cargados mediante Ajax tras la acción del usuario y hoy podemos comprobar que sí, Google es capaz de rastrear e interpretar los contenidos cargados mediante Ajax, ya sea con o sin jQuery.

Podemos comprobar como al buscar la kw, google  muestra resultados, concretamente devuelve la url desde la que se carga el contenido y no la url desde donde se le llama, yo creo que sería lo ideal...

Podríamos pensar que simplemente Google ha visto las urls en el código fuente, en la función de javascript y que ha probado a ver si descubria algo, ya que  muchas veces lo hace con cualquier trozo de código que se pueda parecer a una url, cosa que a veces puede dar más de un dolor de cabeza a los webmasters ya que estos errores de URLs que intenta intuir pero que realmente se "inventa" Google nos salen mostradas en WMT como un error...

Pero si nos fijamos en el título del resultado en las serps hay un detalle clave.

Ajax And Google


Vemos como Google muestra como título del resultado el mismo texto que usamos para que el usuario generara el evento que hacía cargar el contenido mediante Ajax.

Me resulta extraño que si es capaz de ejecutar el evento, no muestre como url del resultado la página desde donde se llama a este contenido, ya que el mostrar esta otra url puede no tener mucho sentido  en la mayoría de los casos, ya que normalmente será contenido fuera de contexto y que es muy posible que no genere al usuario la información que necesitaba,

La impresión de que Google es capaz de asignar el texto que provoca la carga de contenido, que en este caso está en un y con un evento onClick, a la url desde donde lo carga. Podría significar que sabe que ese texto con la interacción del usuario provoca esta carga del contenido.

Ahora vamos a ir un paso más allá, y vamos a comprobar si Google es realmente capaz de ejecutar JavaScript. Para ello usaremos dos técnicas.

Objetivo de este experimento

El objetivo del test es comprobar si realmente Google es capaz de ejecutar este código para cargar contenido mediante Ajax, o si bien el resultado del experimento anterior es debido a que siempre que ve en el código fuente algo parecido a una URL intenta indexarla

  1. Usando base64 para codificar la url del enlace desde el servidor
    En vez de pasar en el evento onClick como parámetro de la función una URL, vamos a intentar camuflar esta url para que no lo parezca, e intentar averiguar si Google indexó el contenido cargado por Ajax porque vió algo parecido a una URL o si es que realmente ejecutó el código.

    Esta vez solo ejecutando el código se pueda decodificar la URL.

    En el código fuente podéis ver cómo el texto que hace la llamada Ajax no contiene una url, está codificada, y veremos si Google es capaz de descubrirla e indexarla.

    Si Google ejecutara JavaScript, debería resolver fácilmente la url y actuar como en el anterior experimento, y cargar el contenido mediante ajax con este otro enlace, que si miráis el código funete no veréis en el nada parecido a una URL


  2. Este texto va a ser sustituido por el contenido en Ajax

     

    Este es el código javaScript que ejecuta este "enlace camuflado", como se puede observar, a primera vista no hay nada parecido a una url

    Primer test, usando codificación en Base 64
    function b64_to_utf82(str) { 
    return decodeURIComponent(escape(window.atob(str))); 


    function cargarDivCodificado(div,url) { 
    $(div).load(decodeURIComponent(b64_to_utf82(url))); 
    }
    <span onclick='cargarDivCodificado("#contenido","Li4lMkZhcmNoaXZvQWpheENvZGlmaWNhZG8ucGhw")' 
    style="color:#FF0000;cursor:hand;cursor:pointer;">con este otro enlace</span>

  3. Segundo test, usando una función JavaScript y un window.location.href
    La url del fichero Ajax que nos devolverá contenido será creado al juntar distintas partes de una cadena que a priori no tiene el patrón de una URL.

    Con esto intentaremos  comprobar si ejecuta las órdenes que unen las cadenas para crear la url final, y ejecutar el window.location con un eval.

    Para entenderlo tenemos debajo el código fuente de este test, y este es el enlace que ejecuta la función al hacer onCLick y llevará al navegador a la url de prueba, a ver si la indexa.

    El código que realiza el segundo test usa la función eval que pasa la url por "trocitos" y reemplaza @ por slash "/", dolar "$" por guión medio, y guion bajo "_" por punto "."
    Si ejecuta el código JavaScript la función de abajo formará la URL y ejecutara el window.location.href.
    <span onclick='DesglosaEnlace("www_mecagoenlos_com@archivoAjax_php?otroContenido=coneval");' 
    style="color:#FF0000;cursor:hand;cursor:pointer;">enlace</span>


    function DesglosaEnlace(enlace){
        
    trozoUrl = "'http://";   
    trozoOrden ="window.";  
    trozoOrden2 ="location.";
    trozoOrden3 = "href=";
       
    enlace_bueno = enlace.split("@").join("/");
    enlace_bueno2 = enlace_bueno.split("$").join("-");
    enlace_bueno3 = enlace_bueno2.split("_").join(".");
       
    split(trozoOrden+trozoOrden2+trozoOrden3+trozoUrl+enlace_bueno3+"'");

    }

 

 


Alvaro (@alvaro_rmfg)hace Hace más de 8 años y 242 días

Para terminar de asegurar esto quizás podrías revisar los logs del servidor para ver si Googlebot ha accedido a esa nueva url. Quizás pase, que acceda y decida no indexarla (raro...).

Buen post!

Un saludo!

Lino (@errioxa)hace Hace más de 8 años y 234 días

@Alvaro suelo comprobarlo cuando la url ha sido indexada, por si hubiese sido enlazada desde otro site, o por algún otro bot.

Pero en los casos en los que no la indexa, me da igual qué entre ahí, si no indexa, no existe para Google...

Eso sí, como bien dices sería, cuanto menos, desconcertante, que llegará a ella y no la indexara

Saluds!


Últimos posts

Últimos comentarios


JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos

Señor Muñoz
Lino, el 11% más de clicks y el 47% más de impresiones diarias ¿es algo constante o depende de cada sitio web?
Post: Diferencias entre la exportación de datos de Search Console usando BigQuery o usando la API

Carlos
Hola En mi blog tengo artículos atemporales (es decir, no caducan nunca, de manera que sirve para quien lo lea hoy o lo lea dentro de 5
Post: Tratamiento de urls que tienen un tiempo de vida muy corto

Profe Ray
Veo que hay comentarios de hace 5 años y de hace 3 años. ¿Habrá algun post actualizado sobre este tema o sigue funcionando? Lo cierto es
Post: Cómo cargar css y js y no bloquear la carga de contenido

Pepe
Muchas gracias por el articulo!! Muy buena información.
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

María
Sí, he buscado el archivo robots.txt y todo está correcto. La última versión vista con error fue el 08/11/2021 y la última vez que el
Post: Errores críticos originados por el robots.txt

Lino
@María un placer verte por aquí :) Lo primero, a veces, con el robots.txt no se puede "forzar" a que lo rastree, si tu site no es muy p
Post: Errores críticos originados por el robots.txt

María
Hola Lino, tengo el mismo problema. El probador de robots de google me indica: "Error al obtener el archivo robots.txt Tienes un archivo ro
Post: Errores críticos originados por el robots.txt

Mario
Estoy tratando de vincular los datos en Google Data Studio y he combinado los datos de la tabla "Impresión del sitio" con "Impresión de UR
Post: Datos incoherentes y cálculo de la posición media en Search Console

José B. Moreno Suárez
Yo hace tiempo que agrupaba con stemmers. Ahora, además, comparo con un proceso las keywords que aportan impresiones a una URL determinada
Post: Clustering de keywords SEO en Google Search Console - Parte II