Test 2 sobre indexacion de Google usando JavaScript , y resultado del Test 1

Publicado por Lino Uruñuela el 7 de julio del 2015

El otro día comenzamos una nueva tanda de experimentos para saber hasta dónde es capaz de Google de rastrear e interpretar el código JavaScript de nuestros sites.

El pimer experimento sobre si es capaz de rastrear contenidos cargados mediante Ajax tras la acción del usuario y hoy podemos comprobar que sí, Google es capaz de rastrear e interpretar los contenidos cargados mediante Ajax, ya sea con o sin jQuery.

Podemos comprobar como al buscar la kw, google  muestra resultados, concretamente devuelve la url desde la que se carga el contenido y no la url desde donde se le llama, yo creo que sería lo ideal...

Podríamos pensar que simplemente Google ha visto las urls en el código fuente, en la función de javascript y que ha probado a ver si descubria algo, ya que  muchas veces lo hace con cualquier trozo de código que se pueda parecer a una url, cosa que a veces puede dar más de un dolor de cabeza a los webmasters ya que estos errores de URLs que intenta intuir pero que realmente se "inventa" Google nos salen mostradas en WMT como un error...

Pero si nos fijamos en el título del resultado en las serps hay un detalle clave.

Ajax And Google


Vemos como Google muestra como título del resultado el mismo texto que usamos para que el usuario generara el evento que hacía cargar el contenido mediante Ajax.

Me resulta extraño que si es capaz de ejecutar el evento, no muestre como url del resultado la página desde donde se llama a este contenido, ya que el mostrar esta otra url puede no tener mucho sentido  en la mayoría de los casos, ya que normalmente será contenido fuera de contexto y que es muy posible que no genere al usuario la información que necesitaba,

La impresión de que Google es capaz de asignar el texto que provoca la carga de contenido, que en este caso está en un y con un evento onClick, a la url desde donde lo carga. Podría significar que sabe que ese texto con la interacción del usuario provoca esta carga del contenido.

Ahora vamos a ir un paso más allá, y vamos a comprobar si Google es realmente capaz de ejecutar JavaScript. Para ello usaremos dos técnicas.

Objetivo de este experimento

El objetivo del test es comprobar si realmente Google es capaz de ejecutar este código para cargar contenido mediante Ajax, o si bien el resultado del experimento anterior es debido a que siempre que ve en el código fuente algo parecido a una URL intenta indexarla

  1. Usando base64 para codificar la url del enlace desde el servidor
    En vez de pasar en el evento onClick como parámetro de la función una URL, vamos a intentar camuflar esta url para que no lo parezca, e intentar averiguar si Google indexó el contenido cargado por Ajax porque vió algo parecido a una URL o si es que realmente ejecutó el código.

    Esta vez solo ejecutando el código se pueda decodificar la URL.

    En el código fuente podéis ver cómo el texto que hace la llamada Ajax no contiene una url, está codificada, y veremos si Google es capaz de descubrirla e indexarla.

    Si Google ejecutara JavaScript, debería resolver fácilmente la url y actuar como en el anterior experimento, y cargar el contenido mediante ajax con este otro enlace, que si miráis el código funete no veréis en el nada parecido a una URL


  2. Este texto va a ser sustituido por el contenido en Ajax

     

    Este es el código javaScript que ejecuta este "enlace camuflado", como se puede observar, a primera vista no hay nada parecido a una url

    Primer test, usando codificación en Base 64
    function b64_to_utf82(str) { 
    return decodeURIComponent(escape(window.atob(str))); 


    function cargarDivCodificado(div,url) { 
    $(div).load(decodeURIComponent(b64_to_utf82(url))); 
    }
    <span onclick='cargarDivCodificado("#contenido","Li4lMkZhcmNoaXZvQWpheENvZGlmaWNhZG8ucGhw")' 
    style="color:#FF0000;cursor:hand;cursor:pointer;">con este otro enlace</span>

  3. Segundo test, usando una función JavaScript y un window.location.href
    La url del fichero Ajax que nos devolverá contenido será creado al juntar distintas partes de una cadena que a priori no tiene el patrón de una URL.

    Con esto intentaremos  comprobar si ejecuta las órdenes que unen las cadenas para crear la url final, y ejecutar el window.location con un eval.

    Para entenderlo tenemos debajo el código fuente de este test, y este es el enlace que ejecuta la función al hacer onCLick y llevará al navegador a la url de prueba, a ver si la indexa.

    El código que realiza el segundo test usa la función eval que pasa la url por "trocitos" y reemplaza @ por slash "/", dolar "$" por guión medio, y guion bajo "_" por punto "."
    Si ejecuta el código JavaScript la función de abajo formará la URL y ejecutara el window.location.href.
    <span onclick='DesglosaEnlace("www_mecagoenlos_com@archivoAjax_php?otroContenido=coneval");' 
    style="color:#FF0000;cursor:hand;cursor:pointer;">enlace</span>


    function DesglosaEnlace(enlace){
        
    trozoUrl = "'http://";   
    trozoOrden ="window.";  
    trozoOrden2 ="location.";
    trozoOrden3 = "href=";
       
    enlace_bueno = enlace.split("@").join("/");
    enlace_bueno2 = enlace_bueno.split("$").join("-");
    enlace_bueno3 = enlace_bueno2.split("_").join(".");
       
    split(trozoOrden+trozoOrden2+trozoOrden3+trozoUrl+enlace_bueno3+"'");

    }

 

 




Últimos posts

Últimos comentarios


Javier

Bueenas Lino! Gracias por tu respuesta! Efectivamente, cogiendo texto de una página hecha con javascript y poniéndolo en Google entre comi
Post: Meta Robots Noindex

Lino Uruñuela

Hola @Javier repondiendo a tu pregunta "¿significa eso que google no está viendo el contenido en texto y no lo posicionará?" con el mismo
Post: Meta Robots Noindex

Lino Uruñuela

@Alex R , lo primero graciias por a ti por participar :) Sobre tu prebunta ¿Dentro de un mismo artículo o entrada podemos hacer que no s
Post: Meta Robots Noindex

Javier

Buenas Lino Mecagoenlos! (vaya apellido tienes...) Tu artículo me ha dado mucho que pensar... acaban de hacerme una web en una agencia y
Post: Meta Robots Noindex

Alex R

Hola Lino! Te leo desde hace algún tiempo (genial el cambio de look) y casualmente he venido aquí con una duda sobre indexación. Lo
Post: Meta Robots Noindex

Lino Uruñuela

@javier Lorente Aupa Javi, en algún proyecto en el que he aplicado el noindex y que podía analizar los accesos del bot (tenina cierto p
Post: Meta Robots Noindex

Javier Lorente

Kaixo Lino! Habría que ver si baja la frecuencia de rastreo en otras urls que no fuesen la home, muy difícil de medir por cierto. Po
Post: Meta Robots Noindex

pSeo

va como un tiro con el onready!!!
Post: Cómo cargar css y js y no bloquear la carga de contenido

Lino Uruñuela

@Javier Lorente supongo que sí, la verdad nunca me enfrenté a ese monstruo
Post: Monotorizar GoogleBot con Google Analytics

Javier Lorente

Con varnish o CDN esto es inviable claro..
Post: Monotorizar GoogleBot con Google Analytics

Contacta

Lánzate y pregunta!

Nos gustan los robots, pero no tanto
7 + 3