Publicado por Lino Uruñuela 2025-08-20 (agosto del 2025)
El otro día os comentaba como estaba usando la IA para mi día a día como SEO, hoy os quiero compartir otro ejemplo de cómo podemos obtener valor al realizar cosas que hace dos años las habría descartado por ser demasiado laboriosas en cuanto a programación.
Creo que no se le está dando la suficiente importancia a la integración de LLMs en el propio navegador, concretamente me refiero a la integración que Google está haciendo de sus modelos más pequeños de Gemini y que ya podemos ejecutar desde nuestro navegador como otras APIs.
En el post sobre la extensión aNotame que usa IA para traducir y resumir el contenido de una página web expliqué cómo estaba practicando / probando / aprendiendo qué se puede hacer con estas integraciones de LLMs en el navegador. Podéis instalar y probar la extensión a la que he añadido algunas mejoras como poder usar un prompt personalizado, pero no quiero enredarme ahora con las distintas opciones de la extensión, podéis instalarla y probarla instalándola en Chrome.
Hoy quería enseñaros otra extensión que estoy creando, el uso de Prompt API de momento está habilitado para versiones de Chrome 138 o superiores y solo se puede usar desde extensiones, posiblemente en breve se podrá usar como cualquier otra API JavaScript del navegador Chrome, pero supongo que para probar e ir viendo cómo los desarrolladores la usamos y qué riesgos aparecen según vayamos desarrollando cosas, porque como estamos viendo cada vez más frecuentemente los usos que los desarrolladores podemos dar a la IA son inescrutables, tanto para bien como para mal.
Esta nueva extensión a la que he llamado 'Pairwise Passage Ranking' extrae las URLs de los resultados de búsqueda de Google y accede a cada uno para obtener el contenido principal de cada resultado.
Los pasajes suelen ser fragmentos de texto que si lo leemos sin otro contexto tienen un significado por sí mismos, pero en el ámbito SEO el caso de uso es responder a una keyword concreta (llámele keyword, query, consulta, término de búsqueda, etc) y conseguir aparecer en las respuestas generadas por IA que vemos en los resultados de Google.
Para extraer el contenido principal de un documento HTML realizo algunas técnicas básicas como intentar eliminar elementos HTML que no suelen ser el contenido del artículo en sí mismo, por ejemplo la barra de navegación, breadcrumbs, enlaces del footer, scripts y otros elementos HTML que, a priori, suelen ser significativamente menos importantes.
Una vez tenemos el contenido principal de cada resultado vamos a usar la IA integrada en el navegador Chrome para extraer un número n de pasajes de cada resultado, por defecto lo he configurado en 2 pasajes,
Queremos extraer el pasaje que mejor responda a la búsqueda que hayamos hecho en Google, ya que dependiendo de la búsqueda que hagamos serán unos y otros pasajes los que mejor responden a la intención de esa búsqueda concreta. Por lo tanto, para cada resultado en las SERPs de Google:
Una vez tenemos los pasajes de cada resultado, vamos a hacerlos competir entre ellos para intentar averiguar cuál es el mejor de todos respondiendo a los términos de búsqueda del usuario, intentando emular a Google cuándo presenta resultados AI Mode. Hoy por hoy, CREO, que uno de los métodos que mejor funcionan con los LLM a la hora de crear una clasificación ordenada es realizar una comparación por pares (pairwise).
En la comparación por pares se le pide al LLM (que hará de juez) que evalúe dos pasajes, preguntando cuál responde mejor a la consulta de búsqueda. Podríamos tener la tentación de pasarle todos los pasajes y que nos devuelva una lista de pasajes ordenada, pero los LLMs no son buenos ordenando listas de resultados. En cambio a la IA se le da mucho mejor comparar y decir cuál es mejor que otro, así que vamos a comparar todos los pasajes unos con otros e ir creando una lista ordenada en base a "victorias" entre las diferentes comparaciones.
Antes de comparar los pasajes de cada resultado vamos a seleccionar el ganador de entre los pasajes extraídos de una misma URL. Preguntamos cuál responde mejor la consulta del usuario y al ganador le sumamos un punto de victoria, por ejemplo, de la URL1 hemos obtenido URL1- Pasaje1 y URL1- Pasaje2 y le preguntamos al LLM ¿Cuál de estos dos pasajes responde mejor a la {query}? (la kw que has realizado en Google).
Ahora ya tenemos un pasaje ganador por cada resultado en las serps, y lo que vamos a hacer es comparar unos con otros (por pares) para saber cuál es el mejor. Para ello comparamos
Cada vez que uno gane le sumamos un punto, y cuando hayamos comparado todos con todos podremos determinar el ganador. Además, podemos pedirle al LLM que explique el por qué, o que nos indique mejoras para que nuestro pasaje sea mejor que el ganador....
Espero mejorar y añadir més métodos para extraer y puntuar los pasajes, con la intención de ir acercándome a los criterios que Google podría usar, siempre dentro de la humildad del que sabe que no sabe nada (comparado con los doctorados en matemáticas de Google). Porque todo esto son matemáticas muy chungas, que sinceramente creo que nadie de los que lean esto llegan a entender, por supuesto yo tampoco, pero debemos de entender que hay cosas que se nos escapan y que los métodos que usa Google son métodos muy muy matemáticos.
Pero eso no quita para que de manera más terrenal aprendamos cómo funciona de manera superficial, pero seguramente suficiente para poder mejorar nuestro contenido de manera que sea más probable de ser seleccionado para aparecer en los resultados de AI Mode y en los reultados de otros LLMs
Esta semana o como muy tarde la siguiente os compartiré la etensión para que la podáis instalar y tanbién el código fuente para que veaís cómo la he desarrollado, bueno yo no, Gemini + chatGPT... en esto soy promiscuo.
Os dejo un pequeño vídeo que quizás aclare alguna duda,
Acepto sugerencias... y críticas si empiezan oir la letra 'R'.. si n no :p