Query Fan-Out o Expansión de Consultas

Publicado por Lino Uruñuela el 2025-07-02

 

Hoy en día la búsqueda de Google, y cualquier motor de búsqueda medianamente decente, es mucho más compleja que obtener resultados en base a la coincidencia  de palabras clave. Sistemas como la actual búsqueda de Google usan la IA para devolver los resultados más relevantes, búsquedas personalizadas, y generar respuestas de IA basadas en los datos obtenidos.

 

¿Que son las Query Fan-Out?

La expansión de consultas (o Query Fan-Out en inglés) es una técnica que consiste en ejecutar diferentes búsquedas para ampliar el número de resultados y así mejorar la recuperación de información.

En los últimos días / semanas estamos viendo cómo el término Query Fan-Out y aunque creo que es algo relevante, no creo que sea tan determinante como el hype que ha generado. Como SEOs, este concepto lo hemos aprendido con la llegada de las respuestas generativas en los resultados de Google en nuestro afán de conocer cómo funciona Google y cómo podemos mejorar nuestra visibilidad en este nuevo mundo de los grandes modelos de lenguaje.

 

 

Ya nos lo habían dicho

Pero quizás más de uno os sorprendáis escuchando estas palabras a Gary Illyes, lo que pasa es que no le dábamos tanta importancia

 

 

Para comprender mucho mejor cómo funciona actualmente la búsqueda de Google una de las mejores fuentes de información es la propia documentación de Google... no, no hablo de la documentación para SEOs / developers sobre el buscador sino en la documentación de Google Cloud, concretamente la documentación de Vertex AI Search

 

Configuración para implementar Query Fan-Out

La información más relevante para comprender cómo podría estar funcionando Google actualmente creo que se encuentra en las especificaciones de cómo configurar el Vertex AI Search para implementar un buscador personalizado basado en tus propios datos, ya sea tu web, como los documentos internos de tu empresa.

La documentación explica las diferentes opciones a la hora de tratar las búsquedas de los usuarios, concretamente en Controles lingüísticos nos encontramos con la siguiente información relevante:


Personaliza la lingüística de las búsquedas. Solo está disponible para la búsqueda. Existen varios tipos de controles lingüísticos disponibles:

    • Sinónimo: Expande los sinónimos considerados para una búsqueda.
    • Sinónimo unidireccional: Expande los sinónimos considerados unidireccionalmente para términos específicos.
    • Ignorar: evita que un término se use en las búsquedas.
    • No asociar: Evita que se usen términos en las búsquedas cuando aparecen términos específicos.
    • Reemplazo: reemplaza los términos en la búsqueda.

 

Estas opciones son las que se podrían configurar para generar esas múltiples queries en paralelo que realiza Google desde que implementó la IA en el buscador. En este caso, la definición de los sinónimos para expandir las consultas de búsqueda debemos definirla nosotros mismos cosa que el buscador de Google lo hará automáticamente usando un LLM especializado en esa tarea para tratar las consultas de los usuarios.

En esta documentación de Vertex, no solamente hay información de cómo se implementan estas tareas que mejoran los resultados de un buscador, también nos da información al detalle sobre los tipos de respuestas generativas que puede mostrar y cómo obtiene cada una.

 

Tipos de respuestas generativas

Según la documentación existen los siguientes tipos de respuestas basadas en los datos de los resultados

Fragmentos

Los fragmentos son textos breves extraídos de cada documento de resultado de la búsqueda. Incluyen el resaltado de hits en etiquetas HTML en negrita para renderizar vistas previas de los resultados de la búsqueda en una IU. Por lo general, los fragmentos se renderizan como texto de vista previa debajo de un resultado de la búsqueda para ayudar a los usuarios finales a decidir si hacer clic en ese resultado de la búsqueda será útil.

 

Respuestas extractivas

Una respuesta extractiva es una sección de texto que se extrae textualmente de un documento. Cuando se muestra un documento como resultado de una búsqueda en una respuesta de búsqueda, se puede mostrar una respuesta extractiva relevante con ese resultado.

Una respuesta extractiva puede ser texto, como un párrafo, una tabla o una lista con viñetas, que se extrae del documento de resultados de la búsqueda. Las respuestas extractivas son más breves que los segmentos extractivos.

Las respuestas extractivas se pueden usar como alternativa a las respuestas resumidas en los casos en que se prefieren respuestas precisas y textuales a los resúmenes reformulados.

 

Segmentos extractivos

Un segmento extractivo es una sección de texto que se extrae textualmente de un documento de resultados de la búsqueda. Los segmentos extractivos son similares a las respuestas extractivas, pero suelen ser más completos y detallados. Por lo general, los segmentos extractivos se usan como entrada para tus propios LLM para generar respuestas o texto nuevo.

Los segmentos extractivos pueden ser varios párrafos, incluido texto con formato, como tablas y listas con viñetas.

Sabiendo esto, podemos pensar con mejor criterio qué características debería tener el contenido ideal para aumentar las posibilidades de ser seleccionado como fuente de la respuesta que genere en las consultas de los usuarios.

En siguientes posts analizaré las opciones que existen para ponderar el peso de las diferentes características / señales tanto a nivel de documento, como de site como de datos históricos de usuarios a la hora de ordenar los resultados.

 

 




Lea otros artículos de Inteligencia Artificial para SEOs

Últimos posts

Últimos comentarios


Lino
@spamloco a tí r hacerme ver que no soy al único que le importa :p A ver si nos vemos!
Post: ¿Cómo decide Google que URL debe rastrear?

Alejandro
Gracias Lino, siempre investigando un poco más allá.
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
3,2,1... Gracias a ti Pedro!! y sí, parece que los humanos somos expertos en haciendo ruido cuando intentamos que alguien nos escuche... :p
Post: ¿Cómo decide Google que URL debe rastrear?

Pedro
1,2...1,2... probando. Gracias por el artículo, verdaderamente interesante ver cómo no paramos de generar ruido :)
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
Funcionan!! Ahora solo tengo que generar engagement :D A ver si quito lo de avisar por Twitter... no sé cuántos años llevará sin funcio
Post: ¿Cómo decide Google que URL debe rastrear?

Juanan Carapapa
Yo también vengo a probar los comentarios, probando probando xD
Post: ¿Cómo decide Google que URL debe rastrear?

Lino2
Hola @errioxa que tal
Post: ¿Cómo decide Google que URL debe rastrear?

Lino2
Hola
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
Probando!
Post: ¿Cómo decide Google que URL debe rastrear?

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos