¿Qué es Query Fan Out?

Publicado por Lino Uruñuela. actualizado el

Query fan-out es una técnica que utilizan los buscadores basados en IA (por ejemplo el Modo AI de Google) que descompone una consulta compleja en múltiples subconsultas más específicas.

Query fan-out es especialmente útil para búsquedas ambiguas o complejas ya que al hacer multiples consultas cubre las diferentes intenciones y muestra resultados que no hubiera obtenido si solamente utiliza la consulta orignal. Esta diversidad aumenta la probabilidad de obtener resultados relevantes y veraces que reducem el el riesgo de alucinaciones

Por ejemplo, imagina que un usuario pregunta: "¿Cómo planificar un viaje a Japón en primavera?". Un buscador que aplique query fan-out descompone la consulta en varias subconsultas que cubren distintas facetas de la intención:

  • clima en Japón en abril y mayo → faceta meteorológica
  • mejores lugares para ver sakura → faceta de atracciones naturales
  • festivales de primavera Japón 2025 → faceta cultural/temporal
  • precio medio de vuelos Madrid-Tokio en abril → faceta de costes y logística
  • requisitos de visado para españoles en Japón → faceta legal/documental
  • itinerario de 10 días Japón primavera → faceta de planificación detallada

 

Al ejecutar todas estas subconsultas en paralelo, el motor recoge información diversa (clima, eventos, costes, requisitos, rutas) y genera una respuesta más completa y fiable, reduciendo el riesgo de omitir aspectos importantes para el viaje.

Ejemplo de consulta usando query fan-out

La técnica Query fan out es muy útil en el contexto de las búsquedas con lenguaje natural, donde la consulta original puede ser ambigua o compleja. Al obtener resultados de múltiples subconsultas con distintos términos relevantes, aumenta la probabilidad de ofrecer una respuesta más pertinente que con una sola consulta.

Query fan-out y SEO

En las últimas semanas ha crecido el interés por el término Query Fan Out. Aunque es relevante, quizá no sea tan determinante como su actual «hype». Los SEOs lo han incorporado a raíz de las respuestas generativas en Google para entender mejor el buscador y optimizar su visibilidad en el nuevo contexto de los grandes modelos de lenguaje.

Hoy en día la búsqueda de Google (y cualquier buscador avanzado) va mucho más allá de la simple coincidencia de palabras clave. Sistemas con IA proporcionan resultados más relevantes, búsquedas personalizadas y respuestas generativas basadas en los datos recuperados.

Diagrama de flujo que muestra la expansión de consultas mediante query fan-out

 

También es cierto que cuando se comprende cómo los buscadores emplean esta técnica, los SEOs pueden refinar sus metodologías para lograr mejores resultados y aumentar la visibilidad. Por ejemplo, al examinar variaciones de una consulta, se pueden identificar palabras clave relevantes y usarlas para mejorar la calidad del contenido.

Ya nos lo habían dicho

Quizá a más de uno le sorprenda escuchar estas palabras de Gary Illyes; simplemente no les habíamos prestado tanta atención.

Para comprender mejor cómo funciona la búsqueda de Google, una de las mejores fuentes es la propia documentación de Google Cloud, concretamente la de Vertex AI Search.

Configuración para implementar Query Fan Out

La información más relevante sobre el funcionamiento actual de Google se encuentra en las especificaciones de configuración de Vertex AI Search para crear un buscador personalizado basado en tus datos (web o documentos internos).

La documentación describe varias opciones para tratar las consultas de los usuarios. En los Controles lingüísticos encontramos:

  • Sinónimo: Expande los sinónimos considerados para una búsqueda.
  • Sinónimo unidireccional: Expande sinónimos de forma unidireccional para términos específicos.
  • Ignorar: Evita que un término se use en la búsqueda.
  • No asociar: Impide el uso de ciertos términos cuando aparecen otros específicos.
  • Reemplazo: Sustituye términos en la búsqueda.

Estas configuraciones permiten generar múltiples queries en paralelo. En Vertex debes definir manualmente los sinónimos, mientras que Google lo hace automáticamente con un LLM especializado.

Además, la documentación detalla los tipos de respuestas generativas y cómo se obtienen.

Tipos de respuestas generativas

Fragmentos

Textos breves extraídos de cada documento resultado. Incluyen resaltado de hits en etiquetas <strong> y se muestran como vista previa para ayudar al usuario a decidir si hace clic.

Respuestas extractivas

Secciones de texto copiadas literalmente de un documento. Pueden ser párrafos, tablas o listas con viñetas y suelen ser más breves que los segmentos extractivos.

Segmentos extractivos

Secciones textuales más extensas que las respuestas extractivas; pueden incluir varios párrafos, tablas o listas. Se usan a menudo como entrada para LLM propios.

Conociendo estas categorías, podemos definir mejor las características del contenido idóneo para que Google lo seleccione como fuente en sus respuestas generativas.

En próximas publicaciones analizaré cómo ponderar las diferentes señales de relevancia (documento, sitio y datos históricos de usuarios) al ordenar los resultados.

 




Lea otros artículos de Inteligencia Artificial para SEOs

Últimos posts

Últimos comentarios


Lino
@Emil8ano, no son tokens, son caracteres... Pero estoy casi seguro que el limite de texto en cada llamada aumentará rápidamente.
Post: aNótame: extensión para guardar notas y generar resumenes usando Gemini de manera local

Emiliano
Gran idea! Pregunta. Los 8000 caracteres no son tokens no? Si es así ojo que sin 8000 entre entrada y salida. O sea si te comes 6000 de ent
Post: aNótame: extensión para guardar notas y generar resumenes usando Gemini de manera local

Lino
@spamloco a tí r hacerme ver que no soy al único que le importa :p A ver si nos vemos!
Post: ¿Cómo decide Google que URL debe rastrear?

Alejandro
Gracias Lino, siempre investigando un poco más allá.
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
3,2,1... Gracias a ti Pedro!! y sí, parece que los humanos somos expertos en haciendo ruido cuando intentamos que alguien nos escuche... :p
Post: ¿Cómo decide Google que URL debe rastrear?

Pedro
1,2...1,2... probando. Gracias por el artículo, verdaderamente interesante ver cómo no paramos de generar ruido :)
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
Funcionan!! Ahora solo tengo que generar engagement :D A ver si quito lo de avisar por Twitter... no sé cuántos años llevará sin funcio
Post: ¿Cómo decide Google que URL debe rastrear?

Juanan Carapapa
Yo también vengo a probar los comentarios, probando probando xD
Post: ¿Cómo decide Google que URL debe rastrear?

Lino2
Hola @errioxa que tal
Post: ¿Cómo decide Google que URL debe rastrear?

Lino2
Hola
Post: ¿Cómo decide Google que URL debe rastrear?