Publicado por Lino Uruñuela. actualizado el
Query fan-out es una técnica utilizada por los buscadores con IA como Google AI Mode, que consiste en descomponer, y si hace falta, expandir la consulta inicial que puede ser ambigua o demasiado general, en un conjunto de subconsultas más específicas diseñadas para captar distintos matices o enfoques que la consulta inicial podría no cubrir por sí sola. Todas las subconsultas se ejecutan en paralelo y los resultados se unifican para ofrecer información relevante que luego será usada para generar la respuesta final. Por ejemplo, un usuario pregunta: "¿Cómo planificar un viaje a Japón en primavera?". Query fan out descompone la consulta original en las siguientes subconsultas:
Al ejecutar todas estas subconsultas en paralelo, el motor recoge información diversa (clima, eventos, costes, requisitos, rutas) y genera una respuesta más completa y fiable, reduciendo el riesgo de omitir aspectos importantes para el viaje.
Pongamos un ejemplo práctico, si un usuario intenta encontrar una canción en Google basándose en un fragmento que más o menos recuerda y busca: "A ti, te gusta el pipiripí pipí, de la bota empila" pero la letra correcta es "A mí, me gusta el pipiripí pipí, con la bota empinar...". el buscador realizara una búsqueda exacta, lo más seguro es que no obtuvise resultados.
Al aplicar Query Fan-out, el sistema descompone y expande esa consulta errónea en varias subconsultas complentarias y/o derivadas:
Otro ejemplo, si un usuario pregunta: zapatillas running. Un buscador que aplique query fan-out descompone la consulta en varias subconsultas que cubren distintas facetas de la intención:
El problema del desajuste de vocabulario, es uno de los desafíos más antiguos en la recuperación de información, que ocurre cuando las palabras que utiliza el usuario en su consulta no coinciden exactamente con las palabras que aparecen en los documentos buscados.
La técnica Query fan out es muy útil en el contexto de las búsquedas con lenguaje natural, donde la consulta original puede ser ambigua o compleja. Al obtener resultados de múltiples subconsultas con distintos términos relevantes, aumenta la probabilidad de ofrecer una respuesta más pertinente que con una sola consulta.
Se pueden generar subconsultas basadas en la intención, el contexto o la ubicación del usuario, para cubrir diferentes interpretaciones e intenciones de búsqueda que el usuario no ha especificado directamente al hacer la búsqueda.
Obtener resultados de diversas búsquedas aumenta la probabilidad de que la información que necesita el usuario se encuentre en los resultados. La IA valorará y seleccionará la información en estos resultados para generar una respuesta adecuada. Al basar su respuesta en esta información disminuye la probabilidad de que la respuesta contenga errores o alucinaciones.
Para los SEOs, el uso de query fan out por parte de los buscadores es una oportunidad porque permite optimizar más detalladamente cada sección de contenido y mejorar la visibilidad en los resultados generados con IA. Al comprender cómo funciona esta técnica, los GEO / SEOs pueden crear contenido más completo que cubra los aspectos relevantes de las SERPs e intentar obtener tráfico potencial en el nuevo contexto de los grandes modelos de lenguaje.
Hoy en día la búsqueda de Google (y cualquier buscador avanzado) va mucho más allá de la simple coincidencia de palabras clave. Sistemas con IA proporcionan resultados más relevantes, búsquedas personalizadas y respuestas generativas basadas en los datos recuperados.
La implementación de Query Fan-Out no es sencilla ni mucho menos ya que requiere un análisis cuidadoso de las consultas de los usuarios y la creación de subconsultas que aborden las diferentes posibles interpretaciones. Cuando lo haces a escala es una tarea realmente complicada y hay que tener mucho conocimiento sobre Machine Learning, además de una gran cantidad de datos.
Es importante utilizar herramientas de análisis de datos para identificar las consultas más comunes y crear subconsultas que respondan a esas consultas.
También es cierto que cuando se comprende cómo los buscadores emplean esta técnica, los SEOs pueden refinar sus metodologías para lograr mejores resultados y aumentar la visibilidad. Por ejemplo, al examinar variaciones de una consulta, se pueden identificar palabras clave relevantes y usarlas para mejorar la calidad del contenido.
Quizá a más de uno le sorprenda escuchar estas palabras de Gary Illyes; simplemente no les habíamos prestado tanta atención.
Para comprender mejor cómo funciona la búsqueda de Google, una de las mejores fuentes es la propia documentación de Google Cloud, concretamente la de Vertex AI Search.
La información más relevante sobre el funcionamiento actual de Google se encuentra en las especificaciones de configuración de Vertex AI Search para crear un buscador personalizado basado en tus datos (web o documentos internos).
La documentación describe varias opciones para tratar las consultas de los usuarios. En los Controles lingüísticos encontramos:
Estas configuraciones permiten generar múltiples queries en paralelo. En Vertex debes definir manualmente los sinónimos, mientras que Google lo hace automáticamente con un LLM especializado.
Además, la documentación detalla los tipos de respuestas generativas y cómo se obtienen.
Textos breves extraídos de cada documento resultado. Incluyen resaltado de hits en etiquetas <strong> y se muestran como vista previa para ayudar al usuario a decidir si hace clic.
Secciones de texto copiadas literalmente de un documento. Pueden ser párrafos, tablas o listas con viñetas y suelen ser más breves que los segmentos extractivos.
Secciones textuales más extensas que las respuestas extractivas; pueden incluir varios párrafos, tablas o listas. Se usan a menudo como entrada para LLM propios.
Conociendo estas categorías, podemos definir mejor las características del contenido idóneo para que Google lo seleccione como fuente en sus respuestas generativas.
En próximas publicaciones analizaré cómo ponderar las diferentes señales de relevancia (documento, sitio y datos históricos de usuarios) al ordenar los resultados.