Publicado por Lino Uruñuela el 2025-07-02
Hoy en día la búsqueda de Google, y cualquier motor de búsqueda medianamente decente, es mucho más compleja que obtener resultados en base a la coincidencia de palabras clave. Sistemas como la actual búsqueda de Google usan la IA para devolver los resultados más relevantes, búsquedas personalizadas, y generar respuestas de IA basadas en los datos obtenidos.
La expansión de consultas (o Query Fan-Out en inglés) es una técnica que consiste en ejecutar diferentes búsquedas para ampliar el número de resultados y así mejorar la recuperación de información.
En los últimos días / semanas estamos viendo cómo el término Query Fan-Out y aunque creo que es algo relevante, no creo que sea tan determinante como el hype que ha generado. Como SEOs, este concepto lo hemos aprendido con la llegada de las respuestas generativas en los resultados de Google en nuestro afán de conocer cómo funciona Google y cómo podemos mejorar nuestra visibilidad en este nuevo mundo de los grandes modelos de lenguaje.
Pero quizás más de uno os sorprendáis escuchando estas palabras a Gary Illyes, lo que pasa es que no le dábamos tanta importancia
Para comprender mucho mejor cómo funciona actualmente la búsqueda de Google una de las mejores fuentes de información es la propia documentación de Google... no, no hablo de la documentación para SEOs / developers sobre el buscador sino en la documentación de Google Cloud, concretamente la documentación de Vertex AI Search
La información más relevante para comprender cómo podría estar funcionando Google actualmente creo que se encuentra en las especificaciones de cómo configurar el Vertex AI Search para implementar un buscador personalizado basado en tus propios datos, ya sea tu web, como los documentos internos de tu empresa.
La documentación explica las diferentes opciones a la hora de tratar las búsquedas de los usuarios, concretamente en Controles lingüísticos nos encontramos con la siguiente información relevante:
Personaliza la lingüística de las búsquedas. Solo está disponible para la búsqueda. Existen varios tipos de controles lingüísticos disponibles:
Estas opciones son las que se podrían configurar para generar esas múltiples queries en paralelo que realiza Google desde que implementó la IA en el buscador. En este caso, la definición de los sinónimos para expandir las consultas de búsqueda debemos definirla nosotros mismos cosa que el buscador de Google lo hará automáticamente usando un LLM especializado en esa tarea para tratar las consultas de los usuarios.
En esta documentación de Vertex, no solamente hay información de cómo se implementan estas tareas que mejoran los resultados de un buscador, también nos da información al detalle sobre los tipos de respuestas generativas que puede mostrar y cómo obtiene cada una.
Según la documentación existen los siguientes tipos de respuestas basadas en los datos de los resultados
Los fragmentos son textos breves extraídos de cada documento de resultado de la búsqueda. Incluyen el resaltado de hits en etiquetas HTML en negrita para renderizar vistas previas de los resultados de la búsqueda en una IU. Por lo general, los fragmentos se renderizan como texto de vista previa debajo de un resultado de la búsqueda para ayudar a los usuarios finales a decidir si hacer clic en ese resultado de la búsqueda será útil.
Una respuesta extractiva es una sección de texto que se extrae textualmente de un documento. Cuando se muestra un documento como resultado de una búsqueda en una respuesta de búsqueda, se puede mostrar una respuesta extractiva relevante con ese resultado.
Una respuesta extractiva puede ser texto, como un párrafo, una tabla o una lista con viñetas, que se extrae del documento de resultados de la búsqueda. Las respuestas extractivas son más breves que los segmentos extractivos.
Las respuestas extractivas se pueden usar como alternativa a las respuestas resumidas en los casos en que se prefieren respuestas precisas y textuales a los resúmenes reformulados.
Un segmento extractivo es una sección de texto que se extrae textualmente de un documento de resultados de la búsqueda. Los segmentos extractivos son similares a las respuestas extractivas, pero suelen ser más completos y detallados. Por lo general, los segmentos extractivos se usan como entrada para tus propios LLM para generar respuestas o texto nuevo.
Los segmentos extractivos pueden ser varios párrafos, incluido texto con formato, como tablas y listas con viñetas.
Sabiendo esto, podemos pensar con mejor criterio qué características debería tener el contenido ideal para aumentar las posibilidades de ser seleccionado como fuente de la respuesta que genere en las consultas de los usuarios.
En siguientes posts analizaré las opciones que existen para ponderar el peso de las diferentes características / señales tanto a nivel de documento, como de site como de datos históricos de usuarios a la hora de ordenar los resultados.