AI Cutreviews de Google

Miercoles 28 de Mayo del 2025

Pueblicado por Lino Uruñuela

 

Ayer, tuve una duda con el formato de una fecha, concretamente tenía una fecha que parecía formato UTC: 2025-05-26 23:31:45+00:00. Digoa “parecía” porque realmente este no es formato UTC, ya que debería llevar una ‘T’ mayúscula en vez de un espacio entre la fecha y la hora (2025-05-26T23:31:45+00:00), realicé la búsqueda en Google con la query “fecha en España 2025-05-26 23:31:45+00:00” .

La hora eran las 23:31 en hora UTC, esto quiere decir que en España eran dos horas más tarde, por lo cual, la hora que me esperaba de Google hubiera sido las 23:31 en la cadena de texto UTC, en Donosti hubieran sido la 1:31 del día 27 (DÍA SIGUIENTE), pero no, se confundió...

 

Error inicial de Google con la fecha

 

 

En la respuesta que Google generaba mostraba la explicación que Google mostraba debía de sumar ese +2 a la hora UTC para obtener de esta forma la hora local en España. En la explicación, Google detalló que al ser verano solo habría que sumar una hora, pero luego le suma dos horas, el razonamiento no estaba del todo mal, pero la ejecución ya es otra cosa.... Como vemos a continuación cada vez que recargaba me daba un resultado diferente,

Otro resultado diferente de Google

 

 

 

A veces acertaba, a veces fallaba.... Tuvo fallos bastante grandes como añadir 5 horas más, vete a saber por qué. 

Error de Google añadiendo 5 horas

 

 

Otro ejemplo

Segundo error de Google con la fecha

 

El error más común lo cometía con el día, que aunque calculase bien la hora sumando 1 hora a la hora UTC, no pasaba de día al rebasar las 00:00 de la noche, por ejemplo. Si la hora UTC era las 23:30, en formato local de aquí de España, al sumarle una hora, debería cambiar de día, y pasar del 26 al 27, a veces lo hacía a veces no, es más, yo recargaba continuamente la URL y la respuesta y cambiaba, y cambiaba, y cambiaba.

Más errores de Google con el cambio de día

 

 

Pero el colmo fue con las citas....  al principio me mostraba diferentes citas, y daba por hecho de que el contenido o el conocimiento de cómo calcular las fechas lo habría obtenido de los resultados citados, pero cuando me fijé y accedí al contenido que citaba.... Como podéis ver, el contenido es de lo más variopinto, desde Lady Gaga a Sabina.

Cita irrelevante de Lady Gaga

 

 

Sabina y sus ¿fechas de retirada?

Cita irrelevante de Sabina

 

 

¿Qué tiene que ver lo que nos está mostrando como las fuentes de la respuesta con la respuesta? NADA, el contenido que cita no tiene absolutamente nada que ver con el cálculo de fechas, uso horario ni nada parecido. Google no está obteniendo de ahí el contenido, ni el conocimiento, ni los números, ni nada de nada. Creo que muestra citas simplemente por calmar los ánimos al sector, de los creadores de contenido, etc.  A la vista está que Google realmente no está obteniendo datos ni conocimiento de las fuentes que muestra!,

Google está "razonando" para calcular la su respuesta, aunque lo haga mal, pero "echa" las cuentas e intenta seguir unos pasos lógicos sobre cómo calcular la hora que sería en España usando cierto contexto como si es verano o no, pero, ¿por qué nos pone esas citas si es mentira? ¯\_(ツ)_/¯

 

Resultados en inglés para búsquedas en español

El otro día en el Search Live de Madrid Gianlucca me comentó algo que me quedé rumiando en mi cerebro, concretamente me comentó que Google estaba mostrando muchos resultados en inglés para preguntas o consultas que hacían los usuarios en otros idiomas como el español, el italiano, etc, un ejemplo:

 

Ejemplo de resultado en inglés para búsqueda en español

 

Llevo monitorizando serps bastante tiempo, y tengo miles y miles de ejemplos de esto, lo dejaré para otro post, mi duda ahora es ¿por qué Google está mostrando traducidos usando Google Translate? Me recuerda a cuando hacíamos páginas hace 15 años para intentar traducir sin esfuerzo nuestras webs (MFA /made for AdSense) e intentar ganar dinero simplemente añadiendo un widget... pues eso es justamente lo que está haciendo Google y no tiene ningún sentido.

Para algunas búsquedas podría ser útil, quizás la fuente únicamente exista en otro idioma, pero para cuestiones "simples" también selecciona el contenido de fuentes en inglés. Y eso, en mi opinión es un gran error porque  para muchas preguntas el contexto del país y del idioma sean muy relevantes, de nada te valdrá la explicación de coger una rotonda correctamente si te dice que la tomes hacia la izquierda... o para cuestiones legales ya que sus leyes no serán como las nuestras...

Creo que es un error gravísimo lo que está haciendo Google con estos resultados cutremente traducidos, no está prestando atención. Subestima los cientos de millones de usuarios que se darán cuenta de estos fallos, y generará desconfianza. No me acuerdo quién hizo la pregunta en SEO Live  cuándo preguntó por qué salían resultados en inglés en vez de en español, y los Googlers allí presentes respondieron como sorprendidos: “¡Ah, ¿y no es útil mostrar, aunque sea el contenido en inglés, si te lo estoy traduciendo?” No, no es útil. En muchos casos es una respuesta errónea o incompleta.

 

¡Cutre!

¡Cutre! No hay otra palabra para definir el cómo está implementando esto en otros idiomas más allá del inglés, es un método cutre, tacky, lame, bricolé, raffazzonato, schäbig,. ¿Tanta inteligencia artificial, tantos modelos, tantos LLMs, tanta gente, para hacer esta cutrez?

Realmente, creo que no está nada maduro. No sé yo los errores que puede provocar este tipo de respuestas cuando se expandan a otros idiomas, que por lo que estoy viendo, va a tardar bastante en llegar el AI Mode. Ese que han anunciado ya en Estados Unidos y que está activo para todos en Estados Unidos. Tengo la impresión de que vamos a tardar a ver los nuevos AI Mode de Google en otros idiomas que no sean el inglés porque como vemos no es muy confiable, y si no es confiable no será útil, además de que se inventa las fuentes....

 

Cómo podría Google estar escogiendo estas fuentes y/o textos

Publiqué en el blog cómo Google podría estar seleccionando los fragmentos destacados usando una similaridad entre el embedding de la consulta del usuario y los embeddings del los h1, h2, etc jeraquizados de los documentos candidatos en las serps.

Podríamos resumir un poco así a grandes rasgos el proceso:

  1. Generación de Embeddings de la Consulta: Primero, Google convierte tu consulta en un vector de embeddings.

  2. Comparación de Similitud: Luego, compara este vector con los embeddings de fragmentos de cada uno de los documentos recuperados para encontrar el que más se asemeje.

  3. Consideración de la Jerarquía de Encabezados: Google también tiene en cuenta la similitud/cercanía de cada fragmento candidato con sus encabezados (H1, H2, H3, etc.) superiores jerárquicamente. Posiblemente "sume" la similitud que hay entre el fragmento candidato y la concatenación de los Hx que están jerárquicamente en su nivel superior inmediato hasta llegar al título.

Pero no todos los embeddings son iguales, ni valen para la misma tarea,  por ejemplo, para hacer una búsqueda semántica para obtener cuán de parecido es el significado de dos textos podría ser un tipo de embeddings que pueden ser útiles a la hora obtener determinado contenido duplicado. Imagina que quieres ver la similitud entre los diferentes titles de los artículos de blog, en este caso podrías hacer una comparación de similitud por embeddings para cada título de un artículo con el resto de títulos, aquellos que su similitud sea mayor que cierto umbral podrías calificarlos como duplicados. Ese sería un ejemplo de embeddings de similaridad semántica.

Como expliqué, para la pregunta “¿por qué el cielo es azul?” la respuesta no va a ser lo más parecido semánticamente a esa frase, recordad que la similitud no significa relevancia. La respuesta posiblemente sea mucho más larga y no notaremos ese parecido semántico que subyace a las palabras y al contexto y que hace que los LLMs parecen que hagan magia al obtener estas relaciones subyacentes que hay en las palabras.

La respuesta no será lo más parecido a “por qué el cielo es azul”, la respuesta será, por ejemplo : “el cielo es azul porque está compuesto mayoritariamente de oxígeno y la temperatura a la que está la Tierra en temperatura ambiente, en la atmósfera, y cómo recibe nuestro propio ojo la radiación y cómo provoca las vibraciones en el ozono, pues lo vemos azul”. Como véis la respuesta a una pregunta breve  podría ser muy diferente a la pregunta y no es similar como lo entendemos comúnmente.

El que veamos cómo Google responde en inglés a preguntas en otros idiomas creo que podría ser una pista sobre el tipo de embeddings que podría usar Google para obtener estas respuestas, por ejemplo estos nuevos embeddings de Gemini podrían estar detrás de esos resultados, son pistas que nos puede orientar en qué ir ajustando / mejorando / probando diferentes métodos y métricas que nos indiquen si un cambio en determinadas partes del texto es positivo o negativo.


 




Lea otros artículos de Inteligencia Artificial para SEOs

Últimos posts

Últimos comentarios


Lino
@spamloco a tí r hacerme ver que no soy al único que le importa :p A ver si nos vemos!
Post: ¿Cómo decide Google que URL debe rastrear?

Alejandro
Gracias Lino, siempre investigando un poco más allá.
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
3,2,1... Gracias a ti Pedro!! y sí, parece que los humanos somos expertos en haciendo ruido cuando intentamos que alguien nos escuche... :p
Post: ¿Cómo decide Google que URL debe rastrear?

Pedro
1,2...1,2... probando. Gracias por el artículo, verdaderamente interesante ver cómo no paramos de generar ruido :)
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
Funcionan!! Ahora solo tengo que generar engagement :D A ver si quito lo de avisar por Twitter... no sé cuántos años llevará sin funcio
Post: ¿Cómo decide Google que URL debe rastrear?

Juanan Carapapa
Yo también vengo a probar los comentarios, probando probando xD
Post: ¿Cómo decide Google que URL debe rastrear?

Lino2
Hola @errioxa que tal
Post: ¿Cómo decide Google que URL debe rastrear?

Lino2
Hola
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
Probando!
Post: ¿Cómo decide Google que URL debe rastrear?

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos