Expresiones regulares para SEO (Google Search Console)


Publicado el 8 de julio del 2021 por Lino Uruñuela

expresiones regulares en Google Search Console


Hace poco Google Search Console anunciaba una de sus opciones más deseadas, poder filtrar usando expresiones regulares. No voy a ponerme a explicar qué son las expresiones regulares y para qué se pueden usar, ya hay información muchísimo mejor que la que yo pueda ofrecer sobre qué son y cómo se crean!

Una frase de la que no me olvidaré nunca me la dijo mi buen amigo Carlos Redondo

"Las expresiones regurales son lo contrario a la homeopatía, nadie las entiende, pero funcionan"


Y sinceramete no veo frase más apropiada para definir el conocimiento que hay sobre ellas, y yo en eso, soy uno más!!

Este post es, como veréis, breve, pero espero que poco a poco vaya creciendo ya que iré dejandó aquí aqullas expresiones regulares que me parezcan útiles para el SEO, y especialmente para su uso en Search Console.


¿Qué expresiones regulares acepta Google Search Console?


Debemos saber que Google Search Console, en teoría, acepta expresiones regulares RE2 y nos da algunos ejemplos, aunque se lo podían haber currado un poquito más ;)

Así que sin más esperas aquí dejo algunas de las expresiones regulares que nos podrían servir de ayuda 



Expresiones regulares útiles para Google Search Console


 ¿Qué hace?
 Expresión Regular
 Ejemplo de resultado
 Palabras que llevan tilde, el filtro es sensible a las tildes!  c[óo]mo  cómo y como
 Tipicas preguntas  (cu[aá]ndo)|(d[oó]nde)|(c[óo]mo)  Cualquiera de esas KWs
Una única palabra ^([^\s]+)$ palabra1 pero no palabra1 palabra2
 Dos palabras  ^([^\s]+)\s([^\s]+)$  palabra1 palabra2
 Tres palabras  ^([^\s]+)\s([^\s]+)\s([^\s]+)$  palabra1 palabra2 palabra3
Cuatro palabras   ^([^\s]+)\s([^\s]+)\s([^\s]+)\s([^\s]+)$  palabra1 palabra2 palabra3 palabra4
 Al menos una palabra dos caracteres y toda la frase teremina en dos digitos  ^[a-z]{2,}\s\d\d$ palabra1 47
 Expresiones regularas para aplicar en URLs
http o https http[s]?:\/\/mydomain\.dev https://www.mydomain.dev http://mydomain.dev
 Contiene "www" o "m" o ninguna de las dos  http[s]?:\/\/((m|www)\.)?mydomain\.dev https://mydomain.dev
https://m.mydomain.dev
https://www.mydomain.dev
http://mydomain.dev
Contiene al menos un directorio
 http[s]?:\/\/((m|www)\.)?mydomain\.com\/([^\/]+)\/  
https://mydomain.dev
https://mydomain.dev/directorio/

 Al menos dos directorios  http[s]?:\/\/((m|www)\.)?mydomain\.dev\/([^\/]+)\/([^\/]+)\/   https://mydomain.dev/directorio/directorio2/
Exactamente tres directorios http[s]?:\/\/((m|www)\.)?mydomain\.dev\/([^\/]+)\/([^\/]+)\/([^\/]+)\/([^\/]+)?$   https://mydomain.dev/directorio/directorio2/directorio3/
directorio + path http[s]?:\/\/((m|www)\.)?mydomain\.dev\/([^\/]+)\/([^\/]+)$  https://mydomain.dev/directorio/url.html
 No contiene directorios  http[s]?:\/\/((m|www)\.)?mydomain\.dev\/([^\/]+)$  https://mydomain.dev/url.html
El primer directorio podría ser /amp/ o no serlo  http[s]?:\/\/((m|www)\.)?mydomain\.dev\/(amp\/)?directorio\/url.html   https://mydomain.dev/amp/directorio/url.html

 https://mydomain.dev/directorio/url.html
Sin parámetros  http[s]?:\/\/((m|www)\.)?mydomain\.dev\/([^\?]+)$   https://mydomain.dev/directorio/url.html

pero no:  https://mydomain.dev/directorio/url.html?hola=adios

 

 

Como he comentado al principio este artículo no va de grandes explicaciones sino de hacer una tabla / guía práctica para usos comunes al filtrar datos en Google Search Console utilizando expresiones regulares.

Os invito a enviar en los comentarios aquellas que creáis útiles y las añadiré con su respectivo enlace, a ver si así se anima alguien a añadir más :p

Y revisad de vez en cuando este artículo porque iré añadiendo más y más ejemplos y casos de uso.

 

 

 

 


Ver 2 comentarios

 Comentar

 


Javier (@iurisnow)hace Hace más de 3 años y 154 días

Gracias Lino!



Lea otros artículos de Google Search Console

Últimos posts

Últimos comentarios


Joakim Hov Johnsen

Post: Experimento para comprobar la teoría del primer enlace

Dana

Post: Experimento para comprobar la teoría del primer enlace

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos

Señor Muñoz
Lino, el 11% más de clicks y el 47% más de impresiones diarias ¿es algo constante o depende de cada sitio web?
Post: Diferencias entre la exportación de datos de Search Console usando BigQuery o usando la API

Carlos
Hola En mi blog tengo artículos atemporales (es decir, no caducan nunca, de manera que sirve para quien lo lea hoy o lo lea dentro de 5
Post: Tratamiento de urls que tienen un tiempo de vida muy corto

Profe Ray
Veo que hay comentarios de hace 5 años y de hace 3 años. ¿Habrá algun post actualizado sobre este tema o sigue funcionando? Lo cierto es
Post: Cómo cargar css y js y no bloquear la carga de contenido

Pepe
Muchas gracias por el articulo!! Muy buena información.
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

María
Sí, he buscado el archivo robots.txt y todo está correcto. La última versión vista con error fue el 08/11/2021 y la última vez que el
Post: Errores críticos originados por el robots.txt

Lino
@María un placer verte por aquí :) Lo primero, a veces, con el robots.txt no se puede "forzar" a que lo rastree, si tu site no es muy p
Post: Errores críticos originados por el robots.txt

María
Hola Lino, tengo el mismo problema. El probador de robots de google me indica: "Error al obtener el archivo robots.txt Tienes un archivo ro
Post: Errores críticos originados por el robots.txt