Tratamiento de urls que tienen un tiempo de vida muy corto

Publicado por  (Errioxa) el 16 de abril del 2014

Ha habido grandes debates en el mundo SEO sobre cómo trata Google los errores 404 y 410 del servidor. Puede parecer que "da un poco igual" el cómo trate Google los errores 404 y 410 y de si hay diferencias entre ellos, pero puede ser crucial para algunas webs que son realmente grandes o que tienen urls que sólo son válidas y útiles por un breve espacio de tiempo.

Por ejemplo, si tenemos un portal de ofertas de trabajo (o un ecommerce donde hay productos activos y descatalogados), las urls de las fichas donde se describe la oferta de trabajo (o la ficha de un producto en el ecommerce) serán válidas para los usuarios mientras la oferta esté aun abierta (o el producto esté en stock), pero una vez que la empresa haya cerrado esa oferta de trabajo ya no sirve para nada al usuario.

Estas páginas nos pueden dar grandes alegrías como grandes penas si las dejas vivir mucho tiempo aunque para el usuario no sea útil. Pongamos como ejemplo el antes mencionado, una web sobre ofertas de trabajo, dónde las ofertas de trabajo expiran en un tiempo medio de una semana.

De cara al usuario, si dejamos pervivir esas urls siempre.

  • ¿Es bueno que llegue a una oferta a la que ya no se pueda inscribir?
    Al 99% no le será útil, no quiere ver los trabajos a los que ya no puede aspirar, le hace perder tiempo de navegación.

  • ¿Que podemos ofrecerle si entra en esa oferta?
    Lo normal es que no pueda contactar, ya sea porque se desactiva el botón de aplicar a la oferta, o bien porque no aparece el formulario pertinente para enviar el currículum. Así que si no le ofrecemos nada no le será útil y estará perdiendo el tiempo. Por eso es importante ofrecerle algo útil, por ejemplo otras ofertas de la misma empresa u otras ofertas del mismo perfil que la oferta que busca (misma categoría y provincia por ejemplo)

    De esta manera el usuario no estará perdiendo tanto tiempo, ha llegado a una página "inútil" para él, pero podemos hacer que sea algo útil si al menos desde ahí le ofrecemos una en la que pueda estar interesado y que pueda inscribirse en ella.

De cara a nuestro web/negocio

  • ¿Es bueno para nuestro site/negocio?
    Trae posibles usuarios que llegan desde Google al buscar algo relacionado con esa oferta de trabajo (normalmente long tail) por lo que son clientes potenciales, o sea, es bueno para nuestro negocio. Además quizás así tampoco entre en la competencia si consigue lo que quiere.

  • ¿Será bueno para nuestro negocio dentro de 3 años?
    Cuando llevas mucho tiempo así, y sobretodo si tu web es ya algo conocida, surge un problema, y es que al final comprobarás como el 80% de tu tráfico proveniente de Google llega a estas fichas. Por lo general estas fichas no aportan de por si valor al negocio, sólo servirán para captación, que no es poco.. a parte de eso son un dolor de cabeza para técnicos que ven como sus bases de datos crecen y crecen, como los errores 404 son más probables simplemente por cuestión de proporción,  cuantas más ofertas tengas más urls están en tu sistema y más errores dar.

    Otro daño colateral de que el 80% del tráfico a tu site recaiga sobre este tipo de páginas es que te desvirtua un poco  las estadísticas, muchos usuarios Vs poca pasta ingresada. Las estadísticas y números referentes a tu site se están separando de la realidad. Tendrás que examinar de distinta manera las urls de ofertas activas de las que no lo están, pero este problema es fácilmente asumible.

  • Si fueses Google ¿querrías indexar estas urls?
    Pongámonos en la piel del ingeniero de Google, ¿le interesaría perder el tiempo en rastrear y valorar estas urls? Seguro que no, ya que no satisfacerán lo que el usuario (de Google) ha buscado, casi, pero no ha sido satisfactorio porque ya la oferta de trabajo ha expirado. Google preferiría poder ofrecerle una oferta a la que sí pueda apuntarse (o que pueda comprar un producto si fuese un ecomerce).


Así que tenemos un problema, porque

  • Queremos ese usuario, ya que aunque no se apunte a la oferta porque no puede quizás aporte valor a nuestro site de otra manera. Igual navega por nuestro site y entra en las ofertas abiertas. Un % de los usuarios que llegan desde Google a una página con la oferta desactivada se inscribirán en otras ofertas de nuestro site, por lo que estamos dando algo de valor a las empresas que buscan candidatos para un puesto y que han pagado por estar en nuestro site. O igual hace click en un anuncio de AdSense y son ingresos para el negocio.

  • Puede ser poco escalable, mantener grandes volúmenes de ofertas en la base de datos, soportar el crawleo de millones de urls (no contactables = poco valor para negocio) puede suponer unos cuantos servidores frontales... y cada vez más técnicos....

  • Puede que algún día Google mida mejor el éxito de sus resultados y sea capaz de darse cuenta de que muchos usuarios que lleva a ese site vuelven al buscador porque no han quedado satisfechos y entonces nos devalua nuestro site y se posiciona peor.


¿Cómo podemos solucionarlo de la mejor manera?

Creo que es imposible satisfacer todos los intereses ya que si esas urls nos traen usuarios, muchos usuarios, lo de dejarlas inaccesibles (y dar un 404 o 410) no vale, porque perderíamos mucho dinero....

Las mejores soluciones que de momento he llevado a cabo son

  1. Ofrecer al usuario alternativas
    Mostrar de forma muy visible las ofertas (o artćulos en un ecommerce) más similares y activas a la que ha llegado el usuario.

    Realmente si le ofreces unas ofertas que le interesan y le dejas claro que la que está viendo actualmente no está activa no le importará haber hecho un click de más para llegar a donde quiere. Un alto porcentaje de estos usuarios cumplirán el objetivo como el resto de los usuarios. Si en una oferta activa se inscriben el 30% de los usuarios que llegan desde Google, posiblemente el 15% de los usuarios que llegan a una oferta desactivada harán clicks en las relacionadas que le muestres y se inscribirán en alguna.

    Entonces, con esta solución algo estamos aportando tanto al negocio como al usuario, y por ende a Google. Perdemos algunos usuarios, pero no sé cómo podríamos retenerlos...

  2. Eliminar URLs sin valor
    Comprobar el historial de las ofertas desactivadas y eliminar de nuestro sistema aquellas que desde hace mucho tiempo no haya tenido accesos. Si una oferta de trabajo ha sido cerrada hace 1 año y nunca ha tenido nungún usuario llegado por medio de Google desde entonces, ¿para que mantenerla?

  3. Redirigir automáticamente estas urls a otras con una oferta activa similar
    Esto no es escalable, porque cada vez que una se caduca tendrías que redireccionar todas las que estaban redireccionadas hacia ésta, y sería un caos total....

  4. Redirigir a la categoría de la oferta
    Esto es válido para el usuario, porque al menos los que lleguen a estas urls serán redirigidos a un listado de ofertas que puede que le interesen, pero realmente no nos traspasará al listado de la categoría el posicionamiento que la ficha de la oferta tenía.

Si no podemos ofrecer ofertas relacionadas ¿Cómo eliminamos estas urls?

Y aqui enlazamos el final del post con el principio... y es que he tenido muchos debates sobre que hacer para eliminarlas. Yo opto por dar un error 410 a Google en estas ofertas desactivadas y sin accesos. Matt Cutts ha comentado ayer en un vídeo la diferencia que hace el Bot entre un 404 y un 410.

  • 404
    Google pone en "espera" esa url y vuelve a las 24 horas a ver si hay contenido por si hubiera sido algún problema del servidor y sólo sea temporal

  • 410
    Google no volverá a comprobar si es un error temporal, sabe que será un error permanente y que esa url no volverá a activarse, aun así, dice que puede volver a intentarlo al cabo del tiempo, supongo qu si encuentra links intentará rastrearlo....


Después de ver el vídeo, tengo claro que para estas urls que decidamos eliminar daría un 410, y así el bot de Google no pierde el tiempo en esas urls ni nosotros recursos para mantenerlas.

No creo que Google interprete bien que un site de miles de 404 nuevos cada día, es más es uno de mis mayores temores si se aplicase 404 para eliminar todas esas fichas, Google pensará que está descuidado, u obsoleto, o a saber, pero nada bueno. Pero creo que no tomaría mal miles de 410 ya que son claramente realizados conscientemente por lo que el site no es que desatendido ni obsoleto ni "roto".


¿Se os ocurre alguna otra manera de eliminar estas urls y no por ello perder usuarios?




 


Sergiohace Hace más de 4 años y 307 días

Y que te parecería reusar la url, me explico, en lugar de redirigir la url a una oferta activa similar sustituir la oferta caducada por una activa similar cuando la demos alta. Con esto conseguiríamos:

- Conservar la url original
- Volver a tener el contenido activo en esa url
- Evitamos que crezca el contenido caducado

No se como se lo tomaría google...

Alberto Fdezhace Hace más de 4 años y 304 días

Buena reflexión. En cuanto al comentario de Sergio, yo creo que llegaría un punto en el que no tendrías slugs suficientemente válidos y acertados, además del caos que supondría tener listados enormes de posibles URLs candidatas para redefinir su contenido.

Errioxahace Hace más de 4 años y 302 días

@Sergio, la verdad que esa opción no la he probado nunca, podría ser válida y escalable... Thanks!

Txantxezhace Hace más de 4 años y 243 días

Os cuento una nueva derivada para este problema para eventos.
Hace y un par de años cambiamos las URLs en nvivo.es para los conciertos, quitamos los IDs para dejar una dupla 'artista + ciudad'. De esta manera conseguíamos posicionar siempre la misma URL cada vez que Coldplay llegara a Madrid, por ejemplo. Esto lo hicimos porque cada vez que se repetía ese concierto, se posicionaba la URL con el ID antiguo.

Con el nuevo azote de Panda 4.0, lo primero que hicimos fue meter un noindex a muchos conciertos antiguos, porque eran URLs con mucho rebote y poco contenido.

Resultado: ahora cuando esos conciertos 'vuelven' a la URL le cuesta indexarse porque Google ya ha asumido ese 'noindex'. Estoy pensando incluso en volver a los IDs, para ver si el algoritmo ahora me posiciona mejor eventos con fechas actuales y pasa de las antiguas, o incluso usar canonicals a la nueva.

Ay los eventos...



Lea otros artículos de On Page

Últimos posts

Últimos comentarios


Lino Uruñuela

Completamente de acuerdo :) Pero en este experimento solo quería comprobar el método usado para hacer lazy load, en este caso con xmlht
Post: Indexar imágenes en Google usando Lazy Load

Francisco Morales

Lino muy interesante las distintas formas de cargar la imagen. Pero no crees que lo realmente interesante de aplicar Lazy Loading es cargar
Post: Indexar imágenes en Google usando Lazy Load

javier

Buenas , esto del onclik ha cambiado actuamente en algunas web que tengo las lee y sigue enlaces
Post: ¿Cómo ejecuta, interpreta e indexa Google el contenido cargado mediante javascript?

David Girona

Antes de Nada muchas gracias por la aportación. Estoy probando de poner en marcha este procedimiento y me surgen un par de dudas. En
Post: Cómo añadir el valor del meta Robots a Google Analytics via Google Tag Manager

Javier Espinoza

Gracias por la informacion!! Este tipo de blogs me parecen muy importantes, esto lo estudio en la universidad. gracias por la informacion. h
Post: Atacados por los .cn .cz .pl

juan

Hola Lino Uruñuela, una duda ¿aun funciona? porque no lo logro. Mira, en un index.php tengo este codigo: Camuflados
Post: Ofuscando enlaces para mejorar Link Juice

DUQUEredes

Google pasa del canonical bastante :-(
Post: Comprobando comportamiento de Google con meta canonical

Marinette

Gracias por la información!
Post: Nuevo Google Search Console ¿qué información nos ofrecerá?

Adolfo

Parece que a todo el mundo le ha gustado este artículo sexista y lleno de situaciones de agresión sexual y violencia de género, ya tendr
Post: Tipos de marketing

FDM

Hola, Lino: Genial el post, como siempre. Es genial contar con personas tan curiosas y que investigan al detalle el funcionamiento de Goo
Post: La segunda ola de indexación y cómo saber qué renderiza Google

Contacta

Lánzate y pregunta!


He leído y acepto la política de privacidad

Mecagoenlos.com te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por Lino Uruñuela. como responsable de esta web.

La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para enviar un correo con los datos que introduzcas, sin guardarse en ninguna base de datos.

Legitimación: Al marcar la casilla de aceptación, estás dando tu legítimo consentimiento para que tus datos sean tratados conforme a las finalidades de este formulario descritas en la política de privacidad.

Como usuario e interesado te informamos que los datos que nos facilitas estarán ubicados en los servidores de Linode.com (proveedor de hosting de Mecagoenlos.com) cumpliendo la ley de protección de datos. Ver política de privacidad de Linode.com.

Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en info@mecagoenlos.com, así como el derecho a presentar una reclamación ante una autoridad de control. Más información aquí.