SEO para Google

Cómo desindexar páginas de Google. 5 formas de quitar URLs del buscador

Normalmente nos quejamos porque Google tarda en indexar alguna URL que nos interesa particularmente.

Pero rara vez pensamos en desindexar páginas del buscador.

Hasta que lo necesitamos.

Pero la realidad es que no solo a veces es deseable y sano quitar algunas páginas del buscador y hacer que Google no las vuelva a mostrar en los resultados, sino que a veces es muy necesario.

Y no nos vale borrar el contenido o modificar la URL.

Que si hacemos las cosas las hacemos bien.

En este artículo te contaremos cinco formas para poder eliminar o desindexar URLs de los resultados de búsqueda de Google.

Cómo desindexar páginas de Google. 5 formas de quitar URLs del buscador
Cómo desindexar páginas de Google. 5 formas de quitar URLs del buscador

Empezamos con una advertencia

Es importante que entiendas que las alternativas que vamos a dar aquí no significa que puedes usar cualquiera de ellas, sino que tienes que elegir el método correcto para lograr tu objetivo satisfactoriamente.

Si eliges incorrectamente la forma de desindexar de Google, no solo corres el riesgo de que no se quite del índice de Google, sino que directamente pueda tener un efecto negativo en SEO (ojo, “efecto negativo” no es lo mismo que “penalizar“).

Entonces, dividimos este post en las siguientes secciones:

Cómo revisar si una URL está indexada

Pues lo más simple y lo que el 99% de las personas que trabajan en SEO te diremos que puedes hacer una búsqueda con el argumento “site:” para saber si la página que buscas aparece o no.

Esto se debe hacer sin utilizar espacios y poniendo exactamente la URL que buscas, ya que si pones solo el nombre del dominio, te listará todas las páginas indexadas correspondientes a ese dominio. Por ejemplo:

site:googleseo.marketing 

te mostrará todas las páginas (o casi) indexadas por Google para este dominio

En cambio:

site:https://googleseo.marketing/rel-canonical-seo/

te listará únicamente esa página.

Está muy bien tener esto en cuenta, y este tipo de operadores de Google son muy potentes y útiles.

Aun así, hay que tener en cuenta que no son “búsquedas reales”. Esto significa que, si una página aparece utilizando este operador, Google definitivamente sabe de su existencia y la tiene en su índice, pero no significa que vaya a aparecer en algún momento por alguna búsqueda normal, sin el uso del “site:.

¿Quieres un ejemplo claro de esto?

Pues aquí lo tienes.

Hace ya unos años que la marca de coches Renault en España dejó de tener una versión desktop y una versión móvil de su web y pasó a una web responsive.

Aún en 2020 podemos encontrar muchos resultados si hacemos una búsqueda con el siguiente operador:

site:m.renault.es
Ejemplo de búsqueda con el operador site de Google
Ejemplo de búsqueda con el operador site de Google

Pero difícilmente encontrarás alguna búsqueda normal en Google en la que aparezca un resultado con m.renault.es. Ni siquiera forzando un poco con otros operadores.

Aquí le estamos diciendo que el resultado obligatoriamente debe incluir “m.“:

Ejemplo de búsqueda con comillas en Google
Ejemplo de búsqueda con comillas en Google

Lamento haber dedicado tanto a esta parte, pero es importante dejarlo claro, para que sepas cómo debes buscar y en qué casos debes tomarte la molestia de intentar desindexar una página o no.

De hecho, en este caso, puede ser incluso contraproducente, ya que si bloqueas a Googlebot o activamente eliminas la URL, puedes estar evitando que se consoliden señales como el PageRank (sí, el PageRank todavía es una señal).

Ahora sí, a lo que íbamos.

La mejor forma de mirar la indexación en Google

Idealmente, para mirar el estado de indexación de una página en Google, deberías revisar el Informe de Cobertura de Indexación o la herramienta de inspección de URLs (esta última en caso de querer ver una URL concreta), ambas en Google Search Console.

Estos informes te pueden decir no solo si una página está indexada o no, sino cómo está tratando Google a esa URL.

Herramienta de Inspección de URL en Google Search Console
Herramienta de Inspección de URL en Google Search Console

En caso de no tener acceso a Google Search Console para este dominio, creo que tu mejor opción será pegar la URL que buscas directamente en Google y hacer una búsqueda a ver si aparece, pero sin utilizar el operador “site:“.

Cinco formas de eliminar o quitar URLs de Google

Una vez sabes que la URL efectivamente está indexada y estás seguro de querer eliminarla de los resultados de búsquedas, existen varios métodos para hacerlo.

Te los contamos todos para que elijas la mejor opción para ti.

Opción 1 para desindexar URLs de Google: Eliminar el contenido

Es probablemente una de las opciones más obvias y directas. Si borras la página y llevas a un error 404 o similar, Google la eliminará de los resultados de búsqueda sin necesidad de que pase mucho tiempo después del próximo rastreo.

Claro, esto significa que hasta que suceda, la página seguirá indexada y, si un usuario hace una búsqueda en la cual aparece este resultado, le llevará a la página de error.

¿Cuándo no te vale esta opción?

  • Cuando necesitas una reacción más inmediata: Revisa la sección de la Herramienta de retirada que explicamos más abajo
  • Cuando quieres consolidar señales SEO, como los enlaces: Revisa la sección de Canonlicalización que explicamos más abajo
  • Cuando necesitas que otros usuarios sí accedan a ese contenido: Revisa la sección de “noindex” o la de Limitar acceso al contenido

Opción 2 para desindexar URLs de Google: Usa el “noindex”

Utiliza la etiqueta “noindex” para decir a los motores de búsqueda que no indexen esta página.

Es importante que la página esté accesible y rastreable para los robots. Es decir, no la bloquees en el robots.txt, porque de lo contrario no entrará a leer esta directiva y la puede mantener indexada.

Normalmente, si tu sitio web es WordPress, puedes gestionar esto de manera muy fácil en con el plugin SEO Yoast, en el apartado “Avanzado” dentro de esa propia página.

Noindex en Yoast SEO WordPress
Noindex en Yoast SEO WordPress

Si no usas WordPress, te dejamos el ejemplo de cómo se ve esto, o bien en el código:

<meta name="robots" content="noindex">

O bien en la etiqueta x-robots en el header HTTP:

HTTP/1.1 200 OK
X-Robots-Tag: noindex

¿Cuándo no te vale esta opción?

  • Cuando no quieres que nadie acceda al contenido de esta página: Revisa la sección “Limitar acceso al contenido” más adelante
  • Cuando quieres consolidar señales SEO, como los enlaces: Revisa la sección de Canonlicalización que explicamos más abajo

Opción 3 para desindexar URLs de Google: Limitar acceso al contenido

Si tienes páginas que quieres que sean accesibles para ciertos usuarios, pero no para todos, y ciertamente no quieres que indexen en motores de búsqueda, tienes tres opciones:

  • Algún sistema de login. Por ejemplo, en WordPress, al publicar, puedes modificar la Visibilidad a Privada o Protegida con contraseña
Proteger acceso a contenido de página en WordPress
Proteger acceso a contenido de página en WordPress

¿Cuándo no te vale esta opción?

  • Cuando necesitas una reacción más inmediata: Revisa la sección de la Herramienta de retirada que explicamos más abajo

Opción 4 para desindexar URLs de Google: Herramienta de retirada

Esta es una herramienta propia de Google que está muy bien, pero es importante que tengas muy en cuenta cómo funciona.

Esta no es directamente una herramienta de desindexación o de eliminación de URLs.

Lo que hace es ocultar la URL de los resultados de búsqueda por seis meses.

Esto significa que Google la sigue leyendo y, a partir de los seis meses de haber hecho la solicitud, podría volver a indexar la página y aparecer en los resultados de búsqueda.

Puedes leer más al respecto aquí.

¿Cuándo no te vale esta opción?

  • Cuando necesitas una reacción permanente: Esta es una solución para quitar tu contenido de los resultados rápidamente y es un gran complemento, pero no es permanente. Si quieres soluciones permanentes, revisa el resto de opciones que comentamos en este artículo

Opción 5 para desindexar URLs de Google: Canonicalizar la URL

Generalmente, esta opción se usa cuando tienes varias versiones de un mismo contenido, para indicar a Google cuál es la versión “original” o la que debe priorizar en la indexación, y no considerar todo contenido duplicado o priorizar una página que no es la que esperabas. Aquí te contamos más sobre la canonicalización y cómo funciona.

Cómo priorizar las desindexaciones

Si tienes que hacer esta labor con varias URLs y no solo una, es importante que sepas sobre cuáles actuar primero.

Prioridad alta: Empieza por las páginas que puedan suponer un riesgo de seguridad. Bien sea páginas donde hay información confidencial o privada, o donde tratas/muestras datos personales de tus usuarios

Prioridad media: Aquellas páginas que simplemente no están pensadas para cualquier persona que visita tu sitio web. Normalmente hablamos de: contenido interno para empleados, información premium o exclusiva para miembros, entornos de prueba, etc.

Prioridad baja: Aquellas páginas que simplemente no aportan ningún valor, existen versiones más recientes o más relevantes del mismo contenido. En fin, más hacia evitar contenido duplicado y priorizar la calidad

Los errores más comunes que debes evitar al desindexar

Usar “noindex” en el fichero robots.txt

El uso del “noindex” en robots.txt es algo que jamás fue soportado de manera oficial por Google, aunque en realidad sí lo hicieran en su momento.

Actualmente, ya han hecho oficial que hacen caso omiso al protocolo de exclusión a través de Robots.

Bloquear en robots.txt

Es importante entender que bloquear y rastrear son cosas diferentes.

Al bloquar, quiere decir que no leerá el contenido dentro de una página.

Pero esto no significa que no la rastree. Si esta página sigue estando enlazada desde otras, los robots aún sabrán que existe, llegarán hasta ella, pero no verán su contenido.

Esto significa que incluso pueden mostrar el resultado en las búsquedas con títulos y descripciones basados en señales que sí pueda leer, como los textos ancla de las páginas que las enlazan.

Usar “nofollow”

El “nofollow” y el “noindex” muchas veces se confunden.

“Noindex” es una directiva de no indexación. Es una orden a los buscadores de no indexar la página.

“Nofollow” es una señal o una pista, que pide no rastree páginas que contengan este atributo, no es una directiva y por lo tanto es opcional. Google puede decidir igualmente rastrearla e indexarla.

Usar “noindex”, dejar que Google la rastree y luego bloquear el rastreo

Esto puede pasar en circunstancias en las que se actúa, o bien con poco control, o bien con desconocimiento, como por ejemplo:

  • Si una página ya está indexada, pero bloqueada. Luego, se le añade el “noindex” y se desbloquea para que Google la rastree y vea que no debe indexarla y luego se vuelve a bloquear
  • Se añade el “noindex” a la página que se quiere eliminar después de que Google la haya rastreado e interpretado la orden de no indexar y posteriormente se bloquea

En ambos casos, volvemos a la situación de bloquear. Recordemos una vez más la diferencia entre rastrear e indexar. Aún estando bloqueadas, pueden terminar siendo indexadas.

Cómo quitar contenido que no está en tu sitio web

Esto es un tema completamente diferente.

Si quieres eliminar contenido de una página que no te pertenece a la que no tienes acceso, bien sea porque te han plagiado, están usando tu información sin tu consentimiento o han roto cualquier ley de derechos de autor, puedes reportarlo en la herramienta de Copyright Removal, que puede suponer una revisión manual para eliminar el contenido solicitado.

En el caso de que sea contenido sobre ti en un sitio web que no te pertenece o al que no tienes acceso, hay una alternativa si estás dentro de la Unión Europea, que es el derecho al olvido.

Cómo eliminar o desindexar imágenes

En el caso de imágenes, a pesar de que más arriba hemos dicho que Google no soportaba la no indexación a través de robots.txt, en el caso de imágenes este fichero es la mejor forma de proceder.

Puedes decidir no indexar una imagen concreta:

User-agent: Googlebot-Image
Disallow: /wp-content/uploads/2020/05/fotito.png

O todas las imágenes:

User-agent: Googlebot-Image
Disallow: /

Y así llegamos al final de este artículo. Esperamos que te haya sido útil y puedas dexindexar de Google correctamente todo aquello que necesites.

5 comments for “Cómo desindexar páginas de Google. 5 formas de quitar URLs del buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *