Cómo eliminar URLs de búsquedas de Google

Cómo eliminar URLs de búsquedas de Google marte664

Cómo eliminar URLs de búsquedas de Google

URLs - Cómo eliminar URLs

URLs - Cómo eliminar URLs

Hay muchas formas de eliminar URLs de Google. La forma que utilizar depende de las circunstancias. El uso del método incorrecto podría ocasionar problemas en el SEO de las páginas, adicional a que las páginas no se eliminen del índice según lo previsto.

Nosotros buscaremos ayudarte a decidir rápidamente qué método de eliminación es mejor para ti. En esta publicación aprenderás:

  • Cómo verificar si una URL está indexada
  • 5 formas de eliminar URLs de Google
  • Cómo priorizar las eliminaciones
  • Errores comunes de eliminación a evitar

 

Cómo verificar si una URL está indexada

Lo que generalmente se hace para verificar si el contenido está indexado es usar un site: search en Google (por ejemplo, site: http://pixelwork.mx). Sin embargo, las site: searches no son consultas normales y en realidad no dicen si una página está o no indexada. Pueden mostrar páginas conocidas por Google, pero esto no significa que aquellas sean elegibles a mostrarse en resultados de búsqueda normales sin el operador de “site:”.

site: searches aún pueden mostrar páginas que redirigen o se canonizan a otra página.

El mejor método para verificar la indexación es usar el informe de cobertura de indexación en Google Search Console o la herramienta de inspección de URLs para una URL individual. Estas herramientas te indican si una página está indexada y proporcionan información adicional sobre cómo Google trata la página. Si no tienes acceso a esto, simplemente busque en Google la URL completa de su página.

 

Formas de eliminar URLs de Google

1) Eliminar el Contenido

Si eliminas la página y muestra un código de estado 404 (no encontrado) o 410 (desaparecido), la página se eliminará del índice poco después de que se vuelva a rastrear. Hasta que se elimine, la página aún puede aparecer en los resultados de búsqueda. E incluso si la página en sí ya no está disponible, una versión en caché de la página puede estar disponible temporalmente.

 

Puedes necesitar otra opción si:

  • Necesitas una eliminación más inmediata. Consulta la sección de la herramienta de retirada de URL.
  • Necesitas consolidar señales como enlaces. Ve la sección de canonicalización.
  • Necesitas la página disponible para los usuarios. Ve si las secciones noindex o de acceso restringido se ajustan a tu situación.

 

2) Noindex

Una etiqueta noidex de meta robots o una respuesta de encabezado x-robots indicará a los motores de búsqueda que eliminen una página del índice. La etiqueta meta robots funciona para páginas y la respuesta x-robots funciona para páginas y tipos de archivos adicionales como PDF. Para que se vean estas etiquetas, un motor de búsqueda debe poder rastrear las páginas. Ten en cuenta que eliminar páginas del índice puede evitar la consolidación de enlaces y otras señales.

Ejemplo de un meta robots noindex:
<meta name = "robots" content = "noindex">
Ejemplo de etiqueta noindex de x-robots en la respuesta del encabezado:
HTTP / 1.1 200 OK
X-Robots-Tag: noindex

 

Puedes necesitar otra opción si:

  • No quieres que los usuarios accedan a estas páginas. Ve la sección de restricción de acceso.
  • Necesitas consolidar señales como enlaces. Vea la sección de canonicalización.

 

3) Restricción de acceso

Si deseas que la página sea accesible para algunos usuarios, pero no para los motores de búsqueda, entonces lo que probablemente quieres es una de estas tres opciones:

  • Algún sistema de inicio de sesión
  • Autenticación HTTP (donde se requiere una contraseña para acceder)
  • Lista blanca de IP (que solo permite que direcciones IP específicas accedan a las páginas)

Este tipo de configuración permite que un grupo de usuarios acceda a la página, pero los motores de búsqueda no podrán acceder y no indexarán las páginas.

 

Puedes necesitar otra opción si:

  • Necesitas una eliminación más inmediata. Consulta la sección de la herramienta de retirada de URL.

 

4) Herramienta de retirada de URL

El nombre de esta herramienta de Google es ligeramente engañoso, ya que la forma en que funciona es que oculta temporalmente el contenido. Google seguirá viendo y rastreando este contenido, pero las páginas “retiradas” no aparecerán para los usuarios. Este efecto temporal dura seis meses en Google. Esta herramienta debe usarse en los casos más extremos para asuntos como problemas de seguridad, fugas de datos, información de identificación personal, etc. Para Google, usa la Herramienta de retirada de URLs.

Todavía necesitará aplicar otro método junto con el uso de la herramienta de retirada para que las páginas se remuevan durante un período más largo (noindex o eliminar) o para evitar que los usuarios accedan al contenido si todavía tienen los enlaces (eliminar o restringir el acceso). Esto solo le brinda una forma más rápida de ocultar las páginas, mientras que la eliminación tiene tiempo para procesarse. La solicitud puede demorar hasta un día en procesarse.

 

5) Canonicalización

Cuando tienes varias versiones de una página y deseas consolidar señales como enlaces a una sola versión, lo que deseas hacer es alguna forma de canonicalización. Esto es principalmente para evitar contenido duplicado mientras se consolidan varias versiones de una página en una sola URL indexada.

Hay varias opciones de canonicalización:

  • Etiqueta canónica. Esto especifica otra URL como la versión canónica o la versión que deseas que se muestre. Si las páginas están duplicadas o son muy similares, esto debería estar bien. Cuando las páginas son demasiado diferentes, la canónica puede ignorarse ya que es una pista y no una directiva.
  • Una redirección lleva a un usuario y un bot de búsqueda de una página a otra. 301 es la redirección más utilizada por los SEOs, y les dice a los motores de búsqueda que deseas que la URL final sea la que se muestra en los resultados de búsqueda y dónde se consolidan las señales. Una redirección 302 o temporal indica a los motores de búsqueda que deseas que la URL original sea la que permanezca en el índice y consolide las señales allí.
  • Manejo de parámetros de URL. Se agrega un parámetro al final de la URL y generalmente incluye un signo de interrogación, como pixelwork.mx?this=parameter. Esta herramienta de Google te permite decirles a los motores de búsqueda cómo tratar las URL con parámetros específicos.

 

Cómo priorizar las eliminaciones

Si tienes varias páginas para eliminar del índice de Google, entonces debes de darles un orden de priorización:

  • Máxima prioridad: estas páginas suelen estar relacionadas con la seguridad o con datos confidenciales. Esto incluye contenido que contiene datos personales, datos de clientes o información de propiedad.
  • Prioridad media: esto generalmente implica contenido destinado a un grupo específico de usuarios. Portales de empleados, contenido destinado solo a miembros y entornos de preparación, prueba o desarrollo.
  • Baja prioridad: estas páginas suelen incluir contenido duplicado de algún tipo. Algunos ejemplos de esto incluirían páginas servidas desde múltiples URL, URL con parámetros, y nuevamente podrían incluir entornos de preparación, prueba o desarrollo.

 

Errores comunes que debes evitar

  • Noindex en robots.txt

Si bien Google solía admitir no oficialmente noindex en robots.txt, nunca fue un estándar oficial y ahora han eliminado formalmente el soporte. Muchos de los sitios que estaban haciendo esto lo estaban haciendo incorrectamente y se dañaban a sí mismos.

  • Bloqueo del rastreo en robots.txt

El rastreo no es lo mismo que la indexación. Incluso si Google no puede rastrear páginas, si hay enlaces internos o externos a una página, aún puede indexarla. Google no sabrá qué hay en la página porque no lo rastreará, pero sabe que existe una página e incluso escribirá un título para mostrar en los resultados de búsqueda en función de señales como el texto de anclaje de los enlaces a la página.

  • Nofollow

Esto comúnmente se confunde con noindex, y algunas personas lo usan a nivel de página esperando que la página no se indexe. Nofollow originalmente detenía los enlaces en la página y los enlaces individuales con el atributo nofollow de ser rastreados, pero ese ya no es el caso. Google ahora puede rastrear estos enlaces si así lo desea. Nofollow también se ha usado en enlaces individuales para tratar de evitar que Google rastree páginas específicas. De nuevo, esto ya no funciona ya que nofollow es solo una pista.

  • Noindex, espera a que Google rastree, luego bloquea el rastreo

Hay un par de formas en que esto suele suceder:

  • Las páginas ya están bloqueadas, pero están indexadas; personas agregan noindex y desbloquean para que Google pueda rastrear y ver el noindex; luego bloquean el rastreo de las páginas nuevamente.
  • Personas agregan etiquetas noindex para las páginas que desean eliminar y después de que Google ha rastreado y procesado la etiqueta noindex, bloquean el rastreo de las páginas.

De cualquier manera, el estado final está bloqueado de ser rastreado. Aunque estas páginas están bloqueadas, aún pueden terminar en el índice.

 

Decidir la manera para eliminar URLs es bastante situacional, y el proceso a seguir es diferente en cada caso. Es necesario saber qué es lo que quieres y que pasos seguir para obtener los resultados deseados

 

Fuentes:

[1] https://ahrefs.com/blog/remove-urls-from-google/#check-url-is-indexed

[2] https://support.google.com/webmasters