¿Google utiliza Chrome para descubrir nuevas URL para rastrear?

Muchas personas asumen que Google aprovecha todos sus recursos de información en todas las formas posibles. Por ejemplo, la gran mayoría de las personas que piensan en ello probablemente asumen que Google utiliza su navegador Chrome como fuente de datos y, en particular, que lo utilizan para descubrir nuevas URL para rastrear.

Decidimos poner eso a prueba.

Nota Breve sobre la Metodología

La metodología de la prueba es bastante simple. En principio, todo lo que necesitábamos era configurar un par de páginas que Google no conocía, tener un montón de gente que visitaba esas páginas desde un navegador Chrome y luego esperar a ver si Googlebot lo visitaba. En la práctica, hubo un poco más de disciplina involucrada en el proceso, así que aquí está lo que hicimos:

1.- Se crearon cuatro artículos nuevos como páginas. Usamos dos de estas como páginas de prueba, y dos de como páginas de control.

2.- Se subieron a un sitio web mediante FTP directo a un servidor web. Por eso, quiero decir que no usamos ningún sistema de gestión de contenido (por ejemplo, WordPress, Drupal, …) para cargarlos para asegurar de que algo en ese proceso no hizo que Google conociera las páginas.

3.- Esperamos una semana para asegurarnos de que nada salió mal, haciendo que Googlebot visite el sitio. Durante esa semana, comprobamos los archivos de registro del sitio todos los días para asegurarnos de que no hubo visitas de bot de Google.

4.- Se enlistaron 27 personas para seguir este proceso:

Abrir Chrome.
Ir a la configuración y deshabilitar todas las extensiones.
Pega la URL de la primera página de prueba en el navegador y luego visitarla.
Pega la URL de la segunda página de prueba en el navegador y luego visitarla.
Reactivar las extensiones después de completar los pasos anteriores.
Ver la dirección IP y enviarla a para verificar que se siguieron todos los pasos y cuales no.

5.- Se comprobaron los archivos de registro cada día hasta una semana después de que el último usuario completó estos pasos

Ten en cuenta que las páginas de control nunca fueron visitadas por humanos, y eso es lo que los hace paginas controles. Si algo salió mal en el proceso de carga, entonces podrían ser visitados, pero eso nunca sucedió. No se han producido vistas de ninguna de las páginas de control, ya sea por humanos o robots, así que esto confirmó que nuestro proceso de subida funcionó.

¿Qué creen las personas acerca de esto?

En previsión de esta prueba, Rand Fishkin de Moz publicó una encuesta en Twitter para ver lo que la gente creía acerca de si Google utiliza los datos de Chrome para este propósito. Aquí está su resultado:

Como puedes ver, un enorme 88% cree que Google olfatea nuevas URL de los datos de Chrome, y la mayoría de ellos están seguros de que definitivamente lo hacen. Veamos cómo se compara con los resultados de nuestra prueba.

Los resultados

Los resultados son bastante simples: Googlebot nunca vino a visitar ninguna de las páginas de la prueba.

Como resultado, dos personas en la prueba no desactivaron sus extensiones, y esto resultó en visitas de Open Site Explorer (alguien tenía el Mozbar instalado y habilitado) y Yandex (debido a una persona diferente, aunque no estoy seguro qué extensión estaba instalada y habilitada).

Resumen

Este es un resultado notable. Google tiene acceso a una enorme cantidad de datos de Chrome, y es difícil creer que no lo utilice de alguna manera.

Sin embargo, ten en cuenta que esta prueba era específica para las pruebas si utilizaban Chrome para descubrir nuevas URL. Mi conjetura es que Google sigue siendo de la mentalidad que si no hay una conexión vía una página (enlace), no tiene bastante valor para poner en el Rank.

Esto no significa que Google no utilice los datos de Chrome para otras cosas, como recopilar datos agregados de comportamiento del usuario u otras métricas. Paul Haahr, de Google, confirmó que utilizan datos como el CTR como un control de calidad en pruebas altamente controladas para medir la calidad de la búsqueda.

Nota: Él no dijo que era un factor de clasificación en vivo, sino más bien una manera de validar que los otros factores de clasificación estaban haciendo bien su trabajo. Dicho esto, tal vez Chrome es una fuente de datos en dichas pruebas. Podría fácilmente haberse hecho verdaderamente anónima, y tal vez agregar un montón de información sobre la satisfacción del usuario con los resultados de búsqueda.

En cualquier caso, esta parte de la conversación es toda especulación y, por ahora, hemos demostrado que Google no parece utilizar visitas sencillas de Chrome a nuevas páginas web como forma de descubrir URL’s para el rastreo.