El nuevo algoritmo de Google crea artículos originales de tu contenido.
Google ha publicado una investigación sobre un nuevo algoritmo que puede tomar tu página web y la de tu competidor y generar artículos “coherentes”. Al crear contenido original, el nuevo algoritmo de Google puede responder la pregunta de un usuario sin tener que enviarlos a otra página web.
¿Cómo funciona el Algoritmo “Parafraseo”?
El nuevo algoritmo de Google funciona al resumir el contenido web utilizando un algoritmo que “extrae” tu contenido y luego descarta las partes irrelevantes. Esto es similar a los algoritmos utilizados para generar fragmentos destacados.
Estos se llaman “resúmenes extractivos” porque extraen contenido de páginas web. Los Resúmenes Extractivos son como una reducción del texto original a las oraciones más importantes. Luego, este algoritmo utiliza otro tipo de algoritmo llamado resumen abstracto. Los resúmenes abstractivos son una forma de parafraseo.
Una desventaja de la paráfrasis artificial (resúmenes abstractos) es que casi un tercio de los resúmenes contienen hechos falsos. La nueva investigación de Google ha descubierto una forma de unir lo mejor de ambos enfoques. Usan “resúmenes extractivos” para extraer los hechos importantes de los documentos web y luego aplican el enfoque “abstracto” para parafrasear el contenido.
Este enfoque crea un nuevo documento basado en la información que se encuentra en la web y crea la propia versión de Wikipedia de Google. El nuevo algoritmo de Google se describe en un trabajo de investigación titulado, Generación de Wikipedia mediante el resumen de largas secuencias
De acuerdo con Google:
“Mostramos que la generación de artículos en inglés Wikipedia se puede abordar como un resumen multidocumento de documentos originales”.
Esto significa que Google puede salir y recopilar información sobre un tema de varias páginas web.
Entonces:
“Utilizamos el resumen extractivo para identificar la información relevante …”
Esto significa que reducen las páginas web a las oraciones más importantes para extraer el significado.
El siguiente paso es usar:
“… un modelo abstracto neuronal para generar el artículo”.
Esto significa que Google tomará los significados extraídos y usará un “modelo abstracto neureal” para resumir esos hechos (extraídos de muchos sitios web) en frases y párrafos de aspecto natural para crear un artículo.
Google dice que los artículos resultantes pueden pasar el examen humano.
“Mostramos que este modelo puede generar párrafos fluidos y coherentes de múltiples oraciones … Cuando se les presentan documentos de referencia, demostramos que pueden extraer información objetiva relevante reflejada en … evaluaciones humanas”.
Los fragmentos destacados son el primer paso
Los fragmentos destacados son un ejemplo de Resumen Extractivo. Es un proceso de tomar una página web completa y luego tirar las palabras y frases irrelevantes y mantener solo las pocas oraciones que comunican la respuesta a una pregunta.
Hay un algoritmo de Google relacionado que resume las páginas web de Google Voice llamado, Compresión de oraciones por eliminación con LSTM.
¿Algoritmo de Google resume tu contenido?
Este algoritmo consiste en resumir “documentos múltiples” y resumirlos. Esto se puede aplicar a los libros. Esto se puede aplicar a bases de datos de fuente abierta. Pero esto también se puede aplicar a cualquier página web pública, incluido su contenido.
La investigación utiliza los temas de Wikipedia como query de búsqueda y los resultados del motor de búsqueda como fuente para los resúmenes extraídos que luego se parafrasean para crear nuevos artículos. Este algoritmo también hizo una prueba lado a lado al generar también un segundo conjunto de artículos usando solo las referencias citadas por Wikipedia.
El documento describe el proceso de esta manera:
“Los documentos de referencia se obtienen de un motor de búsqueda, con el tema de Wikipedia utilizado como consulta similar a las referencias de nuestro motor de búsqueda. Sin embargo, también mostramos resultados con documentos que solo se encuentran en la sección Referencias de los artículos de Wikipedia “.
La traducción al inglés simple es que usan temas de Wikipedia como consultas de búsqueda y las páginas de resultados del motor de búsqueda (SERP), tu contenido, como el material de origen para generar páginas web completamente nuevas que se pueden utilizar para responder una pregunta sin mostrar un enlace a su sitio web
El documento de investigación no menciona si Google mostrará su propio contenido creado a partir de tu contenido. Tampoco se discute si Google agregará enlaces a los materiales fuente, ya sea como parte de los SERP o como un enlace a pie de página.
Google ya no necesita mostrar tu contenido
El trabajo de investigación concluye que su experimento es exitoso. Google puede generar su propio contenido al resumir tu contenido, respondiendo así la pregunta de un usuario sin molestarlo al hacer clic en tu sitio.
Esto es lo que dice el documento de investigación de Google:
“Hemos demostrado que la generación de Wikipedia se puede abordar como un problema de resumen de múltiples documentos…”
Esa frase “múltiples documentos” significa cualquier documento que esté disponible libremente, incluidas tus páginas web y las páginas web de tus competidores.
Y esto es lo que dice el documento de investigación sobre el éxito del algoritmo:
“Este modelo supera significativamente las arquitecturas codificadoras-decodificadoras tradicionales en secuencias largas, lo que nos permite condicionar muchos documentos de referencia y generar artículos coherentes e informativos de Wikipedia”.
Eso significa que Google puede usar muchas páginas web para generar artículos “coherentes” e “informativos”. Este es un giro bastante inquietante de los eventos.
¿Utilizará Google este algoritmo con el Asistente de voz?
Todavía no se sabe cuándo o cuándo Google comenzará a generar su propio contenido a partir de tu contenido. Sin embargo, un algoritmo como este es perfecto para la búsqueda de un asistente de voz. La búsqueda del asistente de voz son búsquedas realizadas a través de un teléfono móvil o un dispositivo de Internet de las cosas (IoT) en tu hogar o en tu automóvil.
Por lo tanto, una persona puede preguntar al Asistente de Google Voice sobre una estrella de cine y el asistente de voz de Google puede responder en oraciones para responder a tu pregunta, como si le hubieras preguntado a una persona real.
Google siempre aspiró a ser como la computadora asistente de voz en Star Trek. En 2014, se informó que una versión anterior de la búsqueda por voz tenía un nombre en clave después de la actriz que interpretaba la voz de la computadora Star Trek. Un algoritmo como este cabría perfectamente en una configuración de asistente de voz.