Noticias

Resúmenes de IA de Google = ¿Robo? Fallo judicial sienta precedente


La nueva y audaz visión de Google para el futuro de las búsquedas en línea, impulsada por tecnología de inteligencia artificial, está provocando una reacción en toda la industria por temor a que pueda dañar el ecosistema abierto de Internet.

En el centro de la controversia se encuentran las “Resumen de IA” recientemente lanzadas por Google, que son resúmenes generados que apuntan a responder directamente consultas de búsqueda extrayendo información de toda la web.

Las descripciones generales de IA aparecen de manera destacada en la parte superior de las páginas de resultados, lo que potencialmente limita la necesidad de los usuarios de hacer clic en los sitios web de los editores.

La medida provocó acciones legales en Francia, donde los editores presentaron casos acusando a Google de violar los derechos de propiedad intelectual al ingerir su contenido para entrenar modelos de inteligencia artificial sin permiso.

Un grupo de editores franceses ganó una batalla judicial temprana en abril de 2024. Un juez ordenó a Google negociar una compensación justa por reutilizar fragmentos de su contenido.

Los editores en los EE. UU. están planteando objeciones similares a medida que las nuevas resúmenes de búsqueda de inteligencia artificial de Google amenazan con desviar el tráfico de las fuentes. Argumentan que Google se beneficia injustamente del contenido de otros.

El debate destaca la necesidad de marcos actualizados que regulen el uso de datos en línea en la era de la IA.

Preocupaciones de los editores

Según los observadores de la industria, las implicaciones de las resúmenes de IA podrían afectar a millones de creadores independientes que dependen del tráfico de referencias de la Búsqueda de Google.

Frank Pine, editor ejecutivo de MediaNews Group, le dice a The Washington Post:

“Si los periodistas se hicieran eso entre sí, lo llamaríamos plagio”.

La compañía de Pine, que publica el Denver Post y el Boston Herald, se encuentra entre las que demandaron a OpenAI por supuestamente extraer artículos con derechos de autor para entrenar sus modelos de lenguaje.

El modelo de ingresos de Google se ha basado durante mucho tiempo en dirigir el tráfico a otros sitios web y monetizar ese flujo a través de canales de publicidad paga.

Las revisiones de la IA amenazan con cambiar ese modelo de ingresos.

Kimber Matherne, que dirige un blog de comida, es citada en el artículo que dice:

“[Google’s] El objetivo es hacer que sea lo más fácil posible para las personas encontrar la información que buscan. Pero si se excluye a las personas que son el alma que crea esa información, entonces eso no le hace ningún favor al mundo”.

Según el informe del Post, Raptive, una empresa de servicios publicitarios, estima que los cambios podrían provocar una pérdida de ingresos de 2.000 millones de dólares para los creadores online.

También creen que algunos sitios web podrían perder dos tercios de su tráfico de búsqueda.

El director ejecutivo de Raptive, Michael Sánchez, le dice a The Post:

“Lo que ya no era un campo de juego nivelado podría inclinarse hacia donde la Internet abierta comience a correr peligro de sobrevivir”.

Preocupaciones de los profesionales de la industria

Es comprensible que las descripciones generales de la IA de Google estén generando preocupaciones entre los profesionales de la industria, como se expresa a través de numerosos tweets que critican la medida.

Matt Gibbs cuestionó cómo Google desarrolló la base de conocimientos para su IA y afirmó sin rodeos: “Estafaron a los editores que hicieron el trabajo real para crear el conocimiento. Google son una panda de ladrones”.

En su tweet, Kristine Schachinger se hizo eco de sentimientos similares, refiriéndose a las respuestas de inteligencia artificial de Google como “un completo motor de robo digital que impedirá que los sitios reciban clics”.

Gareth Boyd retuiteó una cita del artículo del Washington Post que destaca las luchas del blogger Jake Boly, cuyo sitio recientemente experimentó una caída del 96% en el tráfico de Google.

Boyd dijo: “El precedente que están sentando OpenAI y Google es aterrador…” y que “más personas deberían estar igualmente enojadas” con ambas empresas por el “robo abierto de contenido”.

En su tweet, Avram Piltch acusó directamente a Google de robo y afirmó que “los datos utilizados para entrenar su IA provienen de los mismos editores que permitieron a Google rastrearlos y ahora se verán perjudicados. Esto es un robo, simple y llanamente. Y es una amenaza para el futuro de la web”.

Lily Ray hizo una afirmación similar sobre Google: “Usando todo el contenido que tomaron de los sitios que crearon Google. Con poca o ninguna atribución o tráfico”.

Área gris legal

La controversia aprovecha debates más amplios sobre la propiedad intelectual y el uso legítimo, a medida que los sistemas de inteligencia artificial se entrenan en escalas de datos sin precedentes recopilados en Internet.

Google argumenta que sus modelos sólo ingieren datos web disponibles públicamente y que los editores anteriormente se beneficiaban del tráfico de búsqueda.

Los editores dan su consentimiento implícito a que los motores de búsqueda indexen su contenido a menos que opten por no hacerlo.

Sin embargo, las leyes no se concibieron teniendo en mente el entrenamiento de modelos de IA.

¿Cuál es el camino a seguir?

Este debate destaca la necesidad de nuevas reglas sobre cómo la IA utiliza los datos en línea.

El camino a seguir no está claro, pero hay mucho en juego.

Algunos sugieren compartir ingresos o pagar licencias cuando el contenido del editor se utiliza para entrenar modelos de IA. Otros proponen un sistema de suscripción voluntaria que brinde a los propietarios de sitios web más control sobre cómo se utiliza su contenido para la capacitación en IA.

Los fallos franceses sugieren que los tribunales pueden intervenir sin directrices explícitas ni negociaciones de buena fe.

La web siempre se ha basado en un equilibrio entre motores de búsqueda y creadores de contenido. Si ese equilibrio se altera sin nuevas salvaguardias, podría socavar el intercambio de información que hace que Internet sea tan valiosa.


Imagen de portada: Veroniksha/Shutterstock

hola@juanrecio.com

Author

hola@juanrecio.com

¡Utiliza la tecnología y la inteligencia artificial en tus proyectos! ¿Quieres saber cómo?