El New York Times demanda a OpenAI y Microsoft por infracción de derechos de autor.

El New York Times presenta una demanda contra OpenAI y Microsoft por supuestamente entrenar modelos de IA con material con derechos de autor de The Times

El New York Times exige que OpenAI y Microsoft paguen por los datos de entrenamiento.

El New York Times (NYT), el prestigioso periódico conocido por su periodismo galardonado, ha tomado medidas legales contra OpenAI y su inversor, Microsoft. El Times alega que estas empresas han violado las leyes de derechos de autor al utilizar millones de artículos del NYT para entrenar sus modelos de IA generativa, incluidos el popular ChatGPT de OpenAI y el Copilot de Microsoft, sin obtener el consentimiento necesario.

En su demanda, presentada en el Tribunal de Distrito Federal en Manhattan, el Times exige que los modelos de IA y los datos de entrenamiento que contienen material no autorizado sean destruidos. Además, el Times busca “miles de millones de dólares en daños estatutarios y reales” por el uso ilegal de su valioso contenido.

El Times enfatiza la importancia del periodismo independiente y advierte que si las organizaciones de noticias no pueden proteger su trabajo, habrá una pérdida significativa para la sociedad. La demanda sostiene que las acciones de OpenAI y Microsoft socavan el periodismo y obstaculizan la producción de noticias reveladoras.

En respuesta a la demanda, un portavoz de OpenAI declaró que respetan los derechos de los creadores de contenido y han mantenido conversaciones productivas con el New York Times. OpenAI espera encontrar una solución mutuamente beneficiosa, como ha hecho con otros editores.

Los modelos de IA generativa aprenden mediante el análisis de ejemplos y la creación de contenido nuevo, como ensayos, código, correos electrónicos y artículos. Empresas como OpenAI recopilan enormes cantidades de datos de la web, algunos de los cuales pueden estar sujetos a restricciones de derechos de autor. Si bien los proveedores argumentan que la doctrina de uso legítimo protege sus prácticas de raspado web, los titulares de derechos de autor, incluidas las organizaciones de noticias, no están de acuerdo.

Este conflicto entre los proveedores y los titulares de derechos de autor ha resultado en numerosas batallas legales. Por ejemplo, la actriz Sarah Silverman y varios novelistas destacados han acusado a Meta, la empresa matriz de OpenAI, de utilizar su trabajo sin permiso. Por otra parte, los programadores han presentado una demanda contra Microsoft, OpenAI y GitHub, alegando que Copilot fue desarrollado utilizando su código protegido.

La demanda del New York Times representa un caso notable en la continua lucha legal entre los proveedores de IA generativa y los titulares de derechos de autor. La demanda pone de relieve el daño potencial causado a la reputación de The Times por los modelos de IA que generan información falsa o inventada. La queja destaca casos en los que el Bing Chat de Microsoft (ahora Copilot) proporcionaba información incorrecta supuestamente obtenida de The Times.

La demanda también plantea preocupaciones sobre cómo estos modelos de IA compiten con los editores de noticias al proporcionar información exclusiva sin necesidad de una suscripción. Esta práctica reduce las oportunidades de generación de ingresos, ya que el contenido generado por IA carece de citas, monetización y enlaces de afiliados utilizados por The Times para generar comisiones.

Los modelos de IA generativa a veces repiten los datos de entrenamiento, reproduciendo el contenido literalmente. En un caso, OpenAI permitió involuntariamente a los usuarios de ChatGPT evadir las barreras de pago y acceder a contenido de noticias restringido.

El New York Times acusa a OpenAI y Microsoft de aprovechar su inversión en periodismo sin proporcionar ninguna compensación. La demanda sugiere que estas empresas están construyendo competidores de los editores de noticias, robando efectivamente audiencias y socavando el negocio de The Times.

Esta disputa refleja un problema más amplio que enfrentan los editores con empresas como Google. Recientemente, los editores presentaron una demanda contra Google, alegando que sus experimentos de IA, como el chatbot Bard y la Experiencia Generativa de Búsqueda, desvían el tráfico y los ingresos publicitarios de los editores a través de prácticas anticompetitivas. Un estudio realizado por The Atlantic encontró que los motores de búsqueda impulsados por IA podrían responder a las consultas de los usuarios sin requerir que hagan clic en los sitios web de los editores, lo que potencialmente reduce el tráfico hasta en un 40%.

Aunque los editores tienen preocupaciones legítimas, el resultado de estas demandas sigue siendo incierto. Heather Meeker, experta en propiedad intelectual, comparó el acto de inducir a modelos de IA generativos a copiar contenido con usar un procesador de texto para cortar y pegar. Meeker cree que la mayoría de las demandas de este tipo podrían fracasar porque, en última instancia, es responsabilidad del usuario si intencionalmente hace que el modelo de IA copie contenido protegido.

En lugar de participar en batallas legales, algunos medios de comunicación han optado por colaborar con proveedores de IA generativa mediante acuerdos de licencia. Por ejemplo, Associated Press y Axel Springer han negociado acuerdos con OpenAI.

El New York Times intentó alcanzar un acuerdo de licencia con Microsoft y OpenAI en abril. Desafortunadamente, las negociaciones no dieron el resultado deseado, lo que llevó a la presente demanda

Vale la pena señalar que esta demanda sirve como una llamada de atención, resaltando la necesidad de directrices y regulaciones claras con respecto al uso de contenido con derechos de autor en el entrenamiento de modelos de IA. Equilibrar los beneficios de la IA generativa con la protección de la propiedad intelectual plantea desafíos significativos y requiere colaboración entre proveedores, creadores y legisladores.

Preguntas y respuestas

P: ¿Por qué el New York Times demanda específicamente a OpenAI y Microsoft? R: El New York Times alega que OpenAI y Microsoft han utilizado millones de artículos del NYT sin permiso para entrenar sus modelos de IA generativa, causando un posible daño a la marca y los ingresos de The Times.

P: ¿Qué son los modelos de IA generativa y cómo aprenden? R: Los modelos de IA generativa aprenden mediante el análisis de ejemplos y la creación de nuevo contenido. Estos modelos, como el ChatGPT de OpenAI y el Copilot de Microsoft, pueden generar ensayos, código, correos electrónicos y artículos emulando patrones de datos de entrenamiento diversos.

P: ¿Qué es la doctrina del uso legítimo y cómo se relaciona con esta demanda? R: La doctrina del uso legítimo proporciona una defensa legal que permite el uso limitado de material con derechos de autor sin permiso. Sin embargo, su interpretación varía, lo que genera desacuerdos entre los proveedores de IA generativa y los titulares de derechos de autor sobre lo que se considera uso legítimo.

P: ¿Cómo regurgitan los modelos de IA generativa los datos de entrenamiento y por qué es preocupante? R: Los modelos de IA generativa a veces producen contenido que replica o se asemeja estrechamente a sus datos de entrenamiento, reproduciendo frases o oraciones textualmente. Esta regurgitación puede ser problemática cuando conduce a la difusión de información falsa o inexacta.

P: ¿Qué impacto podría tener esta demanda en el negocio de las suscripciones de noticias? R: Si modelos de IA como ChatGPT y Copilot generan información que normalmente solo está disponible a través de una suscripción, podría socavar la propuesta de valor de las suscripciones de noticias. Los clientes podrían depender del contenido generado por IA en lugar de eso, lo que podría provocar una disminución de las suscripciones y los ingresos para los editores de noticias.

P: ¿Cómo están abordando otros editoriales el uso de modelos de IA sin permiso? R: Algunos editoriales, como Associated Press y Axel Springer, han optado por colaborar con proveedores de IA generativa mediante acuerdos de licencia. Este enfoque permite a los editores proteger su contenido y beneficiarse de la tecnología de IA al mismo tiempo.

En conclusión, la demanda presentada por The New York Times contra OpenAI y Microsoft llama la atención sobre los complejos problemas que rodean el uso de material con derechos de autor en la capacitación de modelos de IA generativa. El resultado de este caso tendrá implicaciones tanto para los creadores de contenido como para los proveedores de IA, destacando la necesidad de pautas más claras y cooperación en este campo en constante evolución. A medida que las batallas legales continúan, es esencial encontrar un equilibrio entre fomentar la innovación y respetar la propiedad intelectual.

🔗 Enlaces relevantes: – OpenAI – Microsoft – The New York Times – Asociación de Associated Press con OpenAI – Acuerdo de licencia con Axel Springer – Estudio de The Atlantic sobre el impacto de la IA