El famoso medio de información recientemente actualizó sus términos y condiciones para incluir reglas que prohíben que su contenido se use para entrenar sistemas de inteligencia artificial sin su consentimiento.
A falta de regulaciones claras que protejan el material con derechos de autor de posibles plagios por parte de los modelos avanzados de lenguaje, The New York Times ha tomado medidas preventivas para evitar que su contenido se utilice para entrenar sistemas de inteligencia artificial generativa.
Los cambios en los T&C del New York Times para protegerse de la inteligencia artificial
La semana pasada, el famoso medio de noticias actualizó sus términos y condiciones de servicio para prohibir que la información de sus publicaciones en distintas plataformas digitales, sea utilizada para el desarrollo de “cualquier programa de software, incluyendo el entrenamiento de sistemas de aprendizaje automático o de inteligencia artificial”.
Los nuevos términos y condiciones de servicio de NYT especifican que el contenido inutilizable incluye texto, fotografías, gráficos, ilustraciones, diseños, clips de audio, clips de video, metadatos e incluso la apariencia de su sitio web y de sus publicaciones en general.
Además de lo anterior, los términos actualizados también especifican que las herramientas automatizadas como los buscadores de sitios web impulsados por inteligencia artificial, diseñados para aprovechar, acceder o recopilar toda clase de contenidos no podrán ingresar a NYT sin un permiso por escrito del periódico.
Adicionalmente, para garantizar que los usuarios cumplan con los términos actualizados de servicio y privacidad, The New York Times señala que desafiar estas restricciones podría resultar en multas o sanciones, sin embargo, por el momento en el nuevo contrato no se especifica cuáles serían las consecuencias, ni cómo se aplicarían.
Medios de información se sienten amenazados por la IA
La nueva medida del NYT surge a medida que aumenta la preocupación de los medios de información en torno a la falta de leyes que protejan la propiedad intelectual de sus editores, redactores y artistas gráficos, así como su modelo de negocio.
A principios de este mes, varias organizaciones de noticias, incluidas The Associated Press y el Consejo Europeo de Editores, firmaron una carta abierta solicitando a los legisladores mundiales la creación de regulaciones que garanticen transparencia en los conjuntos de datos de entrenamiento de los modelos de inteligencia artificial y exijan del consentimiento de los titulares de derechos de autor antes de usar sus datos para la capacitación de dichos sistemas.
En respuesta OpenAI anunció recientemente que los operadores de sitios web pueden bloquear el acceso a su rastreador web GPTBot, para que no utilice datos de sus páginas.
Por su parte, Microsoft también agregó algunas restricciones nuevas a sus propios términos y condiciones que prohíben que las personas usen sus productos de inteligencia artificial para “crear, entrenar o mejorar, tanto directa como indirectamente, cualquier otro servicio de IA”. Además de impedir que los usuarios extraigan datos de sus aplicaciones de IA como el chatbot o el buscador de Bing.
Los acuerdos de licencia buscan mejorar la relación entre medios de noticias y los modelos de IA
Por otro lado, algunas agencias de medios han comenzado a establecer acuerdos de licencia individuales con las principales firmas tecnológicas para permitirles que utilicen su información de forma legal. Estos acuerdos se establecen principalmente para que las empresas de IA compensen económicamente a los medios informativos por el uso de su contenido.
De hecho, el propio NYT firmó un acuerdo por $100 millones de dólares con Google en febrero de 2023, para permitir que al gigante de las búsquedas publique y utilice su contenido en algunas de sus plataformas durante los próximos tres años.
Como parte de la asociación ambas compañías han estado trabajando juntas en herramientas para la distribución de contenido, manejo de suscripciones, marketing, anuncios y “experimentación”, por lo que es posible que las modificaciones en los términos de servicio del NYT estén enfocados en otras firmas de IA como OpenAI o Microsoft.
Mientras tanto, en julio, la compañía de Sam Altman, OpenAI y The Associated Press firmaron un acuerdo que permite que la firma de inteligencia artificial utilice las noticias de AP para entrenar a ChatGPT durante los próximos dos años.
Los acuerdos de NYT con Google y OpenAI con AP, demuestran que los medios no están totalmente cerrados a permitir que las firmas de IA utilicen sus datos para entrenar sus modelos, siempre y cuando se les recompense por esto. Razón por la cual los legisladores en todo el mundo deben apresurarse en la creación de regulaciones que permitan un mejor aprovechamiento de la inteligencia artificial, no solo para las noticias, sino en todas las industrias.