Un juez da la razón a Meta: usar libros para entrenar a la IA sin el consentimiento de los autores es "legítimo"
Los abogados de la acusación no aportaron las pruebas suficientes para que el juez diera la razón a los autores

Meta va a polémica casi por mes. La empresa matriz de Facebook, Instagram y WhatsApp ha sido acusada (lo admitió durante el litigio) de piratear una ingente cantidad de libros digitales para entrenar su modelo de inteligencia artificial Llama AI. Como hemos comentado en diversas ocasiones en Urban Tecno, para crear modelos de IA como ChatGPT o Claude es necesario «alimentarlos» con muchos, pero muchos datos. Y eso es lo que ha hecho Meta, pero no de una manera especialmente lícita.
Al parecer, la compañía fundada por Mark Zuckerberg descargó mediante torrent más de 81 TB de libros piratas procedentes de fuentes como LibGen, Z-Library y Anna's Archive, según documentados judiciales del caso Kadrey contra Meta. Correos internos indican que Zuckerberg, CEO de Meta, aprobó explícitamente el uso de LibGen, a pesar de que el equipo advertía que los datos habían sido pirateados.
Meta tomó diversas medidas para que las descargas no se realizaran desde los servidores de la compañía, además de evitar la semilla de los torrents, para intentar ocultar su responsabilidad. Contra todo pronóstico, un juez federal de San Francisco desestimó casi todo el caso porque los abogados de los autores demandantes no presentaron argumentos ni pruebas suficientes sobre los «daños causados», considerando que el uso fue justo.
Pruebas escasas para un caso que podría haber acabado de manera muy diferente
Las empresas tecnológicas encargadas del desarrollo de inteligencia artificial están de celebración tras la victoria de Meta en los tribunales. El caso, presentado por una docena de autores, cuestionó cómo la compañía de redes sociales e IA utilizó una biblioteca de millones de libros en línea, artículos académicos y cómics para entrenar sus modelos Llama AI.
El contenido utilizado por Meta está protegido por la ley de derechos de autor, lo que llevó a sus creadores a presentar una demanda contra la compañía. Sin embargo, Meta argumentó que las obras se habían utilizado para desarrollar una «tecnología transformadora», lo cual era legítimo independientemente de cómo las adquiriera.
Esta sentencia no respalda la licitud del uso por parte de Meta de materiales protegidos por derechos de autor para entrenar sus modelos lingḯsticos. Solo respalda la licitud de los argumentos erróneos presentados por los demandantes y la falta de un expendiente que sustente el argumento correcto - Vince Chhabria, juez de distrito de San Francisco
Se trata de la segunda victoria en una semana para las empresas desarrolladoras de IA, después de que un juez federal dictaminara el lunes a favor de Anthropic, la compañía tras el bot conversacional Claude, rival directo del archiconocido ChatGPT. Al parecer, Anthropic había entrenado Claude con libros físicos adquiridos legalmente, desencuadernados y digitalizados, lo que, según el fallo, constituía "uso legítimo".
Chhabria sugirió que un “argumento potencialmente ganador” en el caso Meta sería la dilución del mercado, refiriéndose al daño causado a los titulares de derechos de autor por los productos de IA que podrían “inundar el mercado con cantidades infinitas de imágenes, canciones, artículos, libros y más”