OpenAI pierde un juicio en Alemania por los derechos de autor. ChatGPT usaba las letras de canciones populares sin pagar regalías
OpenAI no está contenta con el veredicto, por lo que podría apelarlo
Para que una inteligencia artificial sea un éxito, hay que «alimentarla» con datos. Muchos datos. Tantos datos como para que un cuantioso grupo de seres humanos sea incapaz de analizarlos todos por sus propios medios. Sin embargo, no valen todos los datos. Deben ser diversos (en idioma, estilo y contexto), además de ser limpios (sin ruido). Si son actuales y relevantes, todavía mejor. En el caso de que sea una IA generativa, deben ser bien representativos.
Cuando un modelo de lenguaje grande (LLM, por sus siglas en inglés) se entrena con una ingente cantidad de datos, pero no de demasiada buena calidad, su rendimiento se resiente considerablemente. Los resultados que proporciona pueden ser repetitivos, poco originales o inapropiados, así como falsos (uno de los grandes problemas de la IA son las alucinaciones, motivo por el que no debe confiarse plenamente en ella para fines investigativos).
Las grandes compañías tecnológicas como Google, Amazon, Meta, Microsoft, xAI u OpenAI recurren a repositorios abiertos y gratuitos con grandes cantidades de datos para entrenar sus sistemas de inteligencia artificial. El problema es que son limitados, por lo que a veces también acuden a bibliotecas privadas para avanzar en sus proyectos. El contenido de estas fuentes suele estar protegido por derechos de autor, y sin el consentimiento de estos no podría utilizarse. Esto no ha sido impedimento para Meta, que descargó 81 TB de libros pirateados por torrent.
Pero parece que no es la única gran tecnológica que no respeta la propiedad intelectual. Hace unos días, OpenAI perdió una demanda por derechos de autor de letras de canciones en un tribunal de primera instancia de Alemania al no pagar las regalías pertinentes a los autores afectados.
Un veredicto que podría sentar un precedente en el resto de Europa
Un tribunal de Múnich acaba de dictaminar que los grandes modelos de lenguaje como ChatGPT infringen las leyes alemanas de derechos de autor al utilizar letras de canciones en sus respuestas sin haber pagado las correspondientes licencias. Así lo ha declarado la jueza Elke Schwager del Tribunal de Distrito de Múnich I, afirmando que sancionará a OpenAI por una cuantía no especificada.
Los expertos creen que este veredicto podría marcar un antes y un después en la industria de la inteligencia artificial respecto a las leyes de propiedad intelectual y derechos de autor. A pesar del veredicto, este se puede apelar. "No estamos de acuerdo con el veredicto y estamos examinando las medidas a seguir", dijo OpenAI.
La GEMA (Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte), es la entidad de defensa de los derechos de autor en Alemania, encargada también de gestionar el canon con que se graban los dispositivos de almacenamiento de datos. Utilizó nueve canciones específicas como ejemplos para el caso, incluyendo títulos como "Männer (Hombres)" de Herbert Grönemeyer, e "In der Weihnachtsbäckerei (En la panadería de Navidad)" de Rolf Zuckowski.
La ley de derechos de autor de Alemania (Urheberrecht) es diferente a la angloamericana, ya que hace mayor hincapié en el artista o autor individual, y considera que los derechos son intransferibles, a diferencia de la propiedad del titular del contenido (como una editorial o discográfica). Si bien el veredicto solo afecta al país germano, uno de los abogados de la GEMA afirmó que podría sentar un precedente para toda Europa. Kai Welp, abogado de GEMA, comentó:
Estamos, por supuesto, sumamente satisfechos de que la cámara haya dictado una resolución tan clara. El objetivo no es retirar nada del mercado, sino obtener una compensación justa