Meta accusé d’avoir piraté des livres pour entraîner son IA

Meta accusé d’avoir piraté des livres pour entraîner son IA
Meta accusé d’avoir piraté des livres pour entraîner son IA

De quoi raviver les tensions entre créateurs et intelligence artificielle. Cette semaine, un collectif d’auteurs, dont Ta-Nehisi Coates et la comédienne Sarah Silverman, poursuivent Meta. En cause : l’utilisation présumée de leurs œuvres, sans autorisation, pour entraîner Llama, le modèle linguistique de l’entreprise conçu pour ses chatbots.

LibGen, une base de données déjà condamnée

Les documents judiciaires, basés sur des échanges internes chez Meta, pointent du doigt le rôle de Mark Zuckerberg. Le PDG aurait ainsi validé l’exploitation de LibGen, ou Library Genesis, un « bibliothèque fantôme» Russe contenant des dizaines de téraoctets de livres numérisés, dont des œuvres protégées par le droit d’auteur.

Déjà condamnée à une amende de 30 millions de dollars en 2024 pour violation du droit d’auteur, cette base de données a néanmoins été intégrée aux travaux de Meta, malgré les avertissements internes sur le caractère illégal de cette action.

Une note interne qui fait débat

Selon Le gardien une note interne de l’entreprise fait référence aux initiales de Mark Zuckerberg : «Après escalade vers MZ, l’équipe AI a reçu le feu vert pour utiliser LibGen.» Une décision qui, selon d’autres documents, aurait suscité des débats au sein de l’entreprise.

À LIRE – HarperCollins vend ses livres à AI, une offre jugée « insultante »

Les ingénieurs Meta ont en effet émis des réserves quant à l’accès à ces données, par ailleurs via les équipements de l’entreprise. Conscients de l’illégalité de leur démarche et du préjudice causé aux auteurs et éditeurs, ils ont également alerté sur les possibles répercussions sur… l’image de l’entreprise : «La couverture médiatique mentionnant l’utilisation d’une base de données que l’on sait piratée, comme LibGen, risque de nuire à nos négociations.»

Une affaire relancée

Cette plainte fait suite à un premier recours intenté en 2023 par les mêmes auteurs. Bien que rejetée par le juge fédéral Vince Chhabria, la nouvelle plainte s’appuie désormais sur des preuves étayant les accusations de violation du droit d’auteur. Les plaignants envisagent également d’ajouter une accusation de fraude informatique, ce qu’ils estiment approprié dans la situation.

Le juge Vince Chhabria reste cependant prudent, et déclare douter de la « solidité des accusations de fraude et de gestion des droits d’auteur ».

Un cadre juridique encore flou

La polémique ravive un débat crucial : l’utilisation de textes protégés pour entraîner des modèles d’intelligence artificielle. Créateurs et éditeurs alertent sur les risques qui pèsent sur leurs revenus, tandis que les géants du secteurtechnologieexploiter ces bases sans cadre juridique clair.

Une étude récente de la Authors’ Licensing and Collecting Society (ALCS) révèle que 77 % des auteurs ne savent pas si leurs œuvres ont été utilisées contre leur gré, et 91 % réclament un droit de consultation avant tout transfert.

LIRE – L’avenir de l’édition : un outil d’IA qui évalue la qualité des livres

Pour les auteurs comme pour les maisons d’édition, l’enjeu est majeur : protéger leurs droits et établir un modèle économique viable dans un monde où l’IA générative bouleverse l’écosystème créatif. Mais sans une législation rapide, les batailles juridiques risquent de s’accumuler…

Crédits image : Alpha Photo CC BY-NC 2.0

Par Louella Boulland
Contact : [email protected]

 
For Latest Updates Follow us on Google News
 

PREV Les Monfils-Mpetshi affrontent Perricard et Daniil Medvedev au soleil
NEXT Léon Marchand toujours plus haut, Pauline Ferrand-Prévôt a rendez-vous avec le Tour, quelle réussite pour Kylian Mbappé… 12 questions sur l’année 2025