Midjourney a-t-il réellement admis le plagiat de 4700 artistes dont Boulet, Uderzo, Akira Toriyama et Carl Barks ?

 
Il y a deux ans, Midjourney se vantait de pouvoir imiter le style de 4700 artistes.
Une illustration dessinée par Carl Barks

L’année 2024 sera-t-elle l’année où l’IA générative sera rattrapée par les ayants droit ayant nourri leurs intelligences ? Quelques jours après l’annonce d’un procès historique entre le New York Times et OpenAI ChatGPT, c’est la génération d’image de Midjourney qui fait la une pour un autre procès. Ce dernier voit s’opposer Stability AI, que l’on connait pour la génération d’images Stable Diffusion, et Sarah Andersen, autrice de bandes dessinées. D’autres autrices et auteurs ont depuis rejoint son combat juridique, dans lequel s’est aussi retrouvé impliqué Midjourney.

Et pour cause, une discussion accablante a été mise au jour concernant la création de Midjourney.

Le style de 4700 artistes

Dans le document de la complainte, les plaignants expliquent avoir trouvé des discussions sur Discord entre développeurs de Midjourney qui mettent en lumière le plagiat à grande échelle des IA génératives. On peut lire dans ces messages Discord, toujours en ligne au moment où cet article est écrit, le PDG de Midjourney David Holz vanter les mérites de son IA et sa capacité à imiter le style des artistes : « je pense que vous allez tous être époustouflés par cette fonction de style … nous avons été très libéraux dans la construction du dictionnaire … il y a des genres de base, des punks et des noms d’artistes … tout ce que nous pouvions y mettre … je dois être clair, ce n’est pas seulement des genres, c’est aussi des noms d’artistes … c’est surtout des noms d’artistes … 4 000 noms d’artistes ». Lors de cette discussion, il partage un document Google listant 4700 artistes que l’on retrouve désormais dans un fichier PDF servant de preuve au procès.

Un message publié par le CEO de Midjourney sur Discord

Avec 4 700 noms d’artistes, la base de données brasse très large. On y trouve des auteurs américains comme Carl Barks, dessinateur du personnage de Balthazar Picsou (Scrooge McDuck), mais aussi des auteurs européens comme Boulet ou Uderzo et des stars du dessin en Asie comme Akira Toriyama ou Clamp (Card Captor Sakura). Vous avez évidemment aussi des artistes plus classiques comme Pablo Picasso ou des personnalités du cinéma comme Brad Bird (Le Géant de Fer, Ratatouille, Les Indestructibles). Ce document Google existe toujours, mais est désormais inaccessible sans autorisation.

La question des sources

Mais attention, il s’agit bien d’une liste d’artistes que Midjourney souhaite être capable d’imiter. Or la clé du sujet n’est pas tant dans la création d’imitations, mais bien dans l’utilisation des œuvres d’origine pour entrainer le moteur de l’IA. C’est sur ce sujet que va devoir trancher le procès. Les plaignants pointent par exemple du doigt la base de données LAION-400M avec lequel a été entrainé Midjourney et Stable Diffusion. La liste des 4700 artistes, si elle peut facilement choquer sur les réseaux sociaux, ne semble pas à elle seule constituer une admission de plagiat de la part des développeurs de Midjourney. Pour les plaignants, l’objectif va être de démontrer que pour réussir à imiter ces 4000 styles d’artistes, Midjourney est allé consommer leurs œuvres sans leur autorisation.

Si l’IA générative semble d’ores et déjà bien installée dans les usages en seulement quelques mois, le cadre légal autour de son utilisation est toujours en pleine construction. En fin d’année 2023, le groupe média allemand Axel Springer (Politico, Business Insider) a signé un contrat avec OpenAI pour permettre à ChatGPT d’utiliser son contenu. L’Union européenne a déjà commencé à s’attaquer au sujet de la réglementation de l’IA.


Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).