ChatGPT, dis-nous tout… même tes sources

 
L’Union européenne souhaiterait réguler l’IA générative en forçant leurs développeurs à publier un résumé des sources employées.
GPT-4 imaginé par Midjourney
GPT-4 imaginé par Midjourney // Source : Midjourney par Frandroid

Les intelligences artificielles ne vous disent pas tout ! Surtout, elles ne vous disent que très rarement d’où elles tirent leurs informations et une certaine opacité plane sur le corpus utilisé pour leur entrainement. Dans le cas de ChatGPT, le plus connu à l’heure actuelle, on sait qu’il tire son savoir « des articles de journaux, des romans, des scripts de films et de télévision, ainsi que des conversations en ligne », mais aussi de sources comme Wikipédia. Cela reste néanmoins très flou.

Toujours à la pointe de la régulation du Web, l’Union européenne cherche aujourd’hui à lever ce voile opaque.

L’UE veut réguler l’IA

L’Union européenne est pionnière lorsqu’il s’agit de la régulation des travers du Web et les géants de la tech. Récemment, on parlait notamment du DSA, visant à réguler le contenu en ligne, et du DMA qui aspire à donner plus de choix au consommateur. Dorénavant, ce sont les IA génératives qui sont dans le viseur de Bruxelles.

L’UE souhaite actuellement établir un cadre juridique autour de l’IA et présente en ce sens un nouvel amendement à un projet de loi (l’AI Act) en passe d’être adopté, rapporte le Wall Street Journal qui a pu consulter le texte en question. Ce projet de loi obligerait ainsi les développeurs d’IA génératives à publier « un résumé suffisamment détaillé » des documents protégés par le droit d’auteur ayant été utilisés. Cela concernerait évidemment ChatGPT, mais aussi les IA génératives d’images comme Midjourney, et d’autres encore.

Vers une juste rémunération

Si la question ne s’est pas encore posée en profondeur autour des textes générés par ChatGPT, de nombreux artistes ont déjà levé la voix contre l’utilisation de leurs œuvres dans l’entrainement d’IA comme Dall-E ou Midjourney. Il ne fait aucun doute que la question du droit d’auteur de ces modèles d’IA sera au cœur de nombreuses affaires juridiques dans les années à venir.

La question se soulève également pour celles et ceux dont le texte a nourri ces intelligences artificielles. Le ChatGPT de Bing a par exemple accès à internet et peut ainsi donner des informations issues de sites Web. S’ils sont généralement sourcés (c’est à peine le cas pour les recettes de cuisine), leurs auteurs ne sont pas rémunérés pour leur travail.

Dragoș Tudorache, un membre du Parlement européen codirigeant les travaux sur l’AI Act explique que cet amendement « ouvre la porte aux détenteurs de droits ». « Notre objectif est d’accroître la responsabilité, la transparence et la surveillance de ces modèles ».

Une loi à confirmer

À l’heure actuelle, ni le projet de loi ni l’amendement en question n’ont été votés. La version définitive du projet de loi sera discutée dans le courant de l’année. Reste à savoir par ailleurs comment une telle loi pourrait être mise en application. Rappelons que certains créateurs sont parfois dépassés par le fonctionnement précis de leur IA. Tant que le corpus d’entrainement est fourni manuellement, il est aisé d’en connaître les détails, mais dès lors qu’une IA sera lâchée sur le Web, cela risque d’être bien plus compliqué. Mais c’est également une très mauvaise idée à en croire l’expérience de Microsoft avec Tay, une intelligence artificielle créée pour apprendre de Twitter… et devenue raciste en moins de 24 heures.


Envie de rejoindre une communauté de passionnés ? Notre Discord vous accueille, c’est un lieu d’entraide et de passion autour de la tech.

Les derniers articles