« Freeware » : Microsoft estime qu’il est normal de pomper les contenus du web pour améliorer l’IA

 

Le patron de l'intelligence artificielle chez Microsoft a indiqué, lors d'une interview, que tous les contenus déjà existants sur le web pouvaient être librement copiés pour entraîner les IA. Il parle ainsi de « freeware ».

L’intelligence artificielle n’a pas fini de soulever moult interrogations autour de l’éthique. Microsoft nous en apporte un nouvel exemple par l’intermédiaire de son patron de l’IA, Mustafa Suleyman. Ce dernier a répondu à quelques questions de CNBC durant l’Apen Ideas Festival.

Notamment interrogé sur la question de la propriété intellectuelle, le responsable affirme que l’intégralité des contenus partagés sur Internet est, de fait, disponible et utilisable pour entraîner les intelligences artificielles.

En ce qui concerne le contenu qui se trouve déjà sur le web libre, le contrat social de ce contenu depuis les années 90 est le fair use [utilisation équitable, raisonnable, en français ; NDLR]. Tout le monde peut le copier, le recréer, le reproduire. C’est ce qu’on peut appeler freeware, si l’on veut. C’est comme ça qu’on le comprend.

Mustafa Suleyman précise qu’il y a une « catégorie distincte » où un site web demande explicitement à ne pas être scrapé de la sorte pour une autre raison que l’indexation sur des moteurs de recherche. « Il s’agit d’une zone grise et je pense qu’elle sera examinée par les tribunaux ».

L’IA générative, le plagiat et les inquiétudes

Ces déclarations soulèvent évidemment plusieurs questions. Jusqu’à quel point peut-on utiliser le travail d’autrui sans tomber dans le plagiat ? Et faut-il autoriser la monétisation des contenus ainsi générés ? Microsoft et d’autres acteurs de l’IA respectent-ils vraiment les demandes des plateformes ne souhaitant pas être utilisées pour entraîner l’IA ou profitent-ils de cette fameuse « zone grise » ?

Bref, on en revient au principal sujet de débat autour de l’IA générative. Puisque cette dernière ne peut créer du contenu qu’en s’appuyant sur ce qui a déjà été créé, d’aucuns estiment qu’il s’agit purement et simplement d’un vol, affectant notamment les artistes. Cette problématique était déjà au cœur des manifestations à Hollywood, mais également du gros procès opposant le New York Times à OpenAI. Le média américain estime que ChatGPT plagie ses articles.

Les propos tenus par Mustafa Suleyman n’aideront a priori pas à apaiser les craintes autour de l’IA.