C’est peut-être le procès du siècle qui vient de poindre à l’horizon. Alors que ChatGPT et l’IA générative ont le vent en poupe dans toute l’industrie de la tech, le média historique New York Times a annoncé poursuivre en justice Microsoft et OpenAI pour défendre sa propriété intellectuelle.
De quoi se plaint le New York Times ?
Le New York Times explique qu’il remplit une mission « vitale pour notre démocratie » depuis plus de 170 ans en menant des enquêtes et des reportages de fond. Une mission qui demande un investissement important et dont l’IA se servirait sans verser un sou. Le journal reproche à OpenAI et Microsoft de faire un usage illégal de cette masse de travail pour alimenter leurs LLM, et plus précisément que ChatGPT et Bing Chat (Microsoft Copilot désormais) peuvent profiter gratuitement de ce travail massif journalistique.
Pour défendre son cas, le média va donc se reposer sur la très stricte législation concernant le copyright, la propriété intellectuelle, aux États-Unis, qui est notamment protégée par la constitution du pays.
Au-delà du plagiat pur et simple du New York Times, le média met aussi en avant la qualité de son écriture. En effet, il estime que les articles publiés dans ses colonnes ont un poids très fort dans l’apprentissage des LLM car il s’agit d’un texte riche, c’est-à-dire écrit et corrigé de façon professionnelle par des humains avec un travail de recherche et de sources. Le New York Times mentionne, en exemple, qu’il se classe à la 42e position dans l’algorithme de Google comme l’un des sites web les plus importants au monde, derrière des sites de réseaux sociaux dont les écrits seraient moins intéressants pour l’IA.
Le New York Times entend enfin démontrer la masse d’argent générée par OpenAI et Microsoft sur le sujet. En particulier concernant le premier, souvent présenté comme une société à but non lucratif. À travers ses levées de fonds et son abonnement ChatGPT+, OpenAI est devenue l’une des entreprises les plus en vue de la tech. Pour le New York Times, ce sont des milliards de dollars de valeur complètement indue pour la start-up.
L’IA ne peut plus éviter la question du copyright
La question du copyright a déjà fait la une des médias depuis plusieurs mois quand il s’agit de l’IA générative. Pour devenir aussi intelligentes, les LLM comme GPT utilisé par ChatGPT, ou le LLM de Midjourney, ont avalé une quantité massive de données sur le web, sans jamais en demander l’autorisation.
Malgré des garde-fous timides mis en place, les outils issus de ces LLM peuvent sans problème procéder à du plagiat. C’est d’autant plus visible sur la génération d’images avec Midjourney ou Dall-E où l’on peut imiter de très près le style d’un artiste, et même reproduire certaines œuvres comme Mona Lisa.
L’exploitation de données à des fins lucratives par l’IA a déjà donné lieu à un mouvement de grèves des acteurs et actrices du cinéma et du jeu vidéo cette année.
Un procès déterminant
Le procès lancé par le New York Times face à Microsoft et OpenAI devrait donc être déterminant pour l’avenir de tout le secteur de l’IA. Il va décider de l’avenir de la capacité des LLM à pouvoir s’alimenter et la façon dont les entreprises qui les développent devront montrer patte blanche et rémunérer les ayants droit.
Le moins que l’on puisse dire, c’est que le dossier du New York Times semble solide. En plus de sa plainte très détaillée sur 69 pages, le média propose des centaines de milliers de documents pour prouver ce qu’il avance. On y retrouve notamment de nombreux articles publiés dans le New York Times et dont ChatGPT serait capable de donner des lignes sans sourciller.
Le média estime que les dommages et intérêts s’élèvent à plusieurs milliards de dollars. On comprend mieux pourquoi OpenAI chercherait à effectuer une levée de fonds de plusieurs milliards de dollars. Si elle a lieu, la société serait évaluée à 100 milliards de dollars.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix