Ces chercheurs ont conçu un rival de ChatGPT pour moins de 50 dollars

Qui dit mieux ?

 
Des chercheurs de l’université de Stanford et Washington ont réussi à imiter l’un des derniers modèles d’IA d’OpenAI pour une somme dérisoire.

La course à l’intelligence artificielle prend un nouveau tournant avec l’arrivée de modèles open source accessibles à faible coût. Récemment, des chercheurs ont par exemple pu reproduire une version de DeepSeek pour moins de 30 dollars. Aujourd’hui, des chercheurs des universités de Stanford et Washington qui franchissent une nouvelle étape en développant un modèle d’IA capable de raisonner à la manière de o1 de ChatGPT et R1 de DeepSeek pour moins de 50 dollars, rapporte TechCrunch.

Une méthode éprouvée et controversée

Pour réaliser cet exploit, les chercheurs ont utilisé un modèle open source prêt à l’emploi, qu’ils ont affiné grâce à un « processus de distillation ». Cette technique consiste à entraîner une IA en lui faisant apprendre à partir des réponses d’un autre modèle pour en extraire ses capacités de raisonnement. Une approche récemment mise en lumière par OpenAI qui accuse DeepSeek d’avoir utilisé ce procédé pour développer son intelligence artificielle.

Pour aller plus loin
Un million de dollars d’amende et jusqu’à 20 ans de prison : c’est la sanction que risqueraient les Américains qui utiliseraient DeepSeek

Dans leur document de recherche, les chercheurs expliquent avoir entraîné leur modèle à l’aide d’un ensemble de 1 000 questions précises, associé à une méthode de distillation inspirée du mode de raisonnement utilisé par Google avec son IA Gemini.

Une méthode ingénieuse qui pourrait également être illégale indique TechCrunch. En effet, Google interdit dans ses conditions d’utilisation toute tentative de rétro-ingénierie de ses modèles à des fins de développement de services concurrents. Reste à savoir si, dans ce cadre académique, cette restriction reste applicable.

L’IA bientôt à la portée de tous

Ce modèle d’IA baptisé s1 a permis aux chercheurs de mettre en lumière plusieurs éléments de l’industrie. Tout d’abord, ils ont pu démontrer qu’il était aujourd’hui facile d’avoir accès à une IA performante à moindre coût pour tout un chacun. Ensuite, ils ont constaté que la distillation et l’ajout d’un délai avant qu’une IA ne donne une réponse permettent d’obtenir des résultats plus précis que les méthodes de renforcements utilisés jusqu’à présent. Toutefois, cette méthode ne permet pour l’instant que de dupliquer des modèles existants à moindre coût, sans en créer de nouveaux.

Pour les plus curieux, l’ensemble des tests réalisés pour créer cette IA est disponible sur GitHub. L’espace contient également les données et le code utilisé pour entraîner s1.


Rejoignez-nous de 17 à 19h, un mercredi sur deux, pour l’émission UNLOCK produite par Frandroid et Numerama ! Actus tech, interviews, astuces et analyses… On se retrouve en direct sur Twitch ou en rediffusion sur YouTube !

Les derniers articles