La course à l’intelligence artificielle prend un nouveau tournant avec l’arrivée de modèles open source accessibles à faible coût. Récemment, des chercheurs ont par exemple pu reproduire une version de DeepSeek pour moins de 30 dollars. Aujourd’hui, des chercheurs des universités de Stanford et Washington qui franchissent une nouvelle étape en développant un modèle d’IA capable de raisonner à la manière de o1 de ChatGPT et R1 de DeepSeek pour moins de 50 dollars, rapporte TechCrunch.
Une méthode éprouvée et controversée
Pour réaliser cet exploit, les chercheurs ont utilisé un modèle open source prêt à l’emploi, qu’ils ont affiné grâce à un « processus de distillation ». Cette technique consiste à entraîner une IA en lui faisant apprendre à partir des réponses d’un autre modèle pour en extraire ses capacités de raisonnement. Une approche récemment mise en lumière par OpenAI qui accuse DeepSeek d’avoir utilisé ce procédé pour développer son intelligence artificielle.
Pour aller plus loin
Un million de dollars d’amende et jusqu’à 20 ans de prison : c’est la sanction que risqueraient les Américains qui utiliseraient DeepSeek
Dans leur document de recherche, les chercheurs expliquent avoir entraîné leur modèle à l’aide d’un ensemble de 1 000 questions précises, associé à une méthode de distillation inspirée du mode de raisonnement utilisé par Google avec son IA Gemini.
Une méthode ingénieuse qui pourrait également être illégale indique TechCrunch. En effet, Google interdit dans ses conditions d’utilisation toute tentative de rétro-ingénierie de ses modèles à des fins de développement de services concurrents. Reste à savoir si, dans ce cadre académique, cette restriction reste applicable.
L’IA bientôt à la portée de tous
Ce modèle d’IA baptisé s1 a permis aux chercheurs de mettre en lumière plusieurs éléments de l’industrie. Tout d’abord, ils ont pu démontrer qu’il était aujourd’hui facile d’avoir accès à une IA performante à moindre coût pour tout un chacun. Ensuite, ils ont constaté que la distillation et l’ajout d’un délai avant qu’une IA ne donne une réponse permettent d’obtenir des résultats plus précis que les méthodes de renforcements utilisés jusqu’à présent. Toutefois, cette méthode ne permet pour l’instant que de dupliquer des modèles existants à moindre coût, sans en créer de nouveaux.
Pour les plus curieux, l’ensemble des tests réalisés pour créer cette IA est disponible sur GitHub. L’espace contient également les données et le code utilisé pour entraîner s1.
Rejoignez-nous de 17 à 19h, un mercredi sur deux, pour l’émission UNLOCK produite par Frandroid et Numerama ! Actus tech, interviews, astuces et analyses… On se retrouve en direct sur Twitch ou en rediffusion sur YouTube !
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix