Ces chercheurs ont reproduit une version de DeepSeek pour 30 dollars

 
Une équipe de recherche a recréé la technologie de base de DeepSeek pour seulement 30 dollars. Une prouesse qui questionne les coûts associés à ce nouveau secteur technologique.
DeepSeek // Source : Frandroid

Après avoir secoué l’industrie avec des coûts radicalement inférieurs à ceux de son concurrent américain OpenAI et déclenché la colère de ce dernier, le modèle open source de DeepSeek attire cette fois-ci l’attention des chercheurs. Une équipe de l’université de Berkeley a récemment annoncé avoir recréé le cœur de la technologie de DeepSeek pour seulement 30 dollars.

Un modèle en apprentissage

C’est sur X (anciennement Twitter) que Jiayi Pan, doctorant à l’université de Berkeley, a dévoilé cette prouesse. Dans une série de publications, il explique comment son équipe a procédé pour concevoir une IA basée sur le modèle DeepSeek R1-Zero en l’implantant dans une adaptation du jeu Des chiffres et des lettres. Contrairement au modèle premium de DeepSeek, qui compte 671 milliards de paramètres, leur version initiale n’en possédait initialement que 500 millions. Si elle produisait d’abord des réponses erronées, les chercheurs ont progressivement augmenté sa capacité pour obtenir de bons résultats à partir de trois milliards de paramètres, l’IA parvenant à trouver les bonnes réponses en moins d’étapes et surtout en parvenant à se corriger.

Exemple de raisonnement du modèle de l’équipe de Jiayi Pan // Source : X (Twitter)

Ce qui est d’autant plus impressionnant, c’est que l’équipe de Pan affirme avoir accompli cela pour un coût d’environ 30 dollars. Actuellement, les API d’OpenAI coûtent 15 dollars par million de jetons d’entrée, soit plus de 27 fois le prix des 0,55 dollar par million de jetons d’entrée de DeepSeek-R1, rapporte Tom’s Hardware.

Pour aller plus loin
C’est quoi un LLM ? Comment fonctionnent les moteurs de ChatGPT, Gemini et autres ?

Ces coûts restent cependant à nuancer, car ils ne tiennent compte que de coûts techniques associés à l’étude et mettent de côté les coûts humains et structurels de recherche. Pour les plus curieux et désireux de reproduire cet exploit, Jiayi Pan a détaillé sa méthodologie complète et l’a rendu accessible sur GitHub.


Les derniers articles