DeepSeek, une entreprise chinoise soutenue par le fonds High-Flyer Capital Management, a dévoilé son dernier modèle LLM d’IA : DeepSeek V3. Et les premiers résultats sont impressionnants.
Pour aller plus loin
C’est quoi un LLM ? Comment fonctionnent les moteurs de ChatGPT, Gemini et autres ?
Une grosse puissance brute
Avec ses 671 milliards de paramètres (les « neurones » de l’IA), DeepSeek V3 écrase littéralement la concurrence en termes de puissance brute. Pour mettre ce chiffre en perspective, c’est 1,6 fois plus que le Llama 3.1 de Meta, considéré jusqu’ici comme une référence dans le domaine.
Cette puissance se traduit par des performances exceptionnelles dans de nombreux domaines : codage, traduction, rédaction… Le modèle excelle particulièrement dans les tests de programmation sur Codeforces, où il surpasse même GPT-4o d’OpenAI.
Mais ce qui rend DeepSeek V3 vraiment remarquable, c’est son rapport qualité-prix. L’entreprise affirme n’avoir dépensé que 5,5 millions de dollars pour son développement, une somme dérisoire comparée aux centaines de millions investis par OpenAI pour GPT-4.
Quelques limitations
Cependant, le modèle présente quelques limitations, notamment en termes de besoins matériels.
Sa taille imposante nécessite une infrastructure conséquente pour fonctionner efficacement.
Plus problématique encore, le modèle reflète certaines contraintes politiques chinoises. Soumis à la régulation du gouvernement chinois, DeepSeek V3 évite soigneusement certains sujets sensibles.
Malgré ces restrictions, l’impact de DeepSeek V3 est là. Avec un coût d’utilisation via API particulièrement compétitif (0,27 $/million de tokens en entrée, 1,10 $/million en sortie), il représente une alternative sérieuse aux modèles occidentaux plus onéreux.
Comment utiliser DeepSeek V3 ?
Pour ceux qui souhaitent faire des tests avec ce nouveau modèle d’IA, il existe plusieurs façons d’accéder à DeepSeek V3.
La méthode la plus simple consiste à utiliser l’interface web officielle disponible sur chat.deepseek.com. Cette plateforme permet d’interagir directement avec le modèle et inclut même une fonction de recherche Internet pour obtenir des réponses en temps réel. C’est la solution idéale pour les débutants ou ceux qui souhaitent tester rapidement les capacités du modèle.
Pour les développeurs et les utilisateurs plus techniques, DeepSeek V3 est disponible sur Hugging Face, la plateforme de référence pour les modèles d’IA.
L’intérêt de DeepSeek V3 réside dans sa licence permissive, open-source, qui autorise son utilisation pour la plupart des applications, y compris commerciales. Les développeurs peuvent donc non seulement utiliser le modèle, mais aussi le modifier pour l’adapter à leurs besoins spécifiques.
DeepSeek a publié le modèle sur GitHub et un document technique détaillé qui décrit ses capacités.
Si vous voulez recevoir les meilleures actus Frandroid sur WhatsApp, rejoignez cette discussion.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix