
Quand la concurrence est rude, un petit coup de pouce ne fait pas de mal. Alors que Meta vient de publier sa nouvelle génération de modèles d’intelligence artificielle durant le week-end, plusieurs spécialistes soupçonnent l’entreprise d’avoir gonflé artificiellement les capacités de ces machines pour qu’elles paraissent plus douées que celles d’OpenAI ou de Google.
D’après TechCrunch, sur un test spécifiquement dédié à mesurer l’efficacité des grands modèles de langage, Facebook a tenté d’obtenir le meilleur score en filoutant un petit peu.
Une IA taillée pour la compétition ?
Tout part du site LMArena qui est censé indiquer via des scores simples quelle est L’IA la plus « intelligente » sur le marché. Lors de la publication de ses nouveaux modèles d’IA il y a quelques jours, un a fait particulièrement les gros titres : Llama 4 Maverick. Semblant flotter largement au-dessus de la concurrence sur les tests de LMArena, l’IA tête de gondole de Meta redéfinissait plus ou moins les limites de ce qui est faisable sur un modèle d’IA, et le tout sur un produit open source utilisable par tous.
Sauf que… pas vraiment. Le modèle spécifiquement mis en ligne sur le site de comparaison est en fait différent de celui que Meta a rendu public. Sur LMArena, c’est une version « expérimentale » du chatbot qui a fait mordre la poussière à la concurrence, tandis que le modèle public était lui bien moins impressionnant dans ses réponses.

Certains spécialistes de l’industrie ont même soupçonné Meta d’avoir entraîné ce modèle expérimental sur des données spécifiquement taillées pour briller sur les critères de comparaison de LMArena. Un peu comme un élève qui apprendrait un cours par cœur sans rien y comprendre pour autant.
Du flou et un loup ?
Un porte-parole de Meta a nié avoir eu recours à ces méthodes pour gonfler le score de Llama 4 Maverick, expliquant simplement que tous les prestataires offrant un accès au nouveau modèle n’avaient pas encore fini de le paramétrer proprement, ce qui explique les différences de qualité.
Pour aller plus loin
Après Le Chat, ChatGPT, Claude, Grok… voici un nouveau chatbot IA gratuit sur WhatsApp, Facebook, Instagram et Messenger
Et concernant la différence entre le modèle public et le modèle mis en ligne sur LMArena, il s’agit moins d’une tromperie que d’une déclaration un peu trompeuse. Un graphique sur le site de Meta précise bien que le modèle soumis au test était « optimisé pour la conversation », mais le flou a tout de même été savamment entretenu par le fait même de mettre en ligne le même jour un modèle expérimental et un modèle public portant le même nom ou presque.
Pour ne rater aucun bon plan, rejoignez notre nouveau channel WhatsApp Frandroid Bons Plans, garanti sans spam !
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix