ChatGPT est sans nul doute le modèle de langage le plus connu et utilisé actuellement. Mais contrairement à une calculatrice qui ne peut se tromper, l’intelligence artificielle n’est pas infaillible. D’ailleurs, les réponses de ChatGPT sont toujours suivies de la mention « ChatGPT peut faire des erreurs. Envisagez de vérifier les informations importantes. »
Aussi OpenAI a-t-il mis au point CriticGPT, un modèle d’intelligence artificielle conçu pour identifier et corriger les erreurs dans les réponses générées par ChatGPT. Ce service de recherche d’erreurs est basé sur le modèle GPT-4, la version la plus avancée à ce jour.
Pour aller plus loin
ChatGPT, Gemini et Copilot ont un nouveau concurrent en France et en Europe : Claude AI est enfin disponible
CriticGPT, un outil pour traquer les erreurs complexes
Le rôle principal de CriticGPT est de servir d’outil d’assistance pour les formateurs d’IA humains. Ces formateurs travaillent à améliorer la précision des réponses de GPT-4 en utilisant une méthode appelée Apprentissage par Renforcement à partir de Retours Humains (RLHF). Dans ce processus, les formateurs évaluent et comparent les réponses de ChatGPT pour déterminer les meilleures.
Cependant, à mesure que ChatGPT devient plus précis, il devient plus difficile pour ces formateurs de détecter les erreurs subtiles. CriticGPT intervient alors pour aider à identifier ces erreurs qu’ils pourraient louper. Il analyse les réponses de ChatGPT et fournit des critiques qui mettent en évidence les inexactitudes, aidant ainsi les formateurs à améliorer la qualité des réponses.
OpenAI a formé CriticGPT en lui faisant analyser et critiquer un grand nombre de réponses contenant des erreurs. Certaines de ces erreurs étaient insérées délibérément par des humains, tandis que d’autres étaient des bugs de ChatGPT précédemment identifiés par les formateurs.
Chercher l’erreur dans le détecteur d’erreurs
Néanmoins, il faut aussi traquer l’erreur dans le détecteur d’erreurs puisque CriticGPT peut aussi être sujet à des problèmes d’IA tels que les hallucinations où le modèle génère des réponses incorrectes ou non fondées. Ces hallucinations, ou confabulations, peuvent induire en erreur les formateurs lorsqu’ils étiquettent les réponses.
OpenAI travaille actuellement à surmonter les limitations de CriticGPT, notamment en développant des méthodes pour aider les formateurs à comprendre et à évaluer des tâches longues et complexes. L’objectif est d’affiner la capacité de CriticGPT à détecter les erreurs dans une gamme plus large de réponses, rendant ainsi le processus d’entraînement plus efficace et précis.
Chaque matin, WhatsApp s’anime avec les dernières nouvelles tech. Rejoignez notre canal Frandroid pour ne rien manquer !
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix