CriticGPT s’attaque aux erreurs de ChatGPT, ou quand l’IA se met à corriger l’IA

 
ChatGPT n’est pas infaillible. Pour l’améliorer et corriger ses erreurs, OpenAI utilise CriticGPT, un modèle de langage rompu à la détection d’erreurs.
ChatGPT

ChatGPT est sans nul doute le modèle de langage le plus connu et utilisé actuellement. Mais contrairement à une calculatrice qui ne peut se tromper, l’intelligence artificielle n’est pas infaillible. D’ailleurs, les réponses de ChatGPT sont toujours suivies de la mention « ChatGPT peut faire des erreurs. Envisagez de vérifier les informations importantes. »

Aussi OpenAI a-t-il mis au point CriticGPT, un modèle d’intelligence artificielle conçu pour identifier et corriger les erreurs dans les réponses générées par ChatGPT. Ce service de recherche d’erreurs est basé sur le modèle GPT-4, la version la plus avancée à ce jour.

Pour aller plus loin
ChatGPT, Gemini et Copilot ont un nouveau concurrent en France et en Europe : Claude AI est enfin disponible

CriticGPT, un outil pour traquer les erreurs complexes

Le rôle principal de CriticGPT est de servir d’outil d’assistance pour les formateurs d’IA humains. Ces formateurs travaillent à améliorer la précision des réponses de GPT-4 en utilisant une méthode appelée Apprentissage par Renforcement à partir de Retours Humains (RLHF). Dans ce processus, les formateurs évaluent et comparent les réponses de ChatGPT pour déterminer les meilleures.

Cependant, à mesure que ChatGPT devient plus précis, il devient plus difficile pour ces formateurs de détecter les erreurs subtiles. CriticGPT intervient alors pour aider à identifier ces erreurs qu’ils pourraient louper. Il analyse les réponses de ChatGPT et fournit des critiques qui mettent en évidence les inexactitudes, aidant ainsi les formateurs à améliorer la qualité des réponses.

OpenAI a formé CriticGPT en lui faisant analyser et critiquer un grand nombre de réponses contenant des erreurs. Certaines de ces erreurs étaient insérées délibérément par des humains, tandis que d’autres étaient des bugs de ChatGPT précédemment identifiés par les formateurs.

Chercher l’erreur dans le détecteur d’erreurs

Néanmoins, il faut aussi traquer l’erreur dans le détecteur d’erreurs puisque CriticGPT peut aussi être sujet à des problèmes d’IA tels que les hallucinations où le modèle génère des réponses incorrectes ou non fondées. Ces hallucinations, ou confabulations, peuvent induire en erreur les formateurs lorsqu’ils étiquettent les réponses.

OpenAI travaille actuellement à surmonter les limitations de CriticGPT, notamment en développant des méthodes pour aider les formateurs à comprendre et à évaluer des tâches longues et complexes. L’objectif est d’affiner la capacité de CriticGPT à détecter les erreurs dans une gamme plus large de réponses, rendant ainsi le processus d’entraînement plus efficace et précis.


Chaque matin, WhatsApp s’anime avec les dernières nouvelles tech. Rejoignez notre canal Frandroid pour ne rien manquer !