CriticGPT s’attaque aux erreurs de ChatGPT, ou quand l’IA se met à corriger l’IA

28 juin 202428/06/2024 • 11:52

ChatGPT n’est pas infaillible. Pour l’améliorer et corriger ses erreurs, OpenAI utilise CriticGPT, un modèle de langage rompu à la détection d’erreurs.

ChatGPT est sans nul doute le modèle de langage le plus connu et utilisé actuellement. Mais contrairement à une calculatrice qui ne peut se tromper, l’intelligence artificielle n’est pas infaillible. D’ailleurs, les réponses de ChatGPT sont toujours suivies de la mention « ChatGPT peut faire des erreurs. Envisagez de vérifier les informations importantes. »

Aussi OpenAI a-t-il mis au point CriticGPT, un modèle d’intelligence artificielle conçu pour identifier et corriger les erreurs dans les réponses générées par ChatGPT. Ce service de recherche d’erreurs est basé sur le modèle GPT-4, la version la plus avancée à ce jour.

Pour aller plus loin
ChatGPT, Gemini et Copilot ont un nouveau concurrent en France et en Europe : Claude AI est enfin disponible

CriticGPT, un outil pour traquer les erreurs complexes

Le rôle principal de CriticGPT est de servir d’outil d’assistance pour les formateurs d’IA humains. Ces formateurs travaillent à améliorer la précision des réponses de GPT-4 en utilisant une méthode appelée Apprentissage par Renforcement à partir de Retours Humains (RLHF). Dans ce processus, les formateurs évaluent et comparent les réponses de ChatGPT pour déterminer les meilleures.

Cependant, à mesure que ChatGPT devient plus précis, il devient plus difficile pour ces formateurs de détecter les erreurs subtiles. CriticGPT intervient alors pour aider à identifier ces erreurs qu’ils pourraient louper. Il analyse les réponses de ChatGPT et fournit des critiques qui mettent en évidence les inexactitudes, aidant ainsi les formateurs à améliorer la qualité des réponses.

OpenAI a formé CriticGPT en lui faisant analyser et critiquer un grand nombre de réponses contenant des erreurs. Certaines de ces erreurs étaient insérées délibérément par des humains, tandis que d’autres étaient des bugs de ChatGPT précédemment identifiés par les formateurs.

Chercher l’erreur dans le détecteur d’erreurs

Néanmoins, il faut aussi traquer l’erreur dans le détecteur d’erreurs puisque CriticGPT peut aussi être sujet à des problèmes d’IA tels que les hallucinations où le modèle génère des réponses incorrectes ou non fondées. Ces hallucinations, ou confabulations, peuvent induire en erreur les formateurs lorsqu’ils étiquettent les réponses.

OpenAI travaille actuellement à surmonter les limitations de CriticGPT, notamment en développant des méthodes pour aider les formateurs à comprendre et à évaluer des tâches longues et complexes. L’objectif est d’affiner la capacité de CriticGPT à détecter les erreurs dans une gamme plus large de réponses, rendant ainsi le processus d’entraînement plus efficace et précis.

Envie de rejoindre une communauté de passionnés ? Notre Discord vous accueille, c’est un lieu d’entraide et de passion autour de la tech.

ChatGPT

Télécharger gratuitement

Signaler une erreur dans le texte

Source : OpenAI

Les notifications web

Les notifications push vous permettent de recevoir toute l'actualité de Frandroid en temps réel dans votre navigateur ou sur votre téléphone Android.

Activer les notifications

Choisir les notifications

En savoir plus sur les notifications web