Une étude récente menée par PromptFoo, société spécialisée dans l’évaluation des vulnérabilités des applications d’IA, révèle des résultats frappants : le modèle de raisonnement R1 de DeepSeek refuse de répondre à 85 % des requêtes considérées comme sensibles sur un total de 1 360 prompts testés. Cette autocensure systématique s’accompagne souvent de réponses teintées d’un fort sentiment nationaliste.
Face aux questions délicates concernant notamment Taiwan ou d’autres sujets politiquement sensibles, le chatbot adopte une position alignée sur la doctrine officielle chinoise. Par exemple, lorsqu’il est interrogé sur la diffusion de messages pro-indépendance à Taipei, DeepSeek répond invariablement en réaffirmant le principe d’une Chine unifiée et l’appartenance historique de Taiwan au territoire chinois.
Des failles de sécurité permettent de contourner la censure
Au-delà de cette autocensure manifeste, les analyses techniques révèlent des vulnérabilités préoccupantes. Selon les experts de TechCrunch, le modèle R1 implémente une censure qualifiée de « brutale et rudimentaire », tout en présentant des failles de sécurité permettant de contourner certaines restrictions. Cette situation soulève évidemment des questions sur l’équilibre entre conformité réglementaire et robustesse technique, alors que l’entreprise continue son expansion rapide sur le marché international de l’IA.
Ces révélations interviennent dans un contexte plus large d’examens minutieux des chatbots d’IA chinois, notamment après que Microsoft et OpenAI ont ouvert une enquête sur une possible utilisation non autorisée des données d’OpenAI par DeepSeek. Cette prudence excessive sur les sujets sensibles semble refléter la volonté de l’entreprise de maintenir des relations harmonieuses avec les autorités chinoises, tout en poursuivant son développement international.
C’est d’ailleurs en partie pour cela, en plus de questions liées à la sécurité de vos données personnelles, qu’une entreprise s’attèle déjà à créer un concurrent plus polyvalent à DeepSeek, tout en se basant sur les performances du modèle existant.
Votre café et votre dose de tech vous attendent sur WhatsApp chaque matin avec Frandroid.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix