Processeurs Intel instables : tout savoir sur l’affaire en 4 questions

 
Voici un résumé de ce que nous savons sur les soucis d’instabilité qui touchent certains processeurs Intel de bureau depuis l’année dernière.
Frandroid

Intel est dans la polémique depuis presque un an maintenant concernant des cas rapportés de processeurs instables en jeu. Rapidement, les puces concernées ont été identifiées, à savoir les 13900K et 14900K des générations Raptor Lake et Raptor Lake Refresh.

L’affaire a connu de nombreux rebondissements jusqu’à cet été 2024 quand Intel a confirmé avoir trouvé la cause profonde du problème avant d’annoncer le déploiement d’une mise à jour auprès des fabricants de cartes mères au courant du mois d’août.

L’affaire a pris de telles proportions que deux cabinets d’avocats ont lancé des enquêtes pour jauger de la pertinence d’un recours collectif en justice. Surtout, elle s’inscrit dans un contexte très trouble pour Intel qui a annoncé début août une vague de licenciement de plus de 15 000 employés d’ici à la fin de l’année.

Dans un esprit de synthèse, nous avons voulu résumer les tenants et aboutissants de l’affaire autour de quatre grandes questions. Les différents liens de cet article redirigent pour la plupart vers nos articles publiés au cours des derniers mois sur le sujet.

Que s’est-il passé avec les processeurs Intel ?

Les premiers témoignages d’instabilité datent de l’automne 2022 sur des forums comme Overclock.net ou Anandtech. Des utilisateurs font état à l’époque de plantages systématiques sur un processeur en particulier, l’i9-13900K, peu importe les paramètres et cas d’usage (overclocking ou non, tension par défaut, multithreading léger). Rien n’est encore prouvé à cette époque, mais la piste d’une tension trop élevée est déjà évoquée. Des erreurs « Out of video memory » sont aussi rapportées sur Reddit au même moment pour des jeux comme Hogwart’s Legacy ou Callisto Protocol.

Les choses s’accélèrent en 2023 lorsque de nouveaux témoignages sur le subreddit r/Intel parlent d’écrans bleus indiquant la mention « Unsupported processor » (processeur non supporté), ainsi que des phénomènes de retours bureau (crash to desktop). Ce n’est pas avant la rentrée 2023 que l’affaire commence à être médiatisée.

D’une part, certains développeurs de jeux Unreal Engine comme Remnant 2 ou Vermintide 2 (via PCGamer) ont tenu à prévenir les joueurs d’un problème systématique sur les modèles de processeur Intel les plus puissants de la 13eme et 14eme génération. En coulisse, c’est Oodle, une technologie de décompression utilisée par de nombreux jeux Unreal Engine, qui s’est exprimé sur les différentes alertes de ses utilisateurs, mentionnant les processeurs Intel incriminés.

C’est en 2024 qu’Intel a pris le problème au sérieux, reportant la faute tout d’abord sur les fabricants de cartes mères pour ensuite détecter des soucis dans son propre microcode. Nous y revenons dans la partie suivante.

Source : Intel

Le constructeur a alors confirmé que le problème pourrait toucher non pas seulement les processeurs i9 (13900K, 14900K), mais aussi toutes les puces à la puissance de base de 65W, soit la quasi-intégralité des processeurs de 13eme (Raptor Lake) et 14eme (Raptor Lake Refresh) génération.

Surtout, les processeurs touchés subiraient une dégradation « irreversible » de leur sillicium selon les sources de Tom’s Hardware, rendant l’application d’un correctif de microcode pour le moins superflu. Dans ce cas, un remplacement pur et simple de la puce est conseillé par la garantie.

Quelle est la cause du problème ?

Si la première erreur de BSOD (blue screen of death ou écran bleu de la mort) a été corrigée via une mise à jour de BIOS déployée par les fabricants de cartes mères, l’histoire prend une autre tournure en 2024. Intel évoque tout d’abord des réglages de BIOS par défaut en dehors de ses spécifications recommandées, notamment pour les processeurs débloqués (suffixe K), incitant les fabricants de cartes mères à proposer un profil par défaut pour les utilisateurs.

Une première mise à jour de BIOS en avril propose l’Intel Baseline Profile, qui correspond aux réglages de base des processeurs avec une puissance plus contenue pour espérer corriger les soucis de stabilité. Suite à cette mise à jour, Intel a ainsi posté ses recommandations finales pour les différents profils de base selon chaque type de processeur, précisant les paramètres de BIOS recommandés ainsi les limites de puissance à adopter (ICCMAX, PL1, PL2) pour chaque puce. Une seconde mise à jour de BIOS permet aux possesseurs de ces processeurs de choisir un profil Performance / Extreme, toujours en fonction de ces recommandations.

C’est le 22 juillet qu’Intel, dans un post sur son forum communautaire, a confirmé avoir trouvé la raison principale de ces soucis d’instabilité, en se basant sur les processeurs retournés par ses clients. C’est bien cette « tension trop élevée » qui reste incriminée, plus précisément « un algorithme de microcode entraînant des demandes de tension incorrectes au processeur ».

En conséquence, le silicium du processeur se dégraderait irréversiblement, le processeur ne pouvant plus supporter un certain seul de tension, mais également de température. Les symptômes vont de l’écran bleu aux messages d’erreurs Windows (corruption des données, erreur mémoire GPU) lors d’une forte utilisation du processeur.

Selon Intel, les soucis d’oxydation qui ont aussi pu être cités comme raison sous-jacente du problème restent « mineurs » et concerne uniquement certains processeurs vendus en 2022, sans pour autant préciser les lots concernés.

Si Intel a décidé de ne pas rappeler les processeurs, la firme a étendu la garantie de deux ans pour tous les clients possédant ces puces, pouvant amener jusqu’à 5 ans la garantie selon la date d’achat. De plus, Intel promet un assouplissement des règles de retours et a demandé à ses clients de répéter leurs demandes auprès de ses propres équipes de support pour effectuer un remplacement.

Mon processeur est-il concerné ?

Selon Intel dans une interview de The Verge, tous les processeurs de bureaux de 65W et plus, issus des deux dernières architectures de bureau (13eme et 14eme) pourraient être affectés par ces tensions trop élevées, et donc des soucis d’instabilité.

La liste des processeurs potentiellement touchés par le problème // Source : Intel

Cela ne veut pas pour autant dire que tous les processeurs sont concernés selon le constructeur : de très nombreux utilisateurs n’ont pas à se plaindre. Si certains magasins européens évoquent un taux de retour SAV trois à quatre fois supérieur par rapport à la 12eme génération de processeurs, le vendeur de systèmes Puget fait état d’un taux de défaillance plus élevé sur les Ryzen 5000 et 7000. Ce dernier avoue cependant avoir appliqué très tôt des réglages de puissance plus mesurés.

Les défaillances de processeurs Intel chez Puget par génération // Source : Puget System

Toujours dans ses réponses au média The Verge, Intel promet une solution pour « identifier facilement les processeurs affectés ou à risque sur les systèmes des utilisateurs finaux ». Celle-ci n’existant pas encore à l’heure où nous écrivons ces lignes, nous nous permettons d’évoquer celle proposée par le créateur de contenu RobeyTech.

Elle s’adresse pour le moment aux possesseurs de cartes graphiques Nvidia et consiste tout simplement à installer le pilote officiel, une ou plusieurs fois si nécessaire. Les opérations de décompression devraient déclencher les instabilités du processeur et afficher un message d’erreur.

Dans tous les cas, une mise à jour de BIOS est conseillée à tous les possesseurs de processeurs Intel 13eme et 14eme génération, qu’ils soient concernés ou non.

Que faire si je suis concerné ?

Si vous éprouvez les symptômes d’instabilité que nous avons évoqués plus haut, à savoir des crashs incessants, des BSOD, des retours bureaux ou des erreurs de mémoire GPU, alors deux solutions s’offrent à vous.

La première étape consistera à appliquer des réglages de BIOS plus conservateurs pour le BIOS, en appliquant le profil Intel par défaut. Il pourrait être conseillé d’attendre l’ultime mise à jour promise par Intel en août, mais rien n’assure pour le moment qu’elle assure la stabilité de votre processeur. Les mises à jour seront publiées sur les sites des fabricants de cartes mères (Asus, MSI, etc.).

Voici les liens vers les pages de supports des différents constructeurs, il vous suffira de chercher votre référence afin de télécharger le dernier BIOS en date :

Comme nous le précisions plus haut, la mise à jour de microcode attendue (via une mise à jour du BIOS de votre carte mère) n’est qu’un correctif préventif et pourrait au mieux « apporter quelques améliorations en matière d’instabilité aux processeurs actuellement concernés » selon Intel.

Une éventuelle réinstallation de Windows, avec le BIOS réglé sur le profil Intel par défaut, et une vérification de votre système de refroidissement, pourra vous permettre d’éliminer les différentes causes. Une fois celles-ci écartées, vous pouvez vous rabattre sur une demande de remplacement du processeur chez Intel.

Deux choix s’offrent à vous :

  • Si votre processeur Intel fait partie d’un système OEM / préfabriqué : c’est au support client du fournisseur qu’il faudra s’adresser, qu’il s’agisse de commerçant comme Materiel.net ou LDLC, que de fabricants comme HP, Dell ou Alienware.
  • Si votre processeur a été acheté séparément en « boite » : adressez-vous directement au support client d’Intel à cette adresse : https://www.intel.fr/content/www/fr/fr/support/contact-us.html

Le fin mot de l’histoire

Après des mois d’investigations, Intel aurait donc trouvé les causes de ces problématiques. Ce sont quatre sources de problèmes qui ont été identifiées :

  • Les paramètres d’alimentation de la carte mère dépassaient les directives d’alimentation d’Intel ;
  • L’algorithme eTVB Microcode permettait aux processeurs de bureau Intel Core i9 (13e et 14e Gen) de fonctionner à des états de performance plus élevés, même à des températures trop élevées ;
  • L’algorithme SVID du microcode demandait des tensions élevées à une fréquence et pendant une durée pouvant entraîner un décalage du Vmin (tension de fonctionnement minimale) ;
  • Le microcode et le code BIOS demandaient des tensions élevées au niveau du cœur, ce qui pouvait entraîner un décalage du Vmin, en particulier pendant les périodes d’inactivité et/ou d’activité légère.

En réponse à ces découvertes, Intel annonce le déploiement d’un nouveau microcode « 0x12B ». Celui-ci permettra de corriger les quatre points énumérés plus haut. Il contient les précédents correctifs et n’engendre aucune perte de performances. Pour le moment, on ne sait pas si Intel compte encore enquêter sur cette affaire.


Retrouvez un résumé du meilleur de l’actu tech tous les matins sur WhatsApp, c’est notre nouveau canal de discussion Frandroid que vous pouvez rejoindre dès maintenant !

Les derniers articles