Nvidia : les nouvelles puces Blackwell provoquent des surchauffes dans les serveurs

 
Présentées en grande pompe par Jensen Huang, PDG de Nvidia, les puces Blackwell rencontreraient des problèmes dans les centres de données, mais l’entreprise reste confiante.
Jensen Huang, CEO de Nvidia // Source : SIEPR Economic Summit

Si Nvidia s’impose de plus en plus comme le constructeur sur lequel il faut miser, il n’est pas exempt de défauts. Après avoir présenté les puces de sa gamme Blackwell comme étant LE produit que les industriels s’arrachent avant sa sortie, Reuters indique que ces dernières pourraient être la cause de problèmes techniques au sein de centre de données.

Un problème d’agencement

On apprend via Reuters que lorsque les puces Blackwell sont installées sur les racks de serveurs conçus pour contenir jusqu’à 72 puces, ces dernières surchauffent, entraînant des retards dans le traitement de l’information.

Un problème qui semble être connu de Nvidia qui indique avoir demandé à de multiples reprises à ses fournisseurs de revoir la conception de ces racks pour éviter ces problèmes. Un porte-parole de l’entreprise indique à Reuters que « Nvidia travaille avec les principaux fournisseurs de services cloud en tant que partie intégrante de notre équipe et de nos processus d’ingénierie. Les itérations d’ingénierie sont normales et attendues ».

Reste à savoir si les fameux clients de ces puces auront le temps nécessaire pour les réinstaller correctement et faire fonctionner leurs centres de données. Pensées pour l’intelligence artificielle, les puces vont, par exemple, équiper le centre de données de l’IA Grok, l’IA « irrévérencieuse » d’Elon Musk.

Pour aller plus loin
Grok, l’intelligence artificielle d’Elon Musk, pourrait finir par lui coûter très cher


Téléchargez notre application Android et iOS ! Vous pourrez y lire nos articles, dossiers, et regarder nos dernières vidéos YouTube.

Les derniers articles