Apple M1 Ultra : pourquoi ce processeur est si impressionnant

Le signe que les choses vont changer dans cette industrie

10 mars 202210/03/2022 • 11:02

La puce M1 Ultra d’Apple est un monstre. Cette puce contourne les limitations physiques qui se produisent normalement lorsque deux puces sont couplées et cela promet des performances incroyables avec une faible consommation d’énergie. Regardons de plus près ce qui fait la spécificité de ce nouveau processeur.

Cette semaine, Apple a organisé sa keynote. Parmi toutes les annonces, ils ont ajouté « une dernière puce » à la famille de processeurs M1. Cette puce nommée M1 Ultra est une nouvelle conception qui utilise la technologie « UltraFusion » pour relier deux puces M1 Max ensemble, résultant en un énorme processeur qui offre 16 cœurs de processeur hautes performances, quatre cœurs d’efficacité, un GPU intégré à 64 cœurs et la prise en charge de jusqu’à 128 Go de RAM. Cette puce sera présente dans le Mac Studio, une machine à mi-chemin entre le Mac Mini et le Mac Pro.

Lien YouTube S’abonner à Frandroid

Après avoir écouté sagement Apple qui a montré plein de jolis graphiques associés à bon nombre de superlatifs, regardons de plus près ce qui fait la spécificité de cette nouvelle puce ARM.

M1 Ultra = M1 Max + M1 Max

Premièrement, ce qu’a fait Apple n’a presque rien de nouveau. AMD le fait déjà sur un bon nombre de ses Ryzen. C’est une approche basée sur plusieurs matrices en silicium pour fabriquer des puces plus grandes afin d’obtenir de meilleurs rendements.

	M1	M1 Pro	M1 Max	M1 Ultra
Gravure	5 nm TSMC	5 nm TSMC	5 nm TSMC	5 nm TSMC
Nombre de transistors	16 milliards	33,7 milliards	57 milliards	2 × 57 milliards
CPU	4 × Firestorm (P) à 3,23 GHz 4 × Icestorm (E) à 2,064 GHz	6 × Firestorm (P) à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz	8 × Firestorm (P) à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz	16 × Firestorm (P) à 3,23 GHz 4 × Icestorm (E) à 2,064 GHz
		8 × Firestorm (P) à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz
GPU	7 cœurs à 1278 MHz 896 UE 2,29 TFLOPS	14 cœurs à 1 278 MHz 1 792 UE 4,58 TFLOPS	24 cœurs à 1 278 MHz 3 072 UE 7,83 TFLOPS	48 cœurs à 1 278 MHz 6 144 UE 15,66 TFLOPS
	8 cœurs à 1 278 MHz 1 024 UE 2,61 TFLOPS	16 cœurs à 1 278 MHz 2 048 UE 5,22 TFLOPS	32 cœurs à 1 278 MHz 4 096 UE 10,44 TFLOPS	64 cœurs à 1 278 MHz 8 192 UE 20,88 TFLOPS
Mémoire vive	8 Go LPDDR4X-4266 (double canal, 64 bits)	16 Go LPDDR5-6400 (double canal, 128 bits)	32 Go LPDDR5-6400 (quatre canaux, 128 bits)	64 Go LPDDR5-6400 (quatre canaux, 128 bits)
	16 Go LPDDR4X-4266 (double canal, 64 bits)	32 Go LPDDR5-6400 (double canal, 128 bits)	64 Go LPDDR5-6400 (quatre canaux, 128 bits)	128 Go LPDDR5-6400 (quatre canaux, 128 bits)
bande passante mémoire	68,2 Go/s	204,8 Go/s	409,6 Go/s	819,2 Go/s
Moteur neuronal	16 cœurs 11 TOPS	16 cœurs 11 TOPS	16 cœurs 11 TOPS	32 cœurs 22 TOPS
Transcodage	–	1x moteur de décodage vidéo 1x moteur d’encodage vidéo 1x moteur d’ encodage/décodage ProRes	1x moteur de décodage vidéo 2x moteur d’encodage vidéo 2x moteur d’ encodage/décodage ProRes	2x moteur de décodage vidéo 4x moteur d’encodage vidéo 4x moteur d’ encodage/décodage ProRes
Gestion écrans	Écran intégré + 1 écran externe (1 × 6K60)	Écran intégré + 2 écrans externes (2 × 6K60)	Écran intégré + 4 écrans externes (3 × 6K60, 1 × 4K60)	5 écrans externes (4 × 6K60, 1 × 4K60)

On ne parle donc pas de 2e génération Apple Silicon, mais d’un quatrième étage d’extension de la 1re génération. L’objectif est de fournir plus de puissance que le déjà impressionnant M1 Max. Au lieu de faire une puce encore plus grande, le M1 Ultra utilise la combinaison de deux puces M1 Max.

Comparatif entre les puces Apple M1 // Source : Apple

Ils n’ont pas seulement combiné deux matrices M1 Max sur un seul SoC, ils ont également fait en sorte que les deux matrices se présentent comme un seul GPU monolithique. Le résultat est une puce qui, sans aucun doute, est l’une des conceptions les plus intéressantes pour un SoC grand public.

Des serveurs européens, une offre valable à vie

Découvrez les offres de pCloud : 2, 5 ou 10 To de stockage, situés dans des serveurs européen et sans abonnement, pour 5 personnes. Le gestionnaire de mots de passe est offert !

Comme le montrent les premiers benchmarks, cette stratégie à double matrice profite bien plus aux charges de travail CPU et GPU multi-threads qu’aux tâches mono-thread — un domaine où Apple commence déjà à prendre du retard. En permettant aux deux puces du M1 Ultra de se présenter de manière transparente comme un seul GPU, Apple a lancé une nouvelle course technologique pour placer des GPU multi-puces dans du matériel haut de gamme grand public.

En plaçant deux matrices M1 Max sur une seule puce, Apple a doublé la quantité de composants. Cela signifie deux fois plus de cœurs de processeur, deux fois plus de cœurs de GPU, deux fois plus de cœurs de moteur neuronal, deux fois plus de canaux de mémoire LPDDR5 et deux fois plus de gestions de ports (E/S) pour les périphériques.

La fiche technique du Mac Studio est impressionnante // Source : Apple

Alors que M1 Max avait 16 canaux LPDDR5-6400 pour un total de 408 Gb/s de bande passante mémoire, M1 Ultra double cela à 32 canaux LPDDR5 et 800 Gb/s de bande passante mémoire. Une quantité qui ne serait même pas exploitée entièrement par Apple sur cette configuration. Comme avec le M1 Max, Apple a soudé les puces LPDDR5 directement sur le SoC, pour un total de 8 puces sur le M1 Ultra (comme vous pouvez le voir sur la photo de une). Il n’y a donc pas de moyen d’ajouter de la mémoire vive a postiori, n’oubliez pas de choisir la bonne quantité de mémoire vive pour vos besoins pendant la configuration de la machine.

La technologie UltraFusion // Source : Apple

Ce qu’Apple a présenté comme la technologie UltraFusion peut être décrite comme une autoroute très courte avec 10 000 voies. Cet ingrédient secret est donc une interface à très haute vitesse qui, à l’aide d’un interposeur en silicium, permet de relier deux matrices M1 Max. Au total, les deux matrices ont un débit de données disponibles de 2,5 Tb/s. D’après AnandTech, cette technologie ressemblerait à la technologie EMIB d’Intel ou à la technologie Elevated Fanout Bridge (EFB). Apple ne serait donc pas le premier à mettre sur le marché une telle technologie, néanmoins ils seront sans doute les premiers à la démocratiser.

Plus puissante qu’une GeForce RTX 3090 pour un 1/3 de sa consommation

Le GPU est surpuissant. D’après Apple, les performances graphiques de la M1 Ultra seraient supérieures à celles à la carte graphique GeForce RTX 3090 de Nvidia, qui est actuellement la carte graphique la plus rapide du marché. Et en plus, la puce M1 Ultra ne consomme qu’un peu plus de 100 Watts, soit 200 Watts de moins que le RTX 3090.

Le GPU GA102 utilisé par NVIDIA possède 28,3 milliards de transistors, tandis que le M1 Ultra est de 114 milliards. Évidemment, Nvidia a conçu sa carte graphique différemment : ils n’ont pas pris en compte la consommation d’énergie. Apple a conçu un GPU plus large, avec davantage de silicium, pour maintenir des fréquences d’horloge plus basses (et donc optimiser la consommation d’énergie). Bien sûr, Apple bénéficie également d’un énorme avantage en matière de processus de fabrication, en utilisant le processus de gravure N5 de TSMC par rapport au processus 8 nm de Samsung que l’on trouve sur les Nvidia RTX 30.

Les caractéristiques GPU de l’Apple M1 Max // Source : Apple

Fait intéressant, la version du Mac Studio avec M1 Ultra n’utilise pas le même système de refroidissement que la version M1 Max. Il en résulte une différence de poids de près d’1 kilogramme. Les machines ont la même alimentation de 370 W, le poids supplémentaire est dû au fait que le M1 Ultra possède un module thermique en cuivre plus grand, alors que le M1 Max a un dissipateur thermique en aluminium. Pour information, le cuivre, étant plus dense, avec plus de masse thermique et de conductivité que l’aluminium, il peut donc retenir plus de chaleur et déplacer cette chaleur plus rapidement.

Doubles ventilateurs du Mac Studio // Source : Apple

Au vu des performances d’un M1 Max, Apple promet donc des niveaux de performances CPU et GPU pour le M1 Ultra qui font de l’ombre à toutes les configurations actuelles basées sur les CPU d’Intel et les cartes graphiques d’AMD. Cependant, il faudra faire des tests plus poussés pour comprendre les scénarios qu’Apple a illustrés dans sa présentation.

Nvidia, AMD et Intel sont déjà dans cette bataille du GPU multi-die. La théorie est que si vous prenez une puce puissante et que vous la collez de manière transparente à une autre, vous obtiendrez quelque chose de deux fois mieux. En théorie, c’est simple. En réalité, ce n’est pas si simple, et bien qu’AMD a déjà réussi à faire fonctionner un concept similaire pour son accélérateur de calcul de supercalculateur MI200, personne d’autre ne l’avait fait avant Apple pour le grand public.

Nous sommes rentrés dans une nouvelle ère très excitante dans le développement de GPU, et le M1 Ultra d’Apple est un aperçu de ce qui va arriver chez les autres qui ont les mêmes objectifs qu’Apple. Vous comprenez, certainement, bien mieux ce qui justifie le prix délirant du Mac Studio. Avec le SoC Apple M1 Ultra, la machine est vendue à partir de 4599 euros (Apple M1 Ultra, 64 Go et 1 To).

Rejoignez-nous de 17 à 19h, un mercredi sur deux, pour l’émission UNLOCK produite par Frandroid et Numerama ! Actus tech, interviews, astuces et analyses… On se retrouve en direct sur Twitch ou en rediffusion sur YouTube !

Signaler une erreur dans le texte

Les notifications web

Les notifications push vous permettent de recevoir toute l'actualité de Frandroid en temps réel dans votre navigateur ou sur votre téléphone Android.

Activer les notifications

Choisir les notifications

En savoir plus sur les notifications web

Ellis 2323

Un article hors sol, où l'auteur réduit le monde pro aux influenceurs youtube. La force de cette puce: faire du traitement vidéo. Pour le reste, elle reste loin derriere. Dans les benchs de rendu vidéos, elle est moins performante que ses homologues x86. Dans les simulations physiques, les perfs sont affreuses et peu de logiciels vont optimiser leurs codes de calculs pour ce SOC. Dans les jeux et les applis, les tflops ne se convertissent pas en fps. Bref, un SOC concu pour Geekbench, qui sert avant tout un discours marketing Apple pour justifier la migration Ordi sur ARM. Pour résumer, Apple a un message Marketing pour ses clients pour les rassurer sur le passage ARM.
Android77

Enfin on va pouvoir jouer convenablement à Candy Crush sur Mac !
Dante Ashen

alors pour le multi die ça existe depuis longtemps chez AMD rien que sur les ryzen, Intel l'a fait aussi avec certaines gammes Extreme lga 2066. Et puis ce mytho incroyable une petite chose comme ça au niveau d'un gpu HDG ? Ils ont osé comparer ca a une rtx 3090 ? Deja sur les premier bench en rendu 3d la 3090 fait du 17 secondes. et le m1 ultra ... 3 min et quelques. Faut arreter de croire le marketing apple serieux
vVDB

"personne d’autre ne l’avait fait avant Apple pour le grand public." A 4600€ la machine ce n'est pas du grand public ! Ce que vous dites dans vos articles montrent que vous êtes de plus en plus hors sol...
Tre

C'est impressionnant
Tre

Pas possible t'es sur le media de référence !
geekdudimanche

Le rapport qualité prix est loin d’être médiocre si on prend en compte que pour avoir aussi bien en cpu faut taper dans du threadripper voire epyc, donc faut payer ta cm qui va avec, faut payer le bon gros refroidissement qui va avec, faut payer l’alim qui va pouvoir supporter un gros proc comme ça + une 3080/90. Si on prend en compte l’encombrement de la machine. Je sais pas si vous vous rendez compte qu’on a autant de puissance dans une demi boite à chaussure qu’on glisse dans n’importe quelle valise en déplacement. Si on prend en compte la différence de consommation qui face a un combo gros threadripper + 3090 est de quasiment 400W, et que pour un pro qui va taper dedans 8h par jour 300h par an, ca fait environ 200€/an d’économies par an a 17.5cts du kwh sachant que le pire est a venir. C’est clairement pas pour tout le monde comme machine, mais pour ceux qui en ont besoin c’est un prix plus que correct, SURTOUT si on travail dans l’image, le codec PROres étant ultra utilisé dans ce milieu et les puces M1 faisant des merveilles avec avec tous leurs coprocesseurs dédiés
Kroustibat

Le plus impressionnant reste la faible consommation. Mais c'est surtout un étendard pour la marque, car qui va véritablement utiliser le plein potentiel du M1 ultra ? C'est ultra niche et le rapport qualité prix est plutôt médiocre (à tel point que pour ne pas se voiler la face celui ci est comparé à des xeon eux aussi de niche). Avec Zen 4 et RDNA 3 de AMD cet été ça lui laisse également moins de 6 mois pour s'afficher en haut de tableau. J'aurais préféré attendre M2 et que celui ci soit équipé d'office sur les macbook, le message aurait été plus fort et grand public.
power971

Il ya écrit GPU à la place de CPU partout dans l'article.
Agence touristes

C'est 350W en FE (et plus en custom) les 3090, pas 300W.
geekdudimanche

La 3090 est plutôt orientée vers le semi-pro que vers les jeux. Enfin y’aura toujours des gogoles pour payer plus du double qu’une 3080 pour avoir les perfs d’une 3080OC, mais la majeure partie des gens qui l’achètent c’est pour avoir accès a une grosse VRAM sans passer côté quadro et économiser un sacré paquet d’argent. Pareil pour le machine learning avec les tensor core supplémentaires etc
Gomas93

Si j'ai bien compris, UltraFusion ne fait pas qu'interposer les die mais les présente comme un ensemble monolithique et indifférencié à MacOS, sans changer fondamentalement les applications, ce qui est assez fort. Je ne sais pas comment Windows et Linux perçoivent ce type d'architecture multi-die et avec quel rendement.
Nawak

En effet, c'est un système pensé pour les professionnels, pas pour le grand public... et quand bien même le GPU serait plus puissant qu'une RTX, son utilité n'est pas tourné vers le jeu comme pour la carte de Nvidia. En attendant, les chiffres sont assez impressionnants !
Goldendarkfish

C'est une petite prouesse mais ce n'est pas si grand publique que ça. Avec un ticket d'entrée à 4500€, peu de gens peuvent se le permettre. C'est surtout accès pour les pro, semi-pro et les geek hardcore. Aussi, je doute de la pertinence de comparer cette puce à la 3090. Les deux n'ont pas été conçu dans le même but.