Apple M1 Ultra : pourquoi ce processeur est si impressionnant

Le signe que les choses vont changer dans cette industrie

 
La puce M1 Ultra d’Apple est un monstre. Cette puce contourne les limitations physiques qui se produisent normalement lorsque deux puces sont couplées et cela promet des performances incroyables avec une faible consommation d’énergie. Regardons de plus près ce qui fait la spécificité de ce nouveau processeur.
Apple M1 Ultra // Source : Apple

Cette semaine, Apple a organisé sa keynote. Parmi toutes les annonces, ils ont ajouté « une dernière puce » à la famille de processeurs M1. Cette puce nommée M1 Ultra est une nouvelle conception qui utilise la technologie « UltraFusion » pour relier deux puces M1 Max ensemble, résultant en un énorme processeur qui offre 16 cœurs de processeur hautes performances, quatre cœurs d’efficacité, un GPU intégré à 64 cœurs et la prise en charge de jusqu’à 128 Go de RAM. Cette puce sera présente dans le Mac Studio, une machine à mi-chemin entre le Mac Mini et le Mac Pro.

Après avoir écouté sagement Apple qui a montré plein de jolis graphiques associés à bon nombre de superlatifs, regardons de plus près ce qui fait la spécificité de cette nouvelle puce ARM.

M1 Ultra = M1 Max + M1 Max

Premièrement, ce qu’a fait Apple n’a presque rien de nouveau. AMD le fait déjà sur un bon nombre de ses Ryzen. C’est une approche basée sur plusieurs matrices en silicium pour fabriquer des puces plus grandes afin d’obtenir de meilleurs rendements.

M1M1 ProM1 MaxM1 Ultra
Gravure5 nm TSMC5 nm TSMC5 nm TSMC5 nm TSMC
Nombre de transistors16 milliards33,7 milliards57 milliards2 × 57 milliards
CPU4 × Firestorm (P)
à 3,23 GHz 4 × Icestorm (E) à 2,064 GHz
6 × Firestorm (P)
à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz
8 × Firestorm (P)
à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz
16 × Firestorm (P)
à 3,23 GHz 4 × Icestorm (E) à 2,064 GHz
8 × Firestorm (P)
à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz
GPU7 cœurs à
1278 MHz 896 UE
2,29 TFLOPS
14 cœurs à
1 278 MHz 1 792 UE
4,58 TFLOPS
24 cœurs à
1 278 MHz 3 072 UE
7,83 TFLOPS
48 cœurs à
1 278 MHz 6 144 UE
15,66 TFLOPS
8 cœurs à
1 278 MHz 1 024 UE
2,61 TFLOPS
16 cœurs à
1 278 MHz 2 048 UE
5,22 TFLOPS
32 cœurs à
1 278 MHz 4 096 UE
10,44 TFLOPS
64 cœurs à
1 278 MHz 8 192 UE
20,88 TFLOPS
Mémoire vive8 Go LPDDR4X-4266
(double canal, 64 bits)
16 Go LPDDR5-6400
(double canal, 128 bits)
32 Go LPDDR5-6400
(quatre canaux, 128 bits)
64 Go LPDDR5-6400
(quatre canaux, 128 bits)
16 Go LPDDR4X-4266
(double canal, 64 bits)
32 Go LPDDR5-6400
(double canal, 128 bits)
64 Go LPDDR5-6400
(quatre canaux, 128 bits)
128 Go LPDDR5-6400
(quatre canaux, 128 bits)
bande passante mémoire68,2 Go/s204,8 Go/s409,6 Go/s819,2 Go/s
Moteur neuronal16 cœurs
11 TOPS
16 cœurs
11 TOPS
16 cœurs
11 TOPS
32 cœurs
22 TOPS
Transcodage1x moteur de décodage vidéo
1x moteur d’encodage vidéo 1x moteur d’
encodage/décodage ProRes
1x moteur de décodage
vidéo 2x moteur d’encodage vidéo 2x moteur d’
encodage/décodage ProRes
2x moteur de décodage
vidéo 4x moteur d’encodage vidéo 4x moteur d’
encodage/décodage ProRes
Gestion écransÉcran intégré
+
1 écran externe
(1 × 6K60)
Écran intégré
+
2 écrans externes
(2 × 6K60)
Écran intégré
+
4 écrans externes
(3 × 6K60, 1 × 4K60)
5 écrans externes
(4 × 6K60, 1 × 4K60)

On ne parle donc pas de 2e génération Apple Silicon, mais d’un quatrième étage d’extension de la 1re génération. L’objectif est de fournir plus de puissance que le déjà impressionnant M1 Max. Au lieu de faire une puce encore plus grande, le M1 Ultra utilise la combinaison de deux puces M1 Max.

Comparatif entre les puces Apple M1 // Source : Apple

Ils n’ont pas seulement combiné deux matrices M1 Max sur un seul SoC, ils ont également fait en sorte que les deux matrices se présentent comme un seul GPU monolithique. Le résultat est une puce qui, sans aucun doute, est l’une des conceptions les plus intéressantes pour un SoC grand public.

Comme le montrent les premiers benchmarks, cette stratégie à double matrice profite bien plus aux charges de travail CPU et GPU multi-threads qu’aux tâches mono-thread — un domaine où Apple commence déjà à prendre du retard. En permettant aux deux puces du M1 Ultra de se présenter de manière transparente comme un seul GPU, Apple a lancé une nouvelle course technologique pour placer des GPU multi-puces dans du matériel haut de gamme grand public.

En plaçant deux matrices M1 Max sur une seule puce, Apple a doublé la quantité de composants. Cela signifie deux fois plus de cœurs de processeur, deux fois plus de cœurs de GPU, deux fois plus de cœurs de moteur neuronal, deux fois plus de canaux de mémoire LPDDR5 et deux fois plus de gestions de ports (E/S) pour les périphériques.

La fiche technique du Mac Studio est impressionnante // Source : Apple

Alors que M1 Max avait 16 canaux LPDDR5-6400 pour un total de 408 Gb/s de bande passante mémoire, M1 Ultra double cela à 32 canaux LPDDR5 et 800 Gb/s de bande passante mémoire. Une quantité qui ne serait même pas exploitée entièrement par Apple sur cette configuration. Comme avec le M1 Max, Apple a soudé les puces LPDDR5 directement sur le SoC, pour un total de 8 puces sur le M1 Ultra (comme vous pouvez le voir sur la photo de une). Il n’y a donc pas de moyen d’ajouter de la mémoire vive a postiori, n’oubliez pas de choisir la bonne quantité de mémoire vive pour vos besoins pendant la configuration de la machine.

La technologie UltraFusion // Source : Apple

Ce qu’Apple a présenté comme la technologie UltraFusion peut être décrite comme une autoroute très courte avec 10 000 voies. Cet ingrédient secret est donc une interface à très haute vitesse qui, à l’aide d’un interposeur en silicium, permet de relier deux matrices M1 Max. Au total, les deux matrices ont un débit de données disponibles de 2,5 Tb/s. D’après AnandTech, cette technologie ressemblerait à la technologie EMIB d’Intel ou à la technologie Elevated Fanout Bridge (EFB). Apple ne serait donc pas le premier à mettre sur le marché une telle technologie, néanmoins ils seront sans doute les premiers à la démocratiser.

Plus puissante qu’une GeForce RTX 3090 pour un 1/3 de sa consommation

Le GPU est surpuissant. D’après Apple, les performances graphiques de la M1 Ultra seraient supérieures à celles à la carte graphique GeForce RTX 3090 de Nvidia, qui est actuellement la carte graphique la plus rapide du marché. Et en plus, la puce M1 Ultra ne consomme qu’un peu plus de 100 Watts, soit 200 Watts de moins que le RTX 3090.

Le GPU GA102 utilisé par NVIDIA possède 28,3 milliards de transistors, tandis que le M1 Ultra est de 114 milliards. Évidemment, Nvidia a conçu sa carte graphique différemment : ils n’ont pas pris en compte la consommation d’énergie. Apple a conçu un GPU plus large, avec davantage de silicium, pour maintenir des fréquences d’horloge plus basses (et donc optimiser la consommation d’énergie). Bien sûr, Apple bénéficie également d’un énorme avantage en matière de processus de fabrication, en utilisant le processus de gravure N5 de TSMC par rapport au processus 8 nm de Samsung que l’on trouve sur les Nvidia RTX 30.

Les caractéristiques GPU de l’Apple M1 Max // Source : Apple

Fait intéressant, la version du Mac Studio avec M1 Ultra n’utilise pas le même système de refroidissement que la version M1 Max. Il en résulte une différence de poids de près d’1 kilogramme. Les machines ont la même alimentation de 370 W, le poids supplémentaire est dû au fait que le M1 Ultra possède un module thermique en cuivre plus grand, alors que le M1 Max a un dissipateur thermique en aluminium. Pour information, le cuivre, étant plus dense, avec plus de masse thermique et de conductivité que l’aluminium, il peut donc retenir plus de chaleur et déplacer cette chaleur plus rapidement.

Doubles ventilateurs du Mac Studio // Source : Apple

Au vu des performances d’un M1 Max, Apple promet donc des niveaux de performances CPU et GPU pour le M1 Ultra qui font de l’ombre à toutes les configurations actuelles basées sur les CPU d’Intel et les cartes graphiques d’AMD. Cependant, il faudra faire des tests plus poussés pour comprendre les scénarios qu’Apple a illustrés dans sa présentation.

Nvidia, AMD et Intel sont déjà dans cette bataille du GPU multi-die. La théorie est que si vous prenez une puce puissante et que vous la collez de manière transparente à une autre, vous obtiendrez quelque chose de deux fois mieux. En théorie, c’est simple. En réalité, ce n’est pas si simple, et bien qu’AMD a déjà réussi à faire fonctionner un concept similaire pour son accélérateur de calcul de supercalculateur MI200, personne d’autre ne l’avait fait avant Apple pour le grand public.

Nous sommes rentrés dans une nouvelle ère très excitante dans le développement de GPU, et le M1 Ultra d’Apple est un aperçu de ce qui va arriver chez les autres qui ont les mêmes objectifs qu’Apple. Vous comprenez, certainement, bien mieux ce qui justifie le prix délirant du Mac Studio. Avec le SoC Apple M1 Ultra, la machine est vendue à partir de 4599 euros (Apple M1 Ultra, 64 Go et 1 To).


Des invités passionnants et des sujets palpitants ! Notre émission UNLOCK est à retrouver un jeudi sur deux en direct, de 17 à 19h sur Twitch. Pensez aussi aux rediffusions sur YouTube !

Les derniers articles