Cette semaine, Apple a organisé sa keynote. Parmi toutes les annonces, ils ont ajouté « une dernière puce » à la famille de processeurs M1. Cette puce nommée M1 Ultra est une nouvelle conception qui utilise la technologie « UltraFusion » pour relier deux puces M1 Max ensemble, résultant en un énorme processeur qui offre 16 cœurs de processeur hautes performances, quatre cœurs d’efficacité, un GPU intégré à 64 cœurs et la prise en charge de jusqu’à 128 Go de RAM. Cette puce sera présente dans le Mac Studio, une machine à mi-chemin entre le Mac Mini et le Mac Pro.
Après avoir écouté sagement Apple qui a montré plein de jolis graphiques associés à bon nombre de superlatifs, regardons de plus près ce qui fait la spécificité de cette nouvelle puce ARM.
M1 Ultra = M1 Max + M1 Max
Premièrement, ce qu’a fait Apple n’a presque rien de nouveau. AMD le fait déjà sur un bon nombre de ses Ryzen. C’est une approche basée sur plusieurs matrices en silicium pour fabriquer des puces plus grandes afin d’obtenir de meilleurs rendements.
M1 | M1 Pro | M1 Max | M1 Ultra | |
---|---|---|---|---|
Gravure | 5 nm TSMC | 5 nm TSMC | 5 nm TSMC | 5 nm TSMC |
Nombre de transistors | 16 milliards | 33,7 milliards | 57 milliards | 2 × 57 milliards |
CPU | 4 × Firestorm (P) à 3,23 GHz 4 × Icestorm (E) à 2,064 GHz | 6 × Firestorm (P) à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz | 8 × Firestorm (P) à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz | 16 × Firestorm (P) à 3,23 GHz 4 × Icestorm (E) à 2,064 GHz |
8 × Firestorm (P) à 3,23 GHz 2 × Icestorm (E) à 2,064 GHz | ||||
GPU | 7 cœurs à 1278 MHz 896 UE 2,29 TFLOPS | 14 cœurs à 1 278 MHz 1 792 UE 4,58 TFLOPS | 24 cœurs à 1 278 MHz 3 072 UE 7,83 TFLOPS | 48 cœurs à 1 278 MHz 6 144 UE 15,66 TFLOPS |
8 cœurs à 1 278 MHz 1 024 UE 2,61 TFLOPS | 16 cœurs à 1 278 MHz 2 048 UE 5,22 TFLOPS | 32 cœurs à 1 278 MHz 4 096 UE 10,44 TFLOPS | 64 cœurs à 1 278 MHz 8 192 UE 20,88 TFLOPS |
|
Mémoire vive | 8 Go LPDDR4X-4266 (double canal, 64 bits) | 16 Go LPDDR5-6400 (double canal, 128 bits) | 32 Go LPDDR5-6400 (quatre canaux, 128 bits) | 64 Go LPDDR5-6400 (quatre canaux, 128 bits) |
16 Go LPDDR4X-4266 (double canal, 64 bits) | 32 Go LPDDR5-6400 (double canal, 128 bits) | 64 Go LPDDR5-6400 (quatre canaux, 128 bits) | 128 Go LPDDR5-6400 (quatre canaux, 128 bits) |
|
bande passante mémoire | 68,2 Go/s | 204,8 Go/s | 409,6 Go/s | 819,2 Go/s |
Moteur neuronal | 16 cœurs 11 TOPS | 16 cœurs 11 TOPS | 16 cœurs 11 TOPS | 32 cœurs 22 TOPS |
Transcodage | – | 1x moteur de décodage vidéo 1x moteur d’encodage vidéo 1x moteur d’ encodage/décodage ProRes | 1x moteur de décodage vidéo 2x moteur d’encodage vidéo 2x moteur d’ encodage/décodage ProRes | 2x moteur de décodage vidéo 4x moteur d’encodage vidéo 4x moteur d’ encodage/décodage ProRes |
Gestion écrans | Écran intégré + 1 écran externe (1 × 6K60) | Écran intégré + 2 écrans externes (2 × 6K60) | Écran intégré + 4 écrans externes (3 × 6K60, 1 × 4K60) | 5 écrans externes (4 × 6K60, 1 × 4K60) |
On ne parle donc pas de 2e génération Apple Silicon, mais d’un quatrième étage d’extension de la 1re génération. L’objectif est de fournir plus de puissance que le déjà impressionnant M1 Max. Au lieu de faire une puce encore plus grande, le M1 Ultra utilise la combinaison de deux puces M1 Max.
Ils n’ont pas seulement combiné deux matrices M1 Max sur un seul SoC, ils ont également fait en sorte que les deux matrices se présentent comme un seul GPU monolithique. Le résultat est une puce qui, sans aucun doute, est l’une des conceptions les plus intéressantes pour un SoC grand public.
4 mois d’abonnements offerts, un bloqueur de pub intégré et des serveurs parmi les plus rapides du marché : c’est Noël chez Surfshark ! L’abonnement à ce VPN est à seulement 1,99 € /mois !
Comme le montrent les premiers benchmarks, cette stratégie à double matrice profite bien plus aux charges de travail CPU et GPU multi-threads qu’aux tâches mono-thread — un domaine où Apple commence déjà à prendre du retard. En permettant aux deux puces du M1 Ultra de se présenter de manière transparente comme un seul GPU, Apple a lancé une nouvelle course technologique pour placer des GPU multi-puces dans du matériel haut de gamme grand public.
En plaçant deux matrices M1 Max sur une seule puce, Apple a doublé la quantité de composants. Cela signifie deux fois plus de cœurs de processeur, deux fois plus de cœurs de GPU, deux fois plus de cœurs de moteur neuronal, deux fois plus de canaux de mémoire LPDDR5 et deux fois plus de gestions de ports (E/S) pour les périphériques.
Alors que M1 Max avait 16 canaux LPDDR5-6400 pour un total de 408 Gb/s de bande passante mémoire, M1 Ultra double cela à 32 canaux LPDDR5 et 800 Gb/s de bande passante mémoire. Une quantité qui ne serait même pas exploitée entièrement par Apple sur cette configuration. Comme avec le M1 Max, Apple a soudé les puces LPDDR5 directement sur le SoC, pour un total de 8 puces sur le M1 Ultra (comme vous pouvez le voir sur la photo de une). Il n’y a donc pas de moyen d’ajouter de la mémoire vive a postiori, n’oubliez pas de choisir la bonne quantité de mémoire vive pour vos besoins pendant la configuration de la machine.
Ce qu’Apple a présenté comme la technologie UltraFusion peut être décrite comme une autoroute très courte avec 10 000 voies. Cet ingrédient secret est donc une interface à très haute vitesse qui, à l’aide d’un interposeur en silicium, permet de relier deux matrices M1 Max. Au total, les deux matrices ont un débit de données disponibles de 2,5 Tb/s. D’après AnandTech, cette technologie ressemblerait à la technologie EMIB d’Intel ou à la technologie Elevated Fanout Bridge (EFB). Apple ne serait donc pas le premier à mettre sur le marché une telle technologie, néanmoins ils seront sans doute les premiers à la démocratiser.
Plus puissante qu’une GeForce RTX 3090 pour un 1/3 de sa consommation
Le GPU est surpuissant. D’après Apple, les performances graphiques de la M1 Ultra seraient supérieures à celles à la carte graphique GeForce RTX 3090 de Nvidia, qui est actuellement la carte graphique la plus rapide du marché. Et en plus, la puce M1 Ultra ne consomme qu’un peu plus de 100 Watts, soit 200 Watts de moins que le RTX 3090.
Le GPU GA102 utilisé par NVIDIA possède 28,3 milliards de transistors, tandis que le M1 Ultra est de 114 milliards. Évidemment, Nvidia a conçu sa carte graphique différemment : ils n’ont pas pris en compte la consommation d’énergie. Apple a conçu un GPU plus large, avec davantage de silicium, pour maintenir des fréquences d’horloge plus basses (et donc optimiser la consommation d’énergie). Bien sûr, Apple bénéficie également d’un énorme avantage en matière de processus de fabrication, en utilisant le processus de gravure N5 de TSMC par rapport au processus 8 nm de Samsung que l’on trouve sur les Nvidia RTX 30.
Fait intéressant, la version du Mac Studio avec M1 Ultra n’utilise pas le même système de refroidissement que la version M1 Max. Il en résulte une différence de poids de près d’1 kilogramme. Les machines ont la même alimentation de 370 W, le poids supplémentaire est dû au fait que le M1 Ultra possède un module thermique en cuivre plus grand, alors que le M1 Max a un dissipateur thermique en aluminium. Pour information, le cuivre, étant plus dense, avec plus de masse thermique et de conductivité que l’aluminium, il peut donc retenir plus de chaleur et déplacer cette chaleur plus rapidement.
Au vu des performances d’un M1 Max, Apple promet donc des niveaux de performances CPU et GPU pour le M1 Ultra qui font de l’ombre à toutes les configurations actuelles basées sur les CPU d’Intel et les cartes graphiques d’AMD. Cependant, il faudra faire des tests plus poussés pour comprendre les scénarios qu’Apple a illustrés dans sa présentation.
Nvidia, AMD et Intel sont déjà dans cette bataille du GPU multi-die. La théorie est que si vous prenez une puce puissante et que vous la collez de manière transparente à une autre, vous obtiendrez quelque chose de deux fois mieux. En théorie, c’est simple. En réalité, ce n’est pas si simple, et bien qu’AMD a déjà réussi à faire fonctionner un concept similaire pour son accélérateur de calcul de supercalculateur MI200, personne d’autre ne l’avait fait avant Apple pour le grand public.
Nous sommes rentrés dans une nouvelle ère très excitante dans le développement de GPU, et le M1 Ultra d’Apple est un aperçu de ce qui va arriver chez les autres qui ont les mêmes objectifs qu’Apple. Vous comprenez, certainement, bien mieux ce qui justifie le prix délirant du Mac Studio. Avec le SoC Apple M1 Ultra, la machine est vendue à partir de 4599 euros (Apple M1 Ultra, 64 Go et 1 To).
Un article hors sol, où l'auteur réduit le monde pro aux influenceurs youtube. La force de cette puce: faire du traitement vidéo. Pour le reste, elle reste loin derriere. Dans les benchs de rendu vidéos, elle est moins performante que ses homologues x86. Dans les simulations physiques, les perfs sont affreuses et peu de logiciels vont optimiser leurs codes de calculs pour ce SOC. Dans les jeux et les applis, les tflops ne se convertissent pas en fps. Bref, un SOC concu pour Geekbench, qui sert avant tout un discours marketing Apple pour justifier la migration Ordi sur ARM. Pour résumer, Apple a un message Marketing pour ses clients pour les rassurer sur le passage ARM.
Enfin on va pouvoir jouer convenablement à Candy Crush sur Mac !
alors pour le multi die ça existe depuis longtemps chez AMD rien que sur les ryzen, Intel l'a fait aussi avec certaines gammes Extreme lga 2066. Et puis ce mytho incroyable une petite chose comme ça au niveau d'un gpu HDG ? Ils ont osé comparer ca a une rtx 3090 ? Deja sur les premier bench en rendu 3d la 3090 fait du 17 secondes. et le m1 ultra ... 3 min et quelques. Faut arreter de croire le marketing apple serieux
"personne d’autre ne l’avait fait avant Apple pour le grand public." A 4600€ la machine ce n'est pas du grand public ! Ce que vous dites dans vos articles montrent que vous êtes de plus en plus hors sol...
C'est impressionnant 😳😱
Pas possible t'es sur le media de référence !
Le rapport qualité prix est loin d’être médiocre si on prend en compte que pour avoir aussi bien en cpu faut taper dans du threadripper voire epyc, donc faut payer ta cm qui va avec, faut payer le bon gros refroidissement qui va avec, faut payer l’alim qui va pouvoir supporter un gros proc comme ça + une 3080/90. Si on prend en compte l’encombrement de la machine. Je sais pas si vous vous rendez compte qu’on a autant de puissance dans une demi boite à chaussure qu’on glisse dans n’importe quelle valise en déplacement. Si on prend en compte la différence de consommation qui face a un combo gros threadripper + 3090 est de quasiment 400W, et que pour un pro qui va taper dedans 8h par jour 300h par an, ca fait environ 200€/an d’économies par an a 17.5cts du kwh sachant que le pire est a venir. C’est clairement pas pour tout le monde comme machine, mais pour ceux qui en ont besoin c’est un prix plus que correct, SURTOUT si on travail dans l’image, le codec PROres étant ultra utilisé dans ce milieu et les puces M1 faisant des merveilles avec avec tous leurs coprocesseurs dédiés
Le plus impressionnant reste la faible consommation. Mais c'est surtout un étendard pour la marque, car qui va véritablement utiliser le plein potentiel du M1 ultra ? C'est ultra niche et le rapport qualité prix est plutôt médiocre (à tel point que pour ne pas se voiler la face celui ci est comparé à des xeon eux aussi de niche). Avec Zen 4 et RDNA 3 de AMD cet été ça lui laisse également moins de 6 mois pour s'afficher en haut de tableau. J'aurais préféré attendre M2 et que celui ci soit équipé d'office sur les macbook, le message aurait été plus fort et grand public.
Il ya écrit GPU à la place de CPU partout dans l'article.
C'est 350W en FE (et plus en custom) les 3090, pas 300W.
La 3090 est plutôt orientée vers le semi-pro que vers les jeux. Enfin y’aura toujours des gogoles pour payer plus du double qu’une 3080 pour avoir les perfs d’une 3080OC, mais la majeure partie des gens qui l’achètent c’est pour avoir accès a une grosse VRAM sans passer côté quadro et économiser un sacré paquet d’argent. Pareil pour le machine learning avec les tensor core supplémentaires etc
Si j'ai bien compris, UltraFusion ne fait pas qu'interposer les die mais les présente comme un ensemble monolithique et indifférencié à MacOS, sans changer fondamentalement les applications, ce qui est assez fort. Je ne sais pas comment Windows et Linux perçoivent ce type d'architecture multi-die et avec quel rendement.
En effet, c'est un système pensé pour les professionnels, pas pour le grand public... et quand bien même le GPU serait plus puissant qu'une RTX, son utilité n'est pas tourné vers le jeu comme pour la carte de Nvidia. En attendant, les chiffres sont assez impressionnants !
C'est une petite prouesse mais ce n'est pas si grand publique que ça. Avec un ticket d'entrée à 4500€, peu de gens peuvent se le permettre. C'est surtout accès pour les pro, semi-pro et les geek hardcore. Aussi, je doute de la pertinence de comparer cette puce à la 3090. Les deux n'ont pas été conçu dans le même but.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix