AMD CDNA 3 Roadmap: MI300 APU mit 5-facher Leistung/Watt-Steigerung


AMD Financial Analysts Day Slides, 9. Juni 2022

(Bildnachweis: AMD)

AMD sprach auf seinem Finanzanalystentag über seine neueste CDNA-Roadmap, und die großen Neuigkeiten für Rechenzentrumsgrafiken sind die kommende CDNA-3-Architektur und die MI300-APU. Ja, Sie haben das richtig gesehen: AMD wird eine ausgewachsene APU herstellen, die CPU- und GPU-Chips in einem einzigen Produkt kombiniert.

Beginnend mit CDNA 3 behauptet AMD, dass es mehr als ein 5-faches Upgrade der Leistung pro Watt (perf/Watt) gegenüber den bestehenden CDNA 2-Produkten liefern wird. Das mag wie eine unglaubliche Leistung erscheinen, aber wenn man etwas tiefer gräbt, deutet dies auf einen einfachen Weg hin, wie AMD diese Zahl erreichen könnte. Im Gegensatz zu seinen Consumer-Grafikprodukten enthält CDNA Matrixkerne (ähnlich den Tensorkernen von Nvidia). Der Instinct MI250X liefert derzeit bis zu 95,7 Teraflops an Spitzen-FP64-Matrix-Operationen oder das Vierfache dieser Zahl für einen Spitzen-FP16- und bfloat16-Durchsatz von 383 Teraflops. Der Haken ist, dass MI250X die gleichen 383 Teraflops für INT8- und INT4-Leistung hat.

Es ist eine sichere Wette, dass AMDs Behauptungen von 5x der Leistung/Watt keine universelle Effizienzsteigerung für FP64, FP32 und andere Formate sind. Wahrscheinlicher ist, dass AMD den INT8-Durchsatz auf das Doppelte der FP16/bfloat16-Rate steigern wird, und INT4 könnte das noch einmal verdoppeln. Das würde zu einer 4-fachen Verbesserung führen, und architektonische Verbesserungen von 25 % würden diese auf das 5-fache bringen. AMD erwähnt auch neue mathematische Formate, die mit dieser Leistungssteigerung einhergehen würden. Natürlich ist Leistung/Watt sowieso immer eine nebulöse Metrik, also heften Sie dies als „bis zu 5X oder mehr“ Verbesserung ab und warten wir ab, wie die tatsächliche Leistung aussieht.

Neben Leistungs- und Effizienzverbesserungen wird CDNA 3 ein Infinity Fabric der 4. Generation und einen Infinity Cache der nächsten Generation enthalten. Wie erwartet wird cDNA 3 eine 5-nm-Prozesstechnologie verwenden, wahrscheinlich TSMC N5 oder N5P. Das sollte helfen, die anderen Ziele für das Design zu erreichen.

AMD Financial Analysts Day Slides, 9. Juni 2022

(Bildnachweis: AMD)

CDNA 3 wird auch von einer kohärenten Speicherarchitektur, die in CDNA 2 verwendet wird, zu einer einheitlichen Speicherarchitektur mit CDNA 3 wechseln. Dies ist eine entscheidende Verbesserung, da ein Großteil der Energie, die in Rechenzentrums-Workloads verwendet wird, für das Verschieben von Daten verwendet wird. Die Verringerung des Bedarfs an redundanten Kopien kann die Gesamteffizienz erheblich steigern, was den nächsten Punkt aufwirft.

AMDs Instinct MI300-Lösung wird sowohl CPU- als auch GPU-Chiplets in der Verpackung enthalten. AMD nennt dies das erste Rechenzentrum APU, Accelerated Processing Unit. Das ist interessant, da AMD den Begriff APU in den letzten Jahren bei seinen Ryzen-Lösungen mit integrierter Grafik nicht mehr so ​​oft verwendet hat. Vielleicht wird es ein Wiederaufleben des APU-Brandings geben, aber die Kombination aus Zen 4-CPU-Kernen und CDNA 3-GPU-Kernen sollte sich als unglaublich stark erweisen.

AMD Financial Analysts Day Slides, 9. Juni 2022

(Bildnachweis: AMD)

MI300 wird über ein fortschrittliches Paket verfügen, das CPUs, GPUs, Cache und HMB in einem einzigen Paket zusammenfasst. Die vorherige Folie zeigt ein Paket mit scheinbar vier CPU/GPU-Chiplets gepaart mit HBM. Angesichts des Fokus auf den Rechendurchsatz vermuten wir, dass AMD drei GPU-Chiplets mit einem einzigen CPU-Chiplet verwenden wird, wenn dieses Rendering einigermaßen genau ist, aber AMD hat sich nicht so oder so geäußert.

Dies hat einige interessante Auswirkungen auf AMDs bevorstehende Supercomputer-Bemühungen, da der MI300 wahrscheinlich der Hauptmotor hinter dem El Capitan-System sein wird. Wo Frontier Zen 3 EPYC „Trento“-Prozessoren verwendet und jede 64-Kern-CPU mit vier MI250X-GPUs verknüpft, könnte El Capitan ganz anders aussehen. Die Verwendung einer externen Zen 4-CPU und die Kombination mit vier MI300-APUs, die jeweils eine CPU enthalten, erscheint unnötig. Stattdessen könnte El Capitan einfach ein 1U-Blade haben, das in so viele MI300-APUs passt, wie passen.

AMD sagt, dass der resultierende MI300 eine 8-fache Steigerung der KI-Trainingsleistung im Vergleich zum MI250X liefern wird, und das geht wiederum wahrscheinlich auf Verbesserungen des INT8- und INT4-Durchsatzes zurück, kombiniert mit mehr GPU-Kernen im Allgemeinen. MI250X enthält ein Paar Graphics Compute Dies (GCD) in einem Paket, und MI300 sieht so aus, als hätte es drei CDNA 3 GCDs neben einem Zen 4 CPU-Die. Das sind 50 % mehr Grafikpotenzial, plus die architektonischen Verbesserungen.

AMD Financial Analysts Day Slides, 9. Juni 2022

(Bildnachweis: AMD)

AMD hat in seiner Roadmap nichts über CDNA 3 hinaus verraten, obwohl CDNA 4 mit ziemlicher Sicherheit folgen wird. Die GPU-Roadmap erwähnte RDNA 4 mit einem Startzeitrahmen von 2024, und CDNA 4 würde wahrscheinlich ein Jahr später folgen. Wir lassen AMD zuerst CDNA 3 herausbringen und freuen uns darauf, in den kommenden Monaten weitere Details zu Design und Architektur zu hören.

Kommentar verfassen

%d Bloggern gefällt das: