Es ist endlich soweit: AMD hat sein lang erwartetes Versprechen eingelöst und die APU der Exascale-Klasse, der Instinct MI300A, geht in endlich Serie. In diesem Quartal beginnt die Serienproduktion und die APU wird voraussichtlich 2024 als die schnellste HPC-Lösung weltweit verfügbar sein. Man hat lange darauf gewartet und konnte es kaum erwarten, die Leistungsfähigkeit dieser neuen Technologie zu erleben.
![](https://www.igorslab.de/wp-content/uploads/2023/12/AMD-Instinct-MI300A-_1-980x551.png)
Die AMD Instinct MI300A APU vereint unterschiedliche Architekturen und Verbindungstechnologien wie Zen 4, CDNA 3 und die neueste Generation der Infinity-Architektur. Die MI300A APUs bieten eine Reihe von Highlights.
Bis zu 61 TFLOPS FP64-Berechnung
Bis zu 122 TFLOPS FP32-Berechnung
Bis zu 128 GB HBM3-Speicher
Bis zu 5,3 TB/s Speicherbandbreite
146 Milliarden Transistoren
Die MI300A ähnelt stark der MI300X, jedoch mit dem Unterschied, dass sie auf speicher- und Zen-4-optimierte Kerne setzt. Nun wollen wir uns den Details dieser Exascale-Leistung für HPC der nächsten Generation und KI-Rechenzentren zuwenden.
Ein aktiver Chip hat zwei CDNA 3 GCDs entfernt und durch drei Zen 4 CCDs ersetzt, welche jeweils eigene Cache-Pools und Core IPs besitzen. Auf dem Chip sind nun insgesamt 24 Kerne und 48 Threads vorhanden, aufgeteilt in 8 Kerne und 16 Threads pro CCD. Zusätzlich gibt es einen separaten Cache-Pool pro CCD mit einer Größe von 32 MB sowie einen L2-Cache von 24 MB (1 MB pro Kern). Es ist zu beachten, dass auch die CDNA 3 GCDs über einen separaten L2-Cache verfügten.
AMD hat auf der GPU-Seite insgesamt 228 Compute Units aktiviert, die auf der CDNA 3-Architektur basieren. Dies entspricht 14.592 Kernen, was bedeutet, dass pro GPU-Chiplet 38 Compute Units vorhanden sind. Hier sind einige der herausragenden Merkmale der AMD Instinct MI300 Accelerators zusammengefasst:
Erstes integriertes CPU+GPU-Paket
Ziel Exascale-Supercomputer-Markt
AMD MI300A (integrierte CPU + GPU)
146 Milliarden Transistoren
Bis zu 24 Zen 4-Kerne
CDNA 3 GPU-Architektur 228 Compute Units (14.592 Kerne)
Bis zu 128 GB HBM3-Speicher
Bis zu 8 Chiplets + 8 Memory Stacks (5nm + 6nm Prozess)
AMD hat erneut den MI300A mit dem H100 verglichen, diesmal jedoch in HPC-spezifischen Workloads. In Bezug auf die Leistungszahlen konnte die Instinct MI300A APU in OpenFOAM eine bis zu 4-fache Leistungssteigerung erzielen. Dies ist hauptsächlich auf die vereinheitlichte Speicheranordnung, die GPU-Leistung sowie die insgesamt verfügbare Speicherkapazität und Bandbreite zurückzuführen. Im Vergleich zu NVIDIAs Grace Hopper Superchips bietet das System auch eine bis zu 2-fache Leistung pro Watt.
Es wurde bestätigt, dass die Instinct MI300A APUs nun ausgeliefert werden und auch für die Energieversorgung des kommenden El-Capitan-Supercomputers verwendet werden. Dieser wird voraussichtlich eine Rechenleistung von bis zu 2 Exaflops bieten. Es ist erwähnenswert, dass AMD das einzige Unternehmen ist, das bisher mit dem Frontier-Supercomputer die Grenze von 1 Exaflop durchbrochen hat und zudem das effizienteste System auf der Welt besitzt.
Quelle: AMD
15 Antworten
Kommentar
Lade neue Kommentare
Urgestein
1
Veteran
Urgestein
Urgestein
Veteran
Urgestein
Urgestein
Urgestein
Veteran
Urgestein
Urgestein
Urgestein
Veteran
Alle Kommentare lesen unter igor´sLAB Community →