Die Threadripper-Prozessoren von AMD verfügen über eine einzigartige Multi-Chip Module (MCM)-Architektur, die in einigen Anwendungen die Leistung beeinträchtigen kann. AMD hat die Auswirkungen auf die Prozessoren der X-Serie weitgehend eliminiert, aber die neuen Prozessoren der WX-Serie verfügen über ein Quad-Die-Design, das neue Herausforderungen aufwirft. Zwei der vier Die im Inneren des Prozessors besitzen nämlich keine direkt angeschlossenen Speichercontroller (Compute Die), während die anderen zwei wiederum direkten Zugriff auf den Speicher (I/O Die) haben.
Der Round Robin Thread (“Rundlauf”) Thread-Planungsmechanismus von Windows neigt dazu, wichtige Threads auch bei unwichtigen Hintergrundprozessen vom I/O-Die mit dem direkten Speicherzugriff zu entfernen und auf die anderen, nicht direkt angebundenen Dies zu verschieben. Dies hat zur Folge, dass so verschobene, speicherintensive Anwendungen während des gesamten Betriebs dann auf einen anderen Die zugreifen, was natürlich die Leistung beeinträchtigt.
AMD hat ursprünglich zwei wählbare Spiel- und Entwickler-Modi entwickelt, um einige der Herausforderungen clever zu umgehen. Aber das Umschalten zwischen diesen Modi erfordert einen Neustart, da ja faktisch die halbe CPU abgeschaltet wird und es zudem auch noch andere Leistungsbremsen provoziert.
Der neue Dynamic Local Mode von AMD, der ausschließlich für die Threadripper 2990WX- und 2970WX-Prozessoren vorgesehen ist, läuft als Hintergrunddienst innerhalb des Betriebssystems und erkennt automatisch speicherhungrige Anwendungs-Threads (die Top 13 bis 16) und weist sie dynamisch einem der Dies mit lokalen Speicher-Controller zu. Umgekehrt erkennt der Dienst Threads, die nicht so empfindlich auf Speicherlatenz reagieren und weist sie dem Die ohne eigenen Speicher-Controller zu, wodurch die Performance des Prozessors maximiert werden soll.
Diese neue Implementierung im Ryzen-Master-Tool ist für den Benutzer transparent und erfolgt zudem auch ohne Neustart. AMD hat den Performance-Overhead des Hintergrunddienstes nicht quantifiziert, aber wir haben ~0,5% Prozessor und 1MB Speicherauslastung bei normalem Gebrauch mit dem Ryzen Threadripper 2970WX beobachtet. Man aktiviert den Dienst vorerst in Ryzen Master, aber AMD plant, ihn in Zukunft direkt in den Chipsatz zu implementieren.
Das Programm funktioniert am besten mit “Mid-Threaded”-Anwendungen, im Gegensatz zu Anwendungen mit weniger echter Last und wenig benötigten Threads. Es ignoriert auch hochskalierbare Anwendungen, die auf allen Kernen und Threads laufen.
AMD lieferte die oben genannten Leistungsmessungen in den Folien, hat aber leider nicht auf unsere Fragen geantwortet, ob diese Metriken nun im Gaming- oder im Creators-Modus aufgenommen wurden. Auf den folgenden Seiten haben wir deshalb natürlich eigene Tests durchgeführt. Mit zum Teil eher weniger positiven Ergebnissen. Oder anders ausgedrückt: Es war wie ein saftiges Stück Kammfleisch, nämlich sehr gut durchwachsen.
Übertaktung
Wir haben mehrere Konfigurationen getestet, sind aber bei allen unseren angepassten Threadripper WX-Konfigurationen bei Precision Boost Overdrive (PBO) geblieben. Diese automatisierte Übertaktungsfunktion, die direkt in den Chip integriert ist, übertaktet den Prozessor auf der Grundlage des verfügbaren Stroms, der VRM-Betriebsumgebung und des thermischen Headrooms bis zum Maximum.
Aufgrund von möglichen Kühlungs- und Stromversorgungs-Limits haben wir unsere gesamte Testsuite bei Standardeinstellungen und mit aktivierter PBO durchlaufen, anstatt eine einfache, manuelle Übertaktung aller Kerne zu verwenden. Unsere PBO-fähigen Konfigurationen profitierten von höheren Speichertransferraten, wie in der folgenden Tabelle dargestellt. Wie bei jeder Übertaktungsfunktion erlischt durch die Verwendung von PBO natürlich die Garantie.
Test-System
Die Test-Methodik vieler Dinge haben wir in unserem Grundlagenartikel “So testen wir Grafikkarten, Stand Februar 2017” ja bereits sehr ausführlich beschrieben und so verweisen wir deshalb der Einfachheit halber jetzt nur noch auf diese detaillierte Schilderung. Wer also alles noch einmal ganz genau nachlesen möchte, ist dazu gern eingeladen.
Abweichend ist bei den einzelnen Sockeltypen natürlich die Hardwarekonfiguration mit CPU, RAM, Mainboard, während wir bei der Kühlung generell auf unser zentrales Kühlsystem im Labor mit einem potenten Chiller setzen
Als Mainboard dient mit ein MSI MEG X399 Creation, was sich sogar noch bei LN2 als fast unkaputtbar erweisen sollte.
Die Zusammenfassung in Tabellenform gibt nun einen kurzen Überblick über die jeweiligen Konfigurationen:
Testsysteme und Messräume | |
---|---|
Hardware: |
AMD Socket AM4 (400-Series) AMD Ryzen 7 and Ryzen 5 MSI X470 Gaming M7 AC 2x 8GB G.Skill FlareX DDR4-3200AMD Socket SP3 (TR4) Threadripper 2 MSI MEG X399 Creation 4x 8GB G.Skill FlareX DDR4-3200 RGBIntel LGA 1151 (Z390): Intel Core i7-9900K MSI MEG Z390 Godlike 2x 8GB KFA2 HoF @DDR4-3200Intel LGA 2066 Intel Core i7, Core i9 MSI X299 Gaming Pro Carbon AC 4x 8GB G.Skill FlareX DDR4-3200 Alle Systeme: |
Kühlung: |
Alphacool Eisblock XPX Alphacool Eiszeit 2000 Chiller Alphacool Schnellverschlüsse für schnellen Komponenten- und Kühlerwechsel Aqua Computer aquaero 6 PRO USB Fan-Controller, Grafik-LCD Aqua Computer Durchflusssensor “high flow” G1/4 Thermal Grizzly Kryonaut (für Kühlerwechsel) |
Monitor: | Eizo EV3237-BK |
Gehäuse: |
Lian Li PC-T70 mit Erweiterungskit und Modifikationen |
Leistungsaufnahme: |
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card) berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung direkte Spannungsmessung an den Shunts, den jeweiligen Zuführungen und am Netzteil Auslesen der Mainboard-Sensoren 2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion 4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC) 4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz) 1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion |
Thermografie: |
Optris PI640, Infrarotkamera PI Connect Auswertungssoftware mit Profilen |
- 1 - Einführung und Daten
- 2 - Dynamic Mode, OC und Testsystem
- 3 - Office und Browser
- 4 - Workstation: Endcoding/Kompression
- 5 - Workstation: 2D/3D Grafik
- 6 - Workstation: Compute and Rendering
- 7 - VRMark, 3DMark, AotS: Escalation, Dawn of War III
- 8 - Far Cry 5, GTA V, Hitman
- 9 - Shadow Of War, Project CARS 2
- 10 - Temperaturen
- 11 - Leistungsaufnahme
- 12 - Fazit und Zusammenfassung
Kommentieren