Zunächst kann ich alle erst einmal beruhigen, es wird sich um Gegensatz zur aktuellen Zen 3 Generation auch bei Zen 4 nicht viel ändern. Allerdings existieren auch jetzt noch jede Menge schwammige Hypothesen und Unklarheiten über AMDs Lesart, die Temperaturen zu überwachen und auch für den Benutzer auszugeben. Da möchte ich heute, auch im Hinblick auf die kommenden CPUs einmal etwas Licht ins Dunkel bringen. Denn bereits Begriffe wie Tctl werden leider oft genug falsch interpretiert und verstanden. Und wenn es dann noch um das Temperatur- und Power-Management geht, bleibt nur noch dunkler Wald. Doch keine Angst, ich werde das alles so allgemeinverständlich wie möglich herunterbrechen.
Die Tctl und Tcase entmystifiziert
Um den Wert für Tctl richtig zu verstehen, muss man einmal genauer auf den Ursprung und den Zweck dieser Temperatur-Daten schauen. Bei den Sockel AM5 Prozessoren wird diese sogenannte On-Die Temperaturüberwachung entweder über die Seitenband-Temperatursensor-Schnittstelle (SB-TSI) nach der SMBus v2.0-Spezifikation oder durch das Lesen des Registers für THM_TCON_CUR_TMP realisiert, was bei beiden Methoden aber aufs Gleiche hinausläuft und hier als genauere Erklärung nur verwirren würde. SB-TSI ist somit weitgehend identisch zu den Schnittstellen gängiger thermischer Diodenüberwachungs-Geräte und kann wie üblich auch recht simpel ausgelesen werden.
Der gemeldete Wert Tcontrol (kurz Tctl) wird der Plattform zur Steuerung der Kühlungslösung zur Verfügung gestellt, stellt jedoch nicht die tatsächliche Temperatur des Chips oder des Prozessorgehäuses dar! Der maximale Wert von Tcontrol ist für alle Prozessoren stets fest und unabänderbar auf 100 normiert, unabhängig von der der maximalen Gehäusetemperatur Tcase des Prozessors.
Bevor wir auf Tcase als (TDP-Klassen-abhängige) Gehäusetemperatur eingehen, interessiert und zunächst noch Tjunction (kurz Tj) als Sperrschicht-Temperatur. Der Kunde kann die tatsächliche Sperrschichttemperatur wie schon bei Zen 3 (und älter) mit der bekannten Formel Tj = Tctl + Tj,offset ermitteln. Interessanterweise enthalten die Unterlagen für Zen 4 als Offset für alle TDP-Klassen nur den Wert 0, so dass in den Specs entweder noch nichts eingetragen wurde oder hier gar kein Offset verwendet wird. Dann könnte man sogar davon ausgehen, dass Tj und Tctl identisch sind, wobei ich persönlich von einem höheren Wert ausgehe, der aber nicht offengelegt wird, um den Endanwender nicht zu verängstigen.
Tctl sollte stets zur Steuerung der Lüftergeschwindigkeit verwendet werden, um den Prozessor innerhalb seiner Temperaturspezifikation zu halten und kann darüber hinaus auch vom System verwendet werden, um den Prozessor zu drosseln. Der Prozessor verfügt zudem auch über einen schnellen ALERT_L-Pin, um ein interruptgesteuertes Modell anstelle des eher langsamen von Pollings zu nutzen. Die übliche Rechnung mit Tctl – Tctl,max (wie z.B. in HWinfo64) gibt letztendlich nur an, um wie viel Grad Celsius ein Prozessor unter der maximalen Temperatur (100) liegt.
Was man bei Raphael jedoch weiter verbessert hat, ist CUR_TEMP. Diese Filter-Funktion glättet die gemeldete Temperatur und hilft dabei, nervöse Änderungen der Lüfterdrehzahl des Lüfters als Reaktion auf gemeldete Spikes zu vermeiden. Das willkürlich scheinende, plötzliche Aufheulen der CPU-Lüfter kennen wir ja noch insbesondere von älteren Intel-Mainbords, wo das nervtötende Auf und Ab bis zur Korrektur der Umstände auf harte Kritik stieß. Hier werden die Werte für Tctl faktisch gecuttet und entschleunigt.
Mit Tcase als Richtwert ist das so eine Sache, denn je nach TDP-Klasse orientiert man sich bei Raphael an einem anderen, zur geforderten Kühllösung passenden Wert. Das bezieht sich auch auf die Summe der Wärmewiderstände zwischen dem IHS (Prozessordeckel) und der Umgebung. Allen Werten gemeinsam ist jedoch der Bezugspunkt in der Mitte der Oberfläche des IHS. Die anvisierten Werte selbst zeigt uns die Tabelle für Tcase:
Das Thermische Management
Parallel zu diesen Auslesewerten für die Lüftersteuerung und Temperaturkontrolle gibt es noch weitere thermische Funktionen. Die wichtigsten sind die konfigurierbare Hardware-Wärmekontrolle (cHTC), PROCHOT und ThermTrip. Das ist insofern hochinteressant, weil es Dinge sind, die nur im Inneren des Prozessors stattfinden und nicht von außen beeinflussbar und unmittelbar sichtbar sind. Eine dieser Funktionen ist die Konfigurierbare Hardware-Wärmeregelung (cHTC), die sanfte p-Zustandsübergänge bietet und so die Leistung während des tatsächlichen Betriebs maximiert. Der Standard-Tctl-Grenzwert für cHTC ist auf 95 eingestellt. Dies ist ein speziell abgesicherter Wert und er kann auch nicht vom BIOS geändert werden. Der Endanwender sollte also die Lüfterdrehzahl so anpassen, dass dann der Prozessor unter Volllast maximal bei oder besser noch unter dem Tctl-Grenzwert agiert, weil sonst die Spielräume für den Takt nicht mehr ausgenutzt werden können (thermisches Throttling).
PROCHOT gibt es seit Intels Pentium 4 Prozessoren und der digitale Ausgabe-Pin zeigt, dass der interne Thermalkontrollschaltkreis aktiviert wurde. Dies geschieht, wenn der Prozessor seine maximale sichere Betriebstemperatur erreicht hat. Die SoC-Frequenz wird auch bei den kommenden Alder Lake und Raptor Lake CPUs weiterhin durch das PL4 bestimmt. Nicht so bei AMD. PROCHOT_L ist im Gegensatz zu Intel ein echter unidirektionaler Pin, bei dem nur das System PROCHOT auslösen und den Prozessor in den aktiven PROCHOT-Zustand versetzen kann.
In diesem Zustand leitet der Prozessor einen Übergang zur niedrigsten Frequenz (Fmin) ein. Dieser Wert ist ebenfalls festgeschrieben und kann nicht geändert werden. Die Leistungsreduzierung wird innerhalb von 1,5 ms nach dem Einschalten erreicht. PROCHOT kann nur alle 5 ms durch einen externen Agenten ausgelöst werden (für eine unbegrenzte Dauer). Intels Fast PROCHOT# ist hier deutlich schneller. Vsys1 wird vom IMPV9.1-Controller überwacht und PROCHOT wird innerhalb von 2 μs (einstellbar) nach Überschreiten der Schwelle aktiviert. Die CPU wird dann bereits 1μs später gedrosselt. Fast PROCHOT# ermöglicht Intel somit ein höheres PL4, was zu einer besseren Reaktionsfähigkeit bis hinunter zu niedrigen Ladezuständen führt, während die Systemstabilität erhalten bleibt, erzeugt aber auch härtere Lastwechsel.
Und dann gibt es noch den Thermtrip_L Pin zum finalen Schutz (Shut-Down). Dieser wird vom Prozessor selbst aktiviert, wenn die Prozessortemperatur einen voreingestellten Grenzwert überschreitet. Die Prozessortakte werden abgeschaltet und ein Low-Voltage-VID-Code wird an den Spannungsregler gesendet. In einem solchen Fall sollte das System innerhalb von 500 ms in den Zustand der Systemabschaltung (S5) übergehen. Der Thermtrip_L-Pin ist bidirektional und entweder das System oder der Prozessor kann die Thermtrip-Funktion auslösen, indem der Thermtrip_L-Pin auf Low gesetzt wird. Thermtrip_L wird als Schutz verwendet, um dauerhafte Hardwareschäden zu verhindern. Für SB-TSI, cHTC und ThermTrip wird der gleiche On-Die-Temperaturerfassungsmechanismus verwendet, denn ich bereits oben als Tctl beschrieben habe.
Mehr Geheimnisse gibt es hier nicht und die Änderungen im Vergleich zu Zen 3 sind eher eine kleinere Evolution, das eigentlich eigentliche Grundprinzip bleibt hingegen das gleiche. Man kann also aus vielen Dingen auch auf Zen 3 zurückschließen. Interessant ist übrigens, dass AMD auch den 16-Kerner nun intern als APU bezeichnet, bei der sich im I/O-Die eine Grafikeinheit verbirgt. Doch kommen wir nun auf der nächsten Seite zum Power-Management, denn irgendwo müssen die Abwärme und die Temperaturen als Folge ja auch herkommen.
13 Antworten
Kommentar
Lade neue Kommentare
Veteran
Urgestein
1
Urgestein
Mitglied
Veteran
Mitglied
Veteran
Mitglied
Urgestein
Mitglied
Mitglied
Alle Kommentare lesen unter igor´sLAB Community →