Frage Warum ist großer RAM immer langsamer als kleiner?

OldMan

Veteran
Mitglied seit
Mrz 28, 2024
Beiträge
134
Bewertungspunkte
54
Punkte
28
Standort
München
Ein freundliches Hallo zum Montagmorgen,

ich bezeichne mich jetzt nicht als absoluten Profi, aber ganz unwissen bin ich jetzt nicht was Computer anbelangt. Nur eine Frage stellt sich mir doch: Warum ist großer RAM langsammer als kleiner RAM, vor allem bei DDR 5. Unter groß verstehe ich hier alles über 64GB. Bei meinem kleinen System (Ryzen 9 5950x mit 128GB RAM) war das alles kein Problem. 4 Bänke voll besetzt und alles lief ohne Probleme. Jetzt bei dem 7950x3d ist es schlicht ein Grauß. 96GB RAM auf 2 Bänke verteilt geht so, aber mit 192GB und 4 Bänken ist es schlicht Sch.....! Es läuft zwar aber ziemlich "langsam" mit nur 4200. Darüber hinaus bekommt man keinen "flinken" Speicher der Latenzen in dem Bereich der 16 oder 32 GB Module hat. Warum ist das bitte so? Ich bin bisher immer davon ausgegangen dass der höhere Preis für die Module auch eine entsprechende Performance mitbringen, aber weit gefehlt. Und, nur weil der RAM mehr Kapazität hat muss er ja nicht langsamer sein, war bei DDR4 ja auch nicht so.
Kann mir da jemand von Euch mal ein wenig auf die Sprünge helfen warum das so ist?
 
Lösung
Ich glaube da muss man prinzipiell erstmal 2 Faktoren unterscheiden:
- wie gut kommt der IMC (Speichercontroller) der CPU mit mehreren Ranks klar
- wie "flink" sind die DDR5 ICs an sich

Prinzipiell verlierst du mit mehr als 1 Rank bei DDR5 einiges an Takt-Potential, aber die Timings kannst du relativ gleich straff fahren.
Um jetzt mal Zahlen aus dem Himmel zu greifen, "guten" DDR5 gibts mit 1 Rank (2x 16 GB) bei 7200c34 oder 2 Ranks (2x 32 GB) bei 6000c28, nur so als Beispiel.

Bei den ICs hast du aktuell nur 16 Gbit und 24 Gbit zu Auswahl, ergo maximal 24 GB für ein Single Rank Modul und 2 x 24 GB für ein Dual Channel, 1 Rank pro Channel, Kit.
Bei den 24 GB ICs gibt's aktuell meines Wissens jeweils 1 pro Hersteller:
- Samsung 24...
Hallo OldMan,

das müsste an der Anzahl liegen, je mehr Speicher Chips am IMC (Memory Controller in der CPU) hängen umso höher die Elektrische Last.
Da du ein X3D hast, sollte die CPU trotz weniger RAM Takt schneller sein als dein 5950X.
Daher würde ich mir darum kein Sorgen machen, wenn du 128GByte brauchst, gilt das Argument schneller nicht mehr, weil ohne läuft es nicht. ;)

Edit:
Das selbe gilt auch für die Speicher Dichte, also mehr GB pro Chip. Da gibt es dann mehr Hot-Spots, die beachtet werden müssen.
Einfaches Beispiel, du lässt die 128GB nur mit DDR5-4200 laufen und ziehst dann die Timings nach unten, dann wird es auch schneller. :)
 
Zuletzt bearbeitet :
Hallo @8j0ern,
mir geht es hier um das allgemeine Verständnis. Für meinen Anwendungsfall brauche ich soviel RAM wie möglich. Ich kann grds. auch mit etwas langsameren RAM leben, da der immer noch schneller ist als jedes Laufwerk bzw. NVme.
Mich hätte hier nur der technische Grund interessiert warum das so ist.
Aber trotzdem danke
 
Ja, Technisch brauchen zwei Glühbirnen immer noch Doppelt so viel wie eine.
Mehr kommt ja nicht von noch schneller und weniger. :)
 
Zwei Glühbirnen brauchen mehr Strom, OK. 4 Riegel RAM auch. Aber die zwei Glühbirnen brauchen nicht länger bis sie angehen und leuchte auch nicht dunkler nur weil es zwei sind 🥺
 
Gute Argumentation, lasse ich gelten.

Jetzt meine Frage wonach Definierst du Mehr ?

Hell und Dunkel in Bezug auf den Speicher Controller wäre 0 und 1.
 
Das mehr bezieht sich auf den Stromverbrauch, also mehr Watt. Das mit dem 0 und 1 ist schon richtig, aber die Controller sind doch dafür ausgelegt. Und es sollte doch, wenn man Mal die Latenz betrachtet egal sein wie groß, also wie viel Kapazität, die Chips haben. Wenn man Mal so schaut ist bei 32 GB eine Latenz von 30 fast Standard, bei den 48GB Riegeln muss man froh sein wenn man Mal in Richtung 36 kommt. Hier ist 40 eher der Normalfall. Von den Subtimings will gar nicht reden. Gleiches gilt auch für den Takt.
 
OK, jetzt holst wieder zu weit aus.

Neue CPU, gleicher RAM wie damals.

RAM hat welches Baujahr ?

CPU hat welches Baujahr ?

UEFI Version ist von welchem Datum ?

Henne Ei ? <- Das ist immer wieder wichtig.
 
RAM-Technik ist sehr komplex und mit den aktuellen Ryzen und DDR5 kenne ich mich nicht aus. Ich versuche aber doch ein paar Gründe zu beleuchten.

Der RAM-Controller ist in der CPU. Von dort gehen 2 Channel über das Mainboard zu den RAM-Sticks. Bei ein oder zwei Sticks leitet das Mainboard die Channels nur durch. Bei 4 Sticks muss das Mainboard die Channel auf die gerade aktiven Sticks umschalten. Hier begrenzt das Mainboard die Übertragungsrate zum RAM, da das umschalten jeweils etwas Zeit braucht.

Übertakter verwenden deshalb gerne Mainboards, die nur 2 Slots habe die möglichst nahe an der CPU angeordnet sind. Je kürzer die Leitungen, um so zuverlässiger und schneller funktioniert die Übertragung. Das ist der Grund, warum die maximalen Geschwindigkeiten meist nur mit einem einzelnen Stick direkt neben der CPU erreicht werden. Ausser dem Benchmarkrekord bringt das aber natürlich nichts, denn mit nur einem Stick ist die Übertragungsrate ja nur halb so schnell.

Bei den RAM-Chips auf dem Stick selbst dürfte die Verfügbarkeit von Chips mit höherer Speicherdichte eine Rolle spielen. Über die Jahre sind die RAM-Sticks ja immer gleich gross geblieben. Die einzelnen mögen in der Grösse etwas variieren, die Speichermenge ist aber laufend gestiegen. Darum braucht es für Sticks mit mehr Speicher Chips aus neueren Fertigungsverfahren. Das hat immer vor und Nachteile. Oft sind mit kleineren Strukturen höhere Geschwindigkeiten erreichbar und auch die Effizienz steigt oft. Damit verbunden sind aber immer auch zusätzliche Probleme die sich erst mit der Zeit mehr oder weniger gut beheben lassen. Kleinere Strukturen führen zu mehr Kriechströmen, also schneller zu Fehlern und zu grösseren Leistungsverlusten. Dazu braucht es oft neue Fertigungsverfahren, die die Herstellung teurer machen. Sehr viele Details aus der Produktion vernimmt man leider nicht, so dass es schwer zu sagen ist, was da noch alles bedeutend ist.

Die Qualität hergestellter Chips unterscheidet sich auch durch die Qualitätsunterschiede im Wafer auf dem die Chips gefertigt werden. Die Chips werden dann getestet und aussortiert. Für die schnellen RAMs können dann nur die besten verwendet werden, was man dann am Preis merkt. Somit ist es auch durch die erreichbare Qualität gegeben, wie viele schnelle, mittlere oder langsamere RAMs heraus kommen. Mit der Zeit werden die Verfahren optimiert und mehr Chips erreichen höhere Geschwindigkeiten.
 
Warum ist das bitte so?

Weil die alte 79xx Reihe für DDR5 Dual Rank Module mit 32 / 48 GB bei 4x Slots gar nicht bis > 3600 freigegeben ist. Da bist Du mit deinem 4200 gar nicht schlecht und besser als die garantierten 3600. Hat was mit Signalqualität und Dämpfung zu tun.

Entweder die neue 9xxx Reihe oder Epyc. Die schaffen 5800 auch mit 128 GB Modulen.
 
@Martin Gut und @hansdampf vielen Dank für die Erklärungen. Vieles davon leuchtet mir ein und ist sozusagen auch logisch. Vor allem das Problem wenn man mehr als 2 Riegel verwendet der Takt signifikant fällt. Das Problem haben ja auch "kleine" Speicherriegel grundsätzlich.
Das mit der Qualität der Chips ist ja auch kein Phänomen welches neu ist. Das hat man ja früher bei den CPUs auch schon so gemacht. Die guten teuer als vollwertig verkauft, die schlechten mit deaktivierten Features als Einsteigerklasse. Soweit so gut.

Aber liegt es tatsächlich an den neuen Fertigungsmethoden und den gestiegenen Kapazitäten, dass hier bei den Speicherbausteinen mit mehr Kapazität die Latenzen so weit nach oben gehen? Muss dann ja auch etwas mit dem Controller auf den Riegel zu tan haben, also dem SPD Hub,, oder? Das Problem existiert ja nicht nur bei AMD Systemen, gleiches gilt ja auch für INTEL Systeme. Wenn ich mir Heute RAM anschaue mit 16GB haben die Latenzen von 30-36-36-76 ca. Bei 96GB hat man so 32-39-39-102 wenn man sucht. Der Standard hier eher in Richtung 40-40-40-83 wobei die tRAS auch gern über 100 liegt. Die CAS mit 32 ist ja ok, aber die tRAS, welche für die Geschwindigkeit ja fast genauso wichtig ist ist wie die CAS ist aber schon im Schnitt so 20% höher.

Wie gesagt, mit den Fakten habe ich mich "abgefunden" und ich will auch nicht mein System beschleunigen. Ich möchte einfach verstehen warum das so ist.
 
OK, jetzt holst wieder zu weit aus.

Neue CPU, gleicher RAM wie damals.

RAM hat welches Baujahr ?

CPU hat welches Baujahr ?

UEFI Version ist von welchem Datum ?

Henne Ei ? <- Das ist immer wieder wichtig.
Das ist alles komplett neu, also aktuell. Aber wie im vorherigen Beitrag geschrieben. Es geht mir nicht darum mein System zu beschleunigen, ich möchte einfach verstehen warum das so ist.
 
Wurde parallel mal eine KI befragt? Ich habe es eben mit ChatGPT versucht...naja
 

Anhänge

  • Bild (neu).png
    Bild (neu).png
    123,7 KB · Aufrufe : 9
@Carcasse Das ist genau der Grund warum ich KI so liebe :ROFLMAO: :ROFLMAO: Aber dennoch, danke für den Versuch!
 
Das ist alles komplett neu, also aktuell. Aber wie im vorherigen Beitrag geschrieben. Es geht mir nicht darum mein System zu beschleunigen, ich möchte einfach verstehen warum das so ist.
Ok, versuche ich es mal so herum: Warum dauern große Daten länger zum Kopieren als kleine Dateien ?

SPD ist nur eine Tabelle für die Timings, das ist kein Controller an sich.
Meinst du evt. das on-DIE ECC?
Das ist auch wichtig, weil mit zunehmender Kapazität auch mehr Fehler passieren.

Daher ist für mich die Latenz des RAM keine Definition für Leistung ich nutze Lieber ECC RAM um Rechen Fehler zu vermeiden, zweimal rechnen kostet nicht nur Zeit sondern auch Energie. ;)
 
Daher ist für mich die Latenz des RAM keine Definition für Leistung ich nutze Lieber ECC RAM um Rechen Fehler zu vermeiden, zweimal rechnen kostet nicht nur Zeit sondern auch Energie.
ECC ist hier ja nicht das Problem, wobei natürlich das oD-ECC bei DDR 5 kein wirkliches ECC ist. Und das SPD, so habe ich es zumindest "erlesen" ist die Verbindung zwischen dem Speichercontroler der CPU und dem RAM: Zitat eines Speierherstellers: "DDR5 verwendet einen neuen Baustein, der das Serial Presence Detect (SPD) EEPROM mit zusätzlichen Hub-Funktionen integriert, den Zugriff auf den externen Controller verwaltet und die Speicherlast auf dem internen Bus von der externen entkoppelt."
Ich dachte auch immer das SPD von Speed kommt, ist aber nicht.
Dann sagst Du, warum große Daten länger dauern zum kopieren als kleine. Das ist die Sicht von den Daten heraus. Ein 2TB NVMe ist ja auch nicht zwingend schneller als eine 4 TB NVMe. Auch wenn der Vergleich etwas hinkt. Aber wenn ich nun 20 Instruktionen bei gleicher Taktrate auf einem RAM mit niedrigen Timings, also kleinem RAM, ausführe dann ist das eben schneller als wenn ich 20 Instruktionen auf einem RAM mit hohen Timings, also großen RAM, schreibe. Und das hängt an den Timings. Und genau dieser Grund interessiert mich warum die Timings bei großen RAM Riegeln höher sind als bei kleinen.
 
@skullbringer da Du hier ja immer die RAM Tests machst. Vielleicht kannst Du hier etwas dazu sagen?


Latenz = (2*CL)/Frequenz.

Wenn Deine Freuqenz höher wird muss auch dein CL, CAS etc. steigen. Sonst würde das bedeuten das die Latenz bzw. Zugriffszeit von DDR5 mit 6000 Mhz doppelt so kurz wäre wie mit DDR 4 und 3000 Mhz. Das ist aber nicht der Fall, die Latenzen bleiben gleich bzw. werden nur geringfügig besser. Anstatt 10 Nanosekunden, dann eben 9 Nanosekunden. Deshalb steigen mit jeder neuen DDR Technolgie die CL Werte.
 
Latenz = (2*CL)/Frequenz.

Wenn Deine Freuqenz höher wird muss auch dein CL, CAS etc. steigen. Sonst würde das bedeuten das die Latenz bzw. Zugriffszeit von DDR5 mit 6000 Mhz doppelt so kurz wäre wie mit DDR 4 und 3000 Mhz. Das ist aber nicht der Fall, die Latenzen bleiben gleich bzw. werden nur geringfügig besser. Anstatt 10 Nanosekunden, dann eben 9 Nanosekunden. Deshalb steigen mit jeder neuen DDR Technolgie die CL Werte.
Das ist grundsätzlich ok und auch logisch. Aber innerhalb einer Technologie: Warum sind die Latenzen bei 16GB oder 32GB Modulen signifikant niedriger als bei 48GB Modulen?
 
Das ist grundsätzlich ok und auch logisch. Aber innerhalb einer Technologie: Warum sind die Latenzen bei 16GB oder 32GB Modulen signifikant niedriger als bei 48GB Modulen?

Naja da wäre nur das Thema Dual Rank und Single Rank Module. 16 GB sind heute fast alles Single Rank. Bei DDR 4 waren 32 GB Module noch alle Dual Rank. Single Rank sind noch mal deutlich schneller.
 
Oben Unten