Frage Ryzen 5800X3D - System friert komplett ein

Spauni

Neuling
Mitglied seit
Aug 17, 2024
Beiträge
5
Bewertungspunkte
6
Punkte
2
Guten Tag,

ich habe seit etwa zwei Wochen Probleme mit meinem Rechner. Der hängt sich, sobald Last auf das System kommt (in meinem Fall, wenn ich ein Spiel starte) nach wenigen Sekunden komplett auf. Sound ist noch hörbar, aber das Bild ist komplett eingefroren. Gelegentlich hängt sich der Sound allerdings mit auf und spielt das letzte Soundfitzelchen in Dauerschleife. Der Rechner lief jetzt etwa 1 1/2 Jahre ohne größere Probleme.

Erstmal eine kurze Übersicht, was überhaupt verbaut ist:
CPU: Ryzen 5800X3D
GPU: ASUS Strix RTX 3090
RAM: 32 GB RAM von G.Skill (3600MHz, 4x 8 GB)
PSU: BeQuiet Dark Power (1000w)
Mobo: Asus x570 E Gaming Wifi II
Systemplatte: Systemplatte ist eine Samsung 860 Evo
Datengrab: Seagate Barracuda (2TB)
Games: Samsung 980 NVME SSD und Samsung 970 NVME SSD
Programme: Crucial SATA SSD
OS: Windows 10
Kühlung: Custom Wakü mit CPU/Graka, 3 Radiatoren und 10 Lüfter

Ich bin schon seit ein paar Tagen am Herumgoogeln, was denn die Ursache für die Probleme sein könnte, nachdem ich eigentlich lange keine Probleme hatte.
Folgendes habe ich bereits probiert:
-Win10 neu installiert per USB-Stick/per Rücksetzung im Windows
-RAM Test per Windowsspeichertest
-D.O.C.P Ram Übertakung deaktiviert
-Bios auf die aktuelle Version aktualisiert
-Bios Einstellungen auf Standard zurückgesetzt
-Chipsatz Treiber installiert von der AMD Seite, ebenso den Treiber der auf der Asus HP für das Board angeboten wird
-Energieeinstellungen auf maximale Leistung gestellt
-Energieeinstellungen für den Prozessor für Min/Max auf jeweils 99 % gestellt (sollte laut Google wohl helfen)
-CMOS Resett
-Festplatten überprüft per CrystalDisk Info und per chkdsk cmd Befehl
-Grafikkartentreiber per DDU deinstalliert und dann neu heruntergeladen
-per sfc /scannow das System überprüft>Dabei wurden Fehler gefunden und repariert, der Rechner hängt sich allerdings trotzdem auf.
-Temperaturen überwacht. Die Grafikkarte kam dabei nicht über 65 °C und die CPU war bei etwa 75 °C als der Rechner sich aufgehängt hat (laut HWInfo)
-Gerätemanager auf markierte Geräte ohne Treiber überprüft, keine vorhanden.
-diverse Treiber per Driverbooster aktualisiert (ja, ich weiß, dass das generell ne dumme Idee ist, war eine reine Verzweiflungstat)
-Zuverlässigkeitsverlauf und Ereignisanzeige gecheckt

Leider brachte nichts davon die Abstürze dazu zu verschwinden

Ich habe ebenfalls die Absturzberichte mit dem Programm "whocrashed" ausgelesen. Ich hatte zunächst die Grafikkarte im Verdacht, laut dem Fehlerbericht ist allerdings ein CPU-Treiber abgeschmiert (siehe Screenshots).
1723931509119.png
Ich habe danach gegoogelt und dann auch ein paar der Vorschläge dort umgesetzt.
-den Start des Prozesses verhindert (per RegEdit eine 4 eingetragen, um den Start des Prozesses zu unterbinden)
-Virtualisierung im Bios deaktiviert
-Schnellstart im Bios deaktiviert

Außerdem findet man noch diverse Berichte darüber, dass Leute die Spannung der CPU, die RAM Timings und was weiß ich noch angepasst haben. Das habe ich nicht nachvollzogen, da ich mich schlicht nicht gut genug auskenne bzw. einige Lösungen halte ich doch für ziemlich riskant (Leute haben da ihre Spannung erhöht, was bei den X3D CPUs jetzt nicht so gut sein soll, so zumindest mein aktueller Wissensstand). Viele haben auch irgendwelche Werte eingetragen, die sie aus dem RyzenMaster ausgelesen haben und noch andere Sachen, die ich ehrlich gesagt überhaupt nicht kapiert habe.
Da ich noch Garantie habe, würde ich gerne erstmal darauf verzichten.

Seit heute, habe ich außerdem noch eine andere Meldung in den Absturzberichten:


neuer Bericht.PNG
Da scheint dann jetzt ein anderer Treiber abzuschmieren. Die Fehlercodes sind allerdings identisch. Ich würde daher mal davon ausgehen, dass auch hier ein CPU-Treiber abschmiert. Ich kann zu dem genannten Treiber allerdings nichts auf Google finden.
Die Tatsache, dass der Rechner 1 1/2 Jahre störungsfrei durchlief und jetzt rumzickt, lässt mich aktuell stark von einem Hardwareproblem bei der CPU ausgehen. Das Abstürzen lässt sich auch gezielt provozieren, indem ich Last auf die CPU gebe. Im Idle kann ich den Rechner weiterhin normal benutzen. Ich bin inzwischen allerdings schon so betriebsblind, dass ich gerne mal eure Meinung dazu hören würde.

Mein nächster Schritt wäre es jetzt, den Rechner einmal komplett zu zerlegen und die WLP mal zu erneuern und danach erneut zu testen. Danach würde ich mal testen, ob es mit meiner alten CPU (3700x) ebenfalls zu diesem Fehler kommt. Vorher wollte ich aber noch einmal nachfragen, ob eventuell noch jemand eine andere Idee hat. Ist jemandem bekannt, ob es noch eine softwareseitige Lösung gibt, die ich noch nicht ausprobiert habe (und die mich nicht meine Restgarantie kostet)? Ich wäre für jede Hilfe äußerst dankbar.

LG Spauni
 
Lösung
PCs und ihre Macken faszinieren einen immer wieder aufs neue.

Ich habe gestern den Rechner einmal komplett vom Strom getrennt und ihn die Nacht über mal komplett ohne Strom gelassen. Dann habe ich ihn heute normal gestartet, allerdings nur mit 16 GB RAM, also zwei ausgebauten Riegeln. Da lief der Rechner schon wieder völlig ohne Probleme. Elden Ring, Pioneers of Pagonia laufen ohne Probleme. Auch 3DMark Benchmarks und der Benchmark von Black Myth Wukong lief ohne Probleme. Ich habe dann die RAM Riegel wieder eingebaut, mit der festen Überzeugung, dass es wohl ein kaputter Ram Riegel ist oder dass ne Rambank wohl kaputt ist. Auch mit voller Bestückung läuft jetzt wieder alles problemlos.

Aktuell macht sich zarter Optimismus breit, dass...
CPU könnte einen weg haben oder ein Problem mit der Stromversorgung
Welches Darkpower ist das genau? Wie ist die Stromversorgung zur Grafikkarte verkabelt? Anschlußvorgaben im Netzteilhandbuch beachtet?
Sind die Laufwerke alle in Ordnung oder zeigt Crystal Diskinfo da irgendwo Probleme auf?
 
Welches Darkpower ist das genau?
Oh sorry, das ist das Dark Power 12 (https://www.bequiet.com/de/powersupply/2151). Ungefähr 2 Jahre als das Netzteil.

Wie ist die Stromversorgung zur Grafikkarte verkabelt?
Mit jeweils drei einzelnen PCIE Kabeln, die auch beim PSU mitgeliefert worden sind. Ich habe außerdem darauf geachtet, dass nicht alle Kabel der Grafikkarte über ein Rail laufen.

Anschlußvorgaben im Netzteilhandbuch beachtet?
Was genau meinst du damit? Ob alle Kabel in den richtigen Slot gesteckt worden sind? Falls du das meinst, dann ja. Darauf habe ich auch verstärkt geachtet.

Sind die Laufwerke alle in Ordnung oder zeigt Crystal Diskinfo da irgendwo Probleme auf?
Meine HDD hat den Zustand "Vorsicht".
1723948462975.png

Die Platte ist aber zu 95% der Zeit eigentlich nicht angeschlossen oder im Gerätemanager deaktiviert. Alle anderen Platten haben den Zustand "gut". Meinst du da könnte das Problem liegen? Deaktiviert im Gerätemanager sollte doch eigentlich ausreichen, oder?
Die Systemplatte sieht so aus:
1723948602464.png
 
Willkommen Spauni

Da hast du ja schon richtig viel ausprobiert, so dass man vieles nicht mehr erwähnen muss.

Mit der Neuinstallation von Windows, dem aktualisieren und Zurücksetzen des BIOS und neuen Treibern hast du schon alles gemacht, was man softwaremässig so machen kann. Mir fällt da nur noch PBO ein, was man im BIOS ausschalten könnte.

Auf jeden Fall liegt aber irgend ein Hardwareproblem, vermutlich bei einer zentralen Komponente (CPU, RAM, Mainboard) vor.

Das Netzteil kann man eigentlich ausschliessen. Wenn das Netzteil abschaltet (ob selbst oder durch das Mainboard), dann geht der PC ganz aus. Dann läuft auch kein Sound mehr weiter. Das Mainboard ist ja zumindest noch teilweise in Aktion. Der Soundchip hat noch Strom.

Die Fehlermeldungen deuten auf ein Problem bei der CPU hin. Um Hardwareprobleme einzugrenzen, muss man den PC auf eine Minimalkonfiguration reduzieren und dann Bauteile austauschen oder in einem anderen PC testen bis es stabil läuft.

Grafikkartenfehler sehen meist anders aus. Pixelfehler, Texturfehler, grüner Bildschirm, Neustart Grafikkartentreiber oder abschalten des Netzteils bei zu hohen Lastspitzen, .... das hast du alles nicht.

Die heikle Festplatte würde ich auf jeden Fall ausbauen. Es kann sein, dass Windows immer wieder versucht, diese zu erkennen und dann hängen bleibt. Auch alle anderen unnötigen Geräte hängt man besser ab.

Dann baust du nur einen RAM-Riegel in den Slot, der dafür im Handbuch angegeben ist. Riegel und Slot wechseln kann man probieren. Wenn das nicht hilft, bleibt nur die CPU (und das Mainboard) auszuwechseln um zu schauen ob es daran liegt.
 
Mein nächster Schritt wäre es jetzt, den Rechner einmal komplett zu zerlegen und die WLP mal zu erneuern und danach erneut zu testen. Danach würde ich mal testen, ob es mit meiner alten CPU (3700x) ebenfalls zu diesem Fehler kommt.
Ich würde zuerst mal mit der alten CPU gegentesten da diese ja noch vorhanden ist.
Tritt der Fehler allgemein unter Last auf oder nur bei einer bestimmten Anwendung?
 
Bei der 860Evo bitte den C7-Wert beobachten. Steigt der dann Kabel tauschen, vorerst nur prüfen ob da alles richtig sitzt.
Bei den beiden Samsung NVME bitte auf aktuelle Firmware prüfen - bei beiden Serien gibt es Ziegelstein-Firmwares.
 
Sind die RAMs in der Kompatibilitätsliste des MoBo?
Schau nach der BIOS Version, denn bei meinem 550 Gaming A waren die G.Skill mit der für den 5800X3D passenden Version nicht mehr kompatibel.
 
Zuletzt bearbeitet :
Mit der Neuinstallation von Windows, dem aktualisieren und Zurücksetzen des BIOS und neuen Treibern hast du schon alles gemacht, was man softwaremässig so machen kann. Mir fällt da nur noch PBO ein, was man im BIOS ausschalten könnte.
Werde ich mal ausprobieren.

Die heikle Festplatte würde ich auf jeden Fall ausbauen. Es kann sein, dass Windows immer wieder versucht, diese zu erkennen und dann hängen bleibt. Auch alle anderen unnötigen Geräte hängt man besser ab.
Alles klar. Ich klemme die Platte gleich mal ab und teste, ob das irgendwas bringt.
Aktuell ist nur Maus und Tastatur angeschlossen. Ansonsten ist alles abgezogen bzw. (Bluetooth) deaktiviert.
Dann baust du nur einen RAM-Riegel in den Slot, der dafür im Handbuch angegeben ist. Riegel und Slot wechseln kann man probieren. Wenn das nicht hilft, bleibt nur die CPU (und das Mainboard) auszuwechseln um zu schauen ob es daran liegt.
Ich habe noch die Vorgängerversion meines Boards hier. Werde ich dann auch mal testen und berichten, ob das irgendwas gebracht hat.




Ich würde zuerst mal mit der alten CPU gegentesten da diese ja noch vorhanden ist.
Tritt der Fehler allgemein unter Last auf oder nur bei einer bestimmten Anwendung?
Wird gemacht.
Der Fehler tritt allgemein unter Last auf. Bei Elden Ring ohne Mods komme ich, dank des 60FPS locks vermutlich, meist noch ins Spiel rein und kann ein paar Minuten herumrennen, bis der Rechner sich aufhängt. Bei Spielen ohne Lock, hängt sich der Rechner meist schon im Menü auf. Pioneers of Pagonia bringt den Rechner zum Beispiel sofort zum freezen.

Bei der 860Evo bitte den C7-Wert beobachten. Steigt der dann Kabel tauschen, vorerst nur prüfen ob da alles richtig sitzt.
Bei den beiden Samsung NVME bitte auf aktuelle Firmware prüfen - bei beiden Serien gibt es Ziegelstein-Firmwares.
Schreibe ich mir auch mit auf die To Do.

Sind die RAMs in der Kompatibilitätsliste des MoBo?
Schau nach der BIOS Version, denn bei meinem 550 Gaming A waren die G.Skill mit der für den 5800X3D passenden Version nicht mehr kompatibel.
Laut Asus Website:
1723988374765.png
Man hat dem Ram zumindest mit zwei Riegeln mit dem Board getestet.
Ich bin mir recht sicher, dass das eigentlich nichts mit Inkompatibilität zu tun haben kann. Der Rechner lief ja vorher noch mit einer älteren BIOS Version und vier verbauten Riegeln problemlos mehr als ein Jahr lang durch. Ich teste den Rechner mal nur mit zwei Riegeln und gucke, ob das eventuell etwas bringt. Zwei Riegel auszubauen, ist ja zum Glück kein großer Akt.

Ich werde morgen mal eure Vorschläge umsetzen und berichte dann, ob ich eine Lösung gefunden habe.

LG Spauni
 
Da du noch ein Board und eine CPU zur Verfügung hast, hast du optimale Möglichkeiten einfach mit wechseln durch zu probieren. Da sich der Fehler mit Games zuverlässig reproduzieren lässt, siehst du auch schnell ob es hilft. Viel lästiger sind Fehler, die nur alle paar Tage zufällig mal auftauchen.
 
Wenn der Fehler nur auftritt, wenn du ein Spiel startest, hätte ich grundsätzlich auch die Grafikkarte in Verdacht. Der Arbeitsspeicher ist natürlich auch gern mal ein Problem, und 4 Riegel sind grundsätzlich schwieriger zu betreiben wie nur zwei. Allerdings gehts da auch um Bänke, und deine 8er Riegel haben da wohl.. sowieso egal, Safe test wäre hierfür ohne XMP/EXPO bzw Asus DOCP deaktivieren und nur mit 2 Riegeln. Aber erst wenn ein entsprechendes Tool auf Fehler hinweist.

Aber grundsätzlich, wenn du Cinebench laufen lässt, kommt es dann zum Freeze? Oder nur wenn die GPU etwas tun soll?

Ich habe mal eine 1080 Ti wiederbelebt, da ging auch nix sobald 3D-Last aufkam, also ein Spiel gestartet wurde. War das Silikon aus den Pads ausgelaufen und überall auf der Platine zu finden. Außerdem die WLP eingetrocknet, aber das Silikonöl war wohl eher das Problem.

Um das zu verifizieren bräuchtest du natürlich eine andere GPU, irgendwas, das ein Bild anzeigt. Und ob Mainboard, RAM und CPU keinen Altersschwachsinn entwickelt haben, um das zu testen kannst du Cinebench. Prime95, etc. nutzen.
 
Nur so als Tip!
Bei BQ braucht man nicht für jeden Anschluss ein eigenes Kabel nehmen, da BQ keine Y Kabel hat!
Jeder PCIe 8+2 ist direkt mit dem Netzteil verbunden.
Erkennst du schon dran das ja an PCIe 1 und 3 eine Rail angeschlossen und an PCIe 2 beide Rail vorhanden sind, die BQ Kabel haben netzteilseitig deshalb auch 12 Pin und nicht nur 8! Es langen also bei dir die Anschlüsse an PCIe 1 und 3 zu nutzen um beide Rail zuverlässig zu verwenden.
 
Laut Asus Website:
Anhang anzeigen 34318
Man hat dem Ram zumindest mit zwei Riegeln mit dem Board getestet.
Ich bin mir recht sicher, dass das eigentlich nichts mit Inkompatibilität zu tun haben kann. Der Rechner lief ja vorher noch mit einer älteren BIOS Version und vier verbauten Riegeln problemlos mehr als ein Jahr lang durch. Ich teste den Rechner mal nur mit zwei Riegeln und gucke, ob das eventuell etwas bringt. Zwei Riegel auszubauen, ist ja zum Glück kein großer Akt.

Ich werde morgen mal eure Vorschläge umsetzen und berichte dann, ob ich eine Lösung gefunden habe.

LG Spauni
Mach das unbedingt. Bei mir lief das ebenfalls problemlos und nach einem BIOS-Update waren die Riegel plötzlich aus der Kompatibilitätsliste verschwunden (hat ein bisschen gedauert, bis ich das gecheckt habe). Hab die dann mit welchen von der aktualisierten Liste ersetzt > lief wieder problemlos.
 
PCs und ihre Macken faszinieren einen immer wieder aufs neue.

Ich habe gestern den Rechner einmal komplett vom Strom getrennt und ihn die Nacht über mal komplett ohne Strom gelassen. Dann habe ich ihn heute normal gestartet, allerdings nur mit 16 GB RAM, also zwei ausgebauten Riegeln. Da lief der Rechner schon wieder völlig ohne Probleme. Elden Ring, Pioneers of Pagonia laufen ohne Probleme. Auch 3DMark Benchmarks und der Benchmark von Black Myth Wukong lief ohne Probleme. Ich habe dann die RAM Riegel wieder eingebaut, mit der festen Überzeugung, dass es wohl ein kaputter Ram Riegel ist oder dass ne Rambank wohl kaputt ist. Auch mit voller Bestückung läuft jetzt wieder alles problemlos.

Aktuell macht sich zarter Optimismus breit, dass die Krise wohl überstanden ist. Ich knechte den Rechner jetzt noch ein, zwei Stunden mit Benchmarks und gucke, ob wirklich alles in Ordnung ist.
Eine Erklärung kommt mir bisher nicht in den Sinn, außer das es wohl mal wieder so 'nen typischer Asus Board Bug sein könnte? Die Version 1 des E Gaming Boards hatte auch schon so seltsame Macken, vielleicht ist das jetzt der neuste Bug aus dem Hause Asus? Ist aktuell die beste Erklärung, die mir einfällt. Ich werde wohl auch noch mal die Verkabelung des Netzteils überprüfen. Vielleicht finde ich da ja was. Scheinbar musste man den Rechner wohl nur eine ganze Nacht vom Strom trennen und nicht so ~10 Minuten wie ichs vorher gemacht habe.

Ich teste mal weiter und beobachte, ob der Rechner wieder irgendwie anfängt zu spinnen oder ob es jetzt gut ist und gebe dann hier nochmal eine Rückmeldung. Ich bedanke mich auf jeden Fall schon mal für die Hilfe.
 
Lösung
Kontaktprobleme ist auch so eine Bitch.
Ich hatte schon mehrere PCs mit zum Teil kompletten Ausfall-Erscheinungen, alles zerlegt und extern vom Gehäuse einen fliegenden Aufbau. Vorher 0,nix (also kein Lebenszeichen) und alles neben Gehäuse zum Test aufgebaut, ging die Mühle ähm PC dann wieder.
Alles wieder eingebaut und das Ding läuft, finde da mal den Fehler.... :eek:
Bei AMD ist eine Bestückung mit 4 RAM-Riegel (auch wenn die SR sind) immer problematischer.
Sieht man auch in der Liste der Board-Hersteller, einige Kits laufen nur mit 2 RAMs
 
Ihr habt aus irgendeinem Grund die Mechanische Logik Verstanden: Re-seat and Re-torqued.

Elektrischer Kontakt oder einfach verformt im 3D Koordinaten System.
 
Das verlinkte Dark Power 12, 1000 Watt hat 4 Anschlüsse, je 2 an Rail 3 und Rail 4. Es liegen 4 Y-Kabel bei damit man die angegebenen 8 Stück 6/8-Pin versorgen kann.
Das sind eben KEINE Y Kabel! Bei BQ sind alle Anschlüsse direkt mit dem Netzteil verbunden! Bei den üblichen Y Kabel zweigt das 2te PCIe 6+2 Pin vom ersten ab. Sieht man auch, wie oben erwähnt, daran das die Stecker am Netzeil mehr als 8 Pinne haben.
Das das 4 PCIe Stecker am NT hat ist mir entgangen, da hab ich das wohl mit dem 850W verwechselt.
 
Oben Unten