Frage RTX 3090 PC friert ein, sobald Last auf die GPU kommt

Spauni

Neuling
Mitglied seit
Aug 17, 2024
Beiträge
8
Bewertungspunkte
8
Punkte
2
Guten Tag,

ich melde mich, da meine 3090 meinen PC einfriert, sobald dort starke Last anliegt.

Erstmal eine kurze Übersicht, was überhaupt verbaut ist:
CPU: Ryzen 5800X3D
GPU: ASUS Strix RTX 3090
RAM: 32 GB RAM von G.Skill (3600MHz, 4x 8 GB)
PSU: BeQuiet Dark Power (1000w)
Mobo: Asus x570 E Gaming Wifi II
Systemplatte: Systemplatte ist eine Samsung 860 Evo
Datengrab: Seagate Barracuda (2TB)
Games: Samsung 980 NVME SSD und Samsung 970 NVME SSD
Programme: Crucial SATA SSD
OS: Windows 10
Kühlung: Custom Wakü mit CPU/Graka, 3 Radiatoren und 10 Lüfter

Das Problem trat bereits vor etwa einem Monat schon einmal auf. Damals hatte ich meine CPU im Verdacht, da laut Log Dateien wohl ein AMD Prozess abgeschmiert sein sollte (Link zum anderen Thread: https://www.igorslab.de/community/threads/ryzen-5800x3d-system-friert-komplett-ein.10197/). Ich konnte das Problem damals lösen, indem ich den Rechner einmal über Nacht komplett vom Strom getrennt habe. Danach lief der Rechner bis gestern völlig problemlos durch. Also etwa einen Monat komplett störungsfrei. Ich habe sogar Grafikbomben wie Black Myth Wukong komplett durchgespielt, ohne dass der Rechner irgendwie Stress gemacht hat. Falls ihr das Spiel nicht kennt: heftige Grafik, Pathtracing und weiß ich nicht was. Das waren eigentlich immer so 380W Dauerlast.

Seit gestern fangen die Probleme allerdings wieder ohne ersichtlichen Grund an. Vor zwei Tagen noch fröhlich Elden Ring gespielt und dann gestern ging in Elden Ring auf einmal gar nichts mehr. Sobald Last anliegt, friert das komplette System ein und ich muss den Rechner per Powertaste ausknipsen. Ich habe dann noch gestern den kompletten Rechner einmal zerlegt und die WLP an CPU und GPU neu aufgetragen und alle Kabel noch einmal neu verlegt. Leider hat das nichts gebracht und der Rechner schmiert immer noch ab, sobald die GPU Last abbekommt. Als Fehler in den Logdateien sind inzwischen diverse vorhanden. Einmal der bekannte AMD Prozess, der abgeschmiert ist(amdppm.sys). Neu hinzugekommen sind Abstürzmeldungen des HDAudioTreibers (HDAudBus.sys) und inzwischen auch Meldungen, dass der GPU Treiber abgeschmiert ist (nvlddmkm.sys)

Das Einfrieren lässt sich auch gezielt provozieren, durch z.B. OCCT Benchmarks. Dort ist direkt nach 3 Sekunden Schluss. Über den MSI Afterburner habe ich auch mal -500 auf den Takt und das Powertarget auf 70 % gestellt. Dann kann ich den 3D-Standard Test ohne Probleme oder Fehlermeldungen durchlaufen lassen. Der Fehler tritt also nur auf, wenn ich der GPU vollen Saft gebe.

Jetzt frage ich mich (bzw. hoffe ich) kann das auch ein defektes Netzteil sein? Oder hat mir meine 3090 noch einen Monat geschenkt, bevor sie sich jetzt endgültig von mir verabschieden möchte? Ich hatte noch nie so seltsame Fehlerbilder und kann mir ehrlich gesagt keinen Reim darauf machen. Vielleicht hatte jemand mal ähnliche Probleme oder schon mal Probleme mit kaputten PSUs? Gehört Rechner einfrieren lassen zum typischen Fehlerbild von kaputten PSUs oder mache ich mir da nur was vor und es ist wahrscheinlich die Grafikkarte? Lohnt es sich, im Falle eines GPU-Defekts die Karte zur Reparatur zu schicken? Ich hatte leider noch nie diese Art von Problem. Bei mir war sonst immer sofort alles komplett kaputt und nicht so "Halbkaputt" wie es jetzt ist.
Wäre nett, wenn jemand vielleicht mal seine Einschätzung zur Situation geben könnte und ob eventuell ähnliche Erfahrungen vorhanden sind (und was letztendlich die Ursache war).

Ich bedanke mich schon einmal im Voraus für eure Antworten.

LG Spauni
 
Hallo Spauni

Man hört leider immer wieder von solchen Fällen und selten ist es klar, woher der Fehler kommt. CPU, RAM, Mainboard und Grafikkarte arbeiten so eng zusammen, dass ein Fehler bei einer Komponente auch bei Fehlern bei einer anderen führen kann. Auch das Netzteil kann die Ursache sein. Wenn das Netzteil mit den Lastsprüngen von CPU und GPU nicht mit kommt, kann beispielsweise der RAM zeitweise zu wenig Strom bekommen und dadurch der PC abstürzen.

Dass man mit Last auf der Grafikkarte Abstürze provozieren kann und der Grafikkartentreiber abstürzt, sind Hinweise, dass die Grafikkarte nicht stabil läuft.

Hast du schon versucht das Problem durch Untervolten oder ein Powerlimit bei der Grafikkarte und der CPU zu entschärfen?

Meist hilft nur, den PC auf eine Minimalkonfiguration zu reduzieren und dann Bauteile zu tauschen bis keine Fehler mehr auftauchen oder Bauteile auch in einem anderen PC zu testen.
 
stürzt das Ding binnen weniger (einstelliger) Sekunden nach Last-Einsatz ab? Ist die Grafikkarte vernünftig abgestützt (ich rede von mechanischer Abstützung, jetzt abgesehen vom Logik-Absturz)?

Meine Sapphire "Nitro" r9 390 ist vermutlich ähnlich gestorben. Wie gesagt: eine Vermutung! Hatte mir damals nie Gedanken um eine mechanische Abstützung gemacht. Hatte im Gegensatz zu späteren Karten dieser Namensgebung aber auch einen abartig-billigen Aufbau samt Billig-Kühler(!) ab Werk. Lange Rede, kurzer Sinn: Schick das Ding in die Diagnose/Reparatur, so lange es noch "läuft". Gehe nicht über Start, gib nicht noch mehr Lehrgeld aus, als jetzt schon absehbar!
Ich sehe das Ding immer noch bei mindestens 600 Neubeschaffungs-Restwert/Ersatzwert. Wenn nicht mehr, da ja 24GiB an Bord sind. Da könnte sich eine 150..200 Euro Reparatur (bei einem unabhängigen Spezialisten) schon lohnen.
Vermutlich ist bei der Karte die eine oder andere Lötstelle angegriffen / gebrochen und/oder die Spannungswandlung in Teilen gestorben. NOCH scheint sie ja zumindest als Displayadapter zu funktionieren.
edit: (ich gehe daher mal von dem besten Fall aus: der "GPU-Chip lebt noch")
Möglicherweise ist bei der Demontage des Luftkühlers/Montage des Wasserkühlers etwas schief gelaufen, ohne daß es jetzt unbedingt Ungeschicklichkeit zuzuschreiben wäre - eine schlechte Lötqualität reicht da heutzutage ja bereits und die Dinger halten nicht mal mehr sorgsamsten Umgang aus.
 
Zuletzt bearbeitet :
Hast du schon versucht das Problem durch Untervolten oder ein Powerlimit bei der Grafikkarte und der CPU zu entschärfen?

Ja. Ich habe mit dem MSI Afterburner mal das Powertarget auf 70 % heruntergestellt und auch weniger Takt erlaubt (-500MHz). Danach zieht die Karte noch ~290W und läuft durch den Benchmark ohne Fehlermeldungen. Ich bin halt nur verwundert, dass das Problem erstmal für einen Monat verschwindet und dann wieder auftaucht. Vor allem, da ich das Problem vor einem Monat damit lösen konnte, den Rechner einmal komplett vom Strom zu nehmen. Daher meine Vermutung, dass es wohl eher am Netzteil liegt.

Meist hilft nur, den PC auf eine Minimalkonfiguration zu reduzieren und dann Bauteile zu tauschen bis keine Fehler mehr auftauchen oder Bauteile auch in einem anderen PC zu testen.
Ich habe leider keine andere GPU da, die so viel Last erzeugen kann. Andere CPU (3700X) habe ich schon getestet, sowie meinen 5800X3D durch den OCCN Benchmark gejagt. Ich werde wohl mal das Netzteil retournieren und gleichzeitig die GPU zur Reparatur schicken.

stürzt das Ding binnen weniger (einstelliger) Sekunden nach Last-Einsatz ab? Ist die Grafikkarte vernünftig abgestützt (ich rede von mechanischer Abstützung, jetzt abgesehen vom Logik-Absturz)?

Meine Sapphire "Nitro" r9 390 ist vermutlich ähnlich gestorben. Wie gesagt: eine Vermutung! Hatte mir damals nie Gedanken um eine mechanische Abstützung gemacht. Hatte im Gegensatz zu späteren Karten dieser Namensgebung aber auch einen abartig-billigen Aufbau samt Billig-Kühler(!) ab Werk. Lange Rede, kurzer Sinn: Schick das Ding in die Diagnose/Reparatur, so lange es noch "läuft". Gehe nicht über Start, gib nicht noch mehr Lehrgeld aus, als jetzt schon absehbar!
Ich sehe das Ding immer noch bei mindestens 600 Neubeschaffungs-Restwert/Ersatzwert. Wenn nicht mehr, da ja 24GiB an Bord sind. Da könnte sich eine 150..200 Euro Reparatur (bei einem unabhängigen Spezialisten) schon lohnen.
Vermutlich ist bei der Karte die eine oder andere Lötstelle angegriffen / gebrochen und/oder die Spannungswandlung in Teilen gestorben. NOCH scheint sie ja zumindest als Displayadapter zu funktionieren.
edit: (ich gehe daher mal von dem besten Fall aus: der "GPU-Chip lebt noch")
Möglicherweise ist bei der Demontage des Luftkühlers/Montage des Wasserkühlers etwas schief gelaufen, ohne daß es jetzt unbedingt Ungeschicklichkeit zuzuschreiben wäre - eine schlechte Lötqualität reicht da heutzutage ja bereits und die Dinger halten nicht mal mehr sorgsamsten Umgang aus.

Ich würde sagen, ja. Ich habe neben der Verschraubung am Case auch noch eine Halterung an der anderen Seite der GPU, damit die dort nicht herunterhängt.
Ist Krisfix immer noch das Maß aller Dinge, wenns um GPU Reparatur geht?
 
Ich hatte mal ein ähnliches Fehlerbild: Beim Start eines Spiels Blackscreen und eingefrorener PC. Hatte zuerst die GPU im Verdacht (stimmte quasi auch), aber die tatsächliche Ursache war das Netzteil. Das Dark Power ist ja modular - schon mal die Stromkabel (PCIE) gecheckt und umgesteckt? Kennst Du jemanden mit PC bei dem Du GPU oder Netzteil testen kannst? Ggf. gibt es vielleicht jemanden aus dem Forum, der in Deiner Nähe verfügbar ist. Reparaturen sind ja leider meist unverhältnismäßig teuer... :/
 
Hast du mal HWInfo laufen gehabt und deine Anwendung im Fenster?
Spannungsabfall, Temp usw....

Weil im Grunde kannst du nur ausschließen:
- Netzteil und Spannung
- Temp Grafikkarte
- PCie Slot
- Grafikkarte in anderen PC
Du hast die WLP der GPU gewechselt, war die Platine schwer vom Kühler zu trennen?

Weil wenn du WLP bei der CPU gewechselt hast würde ich erstmal andere Grafikkarte probieren, ob der Computer allgemein Fehlerfrei läuft.


Reball gibts auch:
 
Welches Netzteil ist das genau ?
Wie sieht die Stromverkabelung vom Netzteil zur Grafikkarte aus?
Gehen da drei einzelne Kabel zur Karte oder ist das ein Y-Kabel im Spiel? Anschlußvorgaben im Netzteilhandbuch beachtet?
Wie warm wird die Karte wenn die mit reduziertem Powertarget läuft? Normal und Hotspot Temp wie hoch
 
Ich hatte mal ein ähnliches Fehlerbild: Beim Start eines Spiels Blackscreen und eingefrorener PC. Hatte zuerst die GPU im Verdacht (stimmte quasi auch), aber die tatsächliche Ursache war das Netzteil. Das Dark Power ist ja modular - schon mal die Stromkabel (PCIE) gecheckt und umgesteckt? Kennst Du jemanden mit PC bei dem Du GPU oder Netzteil testen kannst? Ggf. gibt es vielleicht jemanden aus dem Forum, der in Deiner Nähe verfügbar ist. Reparaturen sind ja leider meist unverhältnismäßig teuer... :/
Ja, hab ich leider schon versucht. Brachte bedauerlicherweise nicht viel.

Morgen frage ich mal im Freundeskreis herum. Da gibts wohl noch bei irgendeinem meiner Kollegen eine 2080TI, die immer als Notfallkarte im Freundeskreis herumgereicht wird. Mal schauen wo die abgeblieben ist. Die Karte sollte auch ausreichen, um das Netzteil ein bisschen zu belasten.

Hast du mal HWInfo laufen gehabt und deine Anwendung im Fenster?
Spannungsabfall, Temp usw....

Weil im Grunde kannst du nur ausschließen:
- Netzteil und Spannung
- Temp Grafikkarte
- PCie Slot
- Grafikkarte in anderen PC
Du hast die WLP der GPU gewechselt, war die Platine schwer vom Kühler zu trennen?

Weil wenn du WLP bei der CPU gewechselt hast würde ich erstmal andere Grafikkarte probieren, ob der Computer allgemein Fehlerfrei läuft.
Spannungsabfälle konnte ich eigentlich nicht beobachten. Temps waren ebenfalls gut. 80°C Hotspottemperatur war so ziemlich das höchste, was ich gesehen habe.
Ich teste morgen/die Tage mal mit der 2080TI aus dem Freundeskreis. Das sollte ja eigentlich reichen.
Die WLP war beim auseinander bauen tatsächlich ziemlich schwer vom Kühler zu trennen. Könnte sein, dass sich dadurch die Kontakte gelöst haben oder irgendwo in der Platine, was kaputtgegangen ist.
Ich berichte dann, sobald ich die Karte getestet habe.

Welches Netzteil ist das genau ?
Wie sieht die Stromverkabelung vom Netzteil zur Grafikkarte aus?
Gehen da drei einzelne Kabel zur Karte oder ist das ein Y-Kabel im Spiel? Anschlußvorgaben im Netzteilhandbuch beachtet?
Wie warm wird die Karte wenn die mit reduziertem Powertarget läuft? Normal und Hotspot Temp wie hoch
Das ist ein DarkPower 12 (https://www.bequiet.com/de/powersupply/2151).
Die Graka ist mit jeweils drei einzelnen Kabel angeschlossen.
Hier die Temps nach ~10 Minuten Benchmark:
1726445165720.png
 
Zuletzt bearbeitet :
Oben Unten