Frage Zufällige Abstürze in Windows mit Verdacht auf defekte CPU

Thesmo

Mitglied
Mitglied seit
Feb 18, 2021
Beiträge
33
Bewertungspunkte
6
Punkte
8
Liebe Community,



Ich habe seit einigen Monaten zufällige Abstürze und bin mir unsicher, an was es letztlich liegt. Deshalb wollte ich hier mal Nachfragen!

Hardware:

Ryzen 5 2600 mit Tower-Kühler (meist mit OC, für Testzwecke aber Stock)

Sapphire Nitro+ Radeon RX Vega 64 mit Riser-Kabel angeschlossen (Stock)

Samsung Evo 970 m.2 SSD 500GB

MSI X470 Pro Carbon

Corsair Vengeance 3200Mhz Cl16 2x8GB (Steckt passend für Dualrank)

Be quiet Straight Power 11 750W vollmodular (Für GPU zwei verschiedene Rails)

Windows 10 Pro 64-Bit



Verlauf der Abstürze:

Von einer auf die andere Sekunde gehen beide Bildschirme aus bzw. sie bekommen kein Signal mehr und wechseln dann in den Standby-Modus. Ca. 5 Sekunden später geht das Licht der USB-Geräte (Maus, Tastatur) aus. Auf meinem Mainboard leuchtet dann die CPU-Debug-LED auf, die Lüfter drehen sich normal weiter und das Logo auf der Grafikkarte leuchtet auch noch. Dieser Zustand bleibt dann solange erhalten, bis ich den Rechner mit langem Druck auf die START-Taste ausschalte oder einfach den Stecker ziehe.

Die Abstürze können jederzeit im normalen Desktop-Betrieb, beim Gaming oder vermehrt bei Aufnahmen/Streams mit OBS auftreten (Software Encoder!). Es kann sein, dass eine Woche lang kein einziges Problem auftaucht und an anderen Tagen innerhalb einer Stunde 5 mal. Es steht auch außer Kernel-Power 41 nichts in der Ereignisanzeige. Um die Abstürze zu Erzwingen, habe ich die CPU+RAM und GPU viele Stunden lang belastet, jedoch (meist) ohne ein Problem festzustellen. Der PC wird nicht in einem Regulären Gehäuse betrieben, sondern auf einer Art Benchtabel, sodass das PSU nicht mit dem Gehäuse verbunden ist.



Versuche das Problem zu lösen:

Ich habe Windows neu installiert, aktueller Grafik-Treiber, aktuelle Bios-Version (hab zum Test auch mal eine ältere aufgespielt, leider keine Wirkung)

Die CPU wurde aus dem Sockel genommen (keine umgebogenen Pins o.Ä.) und mit neuer Wärmeleitpaste wieder eingebaut

Es wurden verschiedene Steckdosen ausprobiert und Stecker aus und wieder eingesteckt, auch vom Netzteil

An die CPU wurden 2 oder nur 1 8 Pin-Stecker angesteckt





Nachdem keine Einträge in der Ereignisanzeige zu sehen sind, es keine Einträge in der Radeon Software über Fehler gibt und die EZ DEBUG LED für die CPU leuchtet (laut MSI: CPU wird nicht erkannt oder ist defekt) würde ich von einem Hardware Defekt ausgehen. Hat jemand eine Idee an was es liegen könnte? Deuten die Probleme mit großer Wahrscheinlichkeit auf die CPU hin oder könnte es auch leicht an einem fehlerhaften Mainboard, PSU oder RAM liegen? Hat jemand vielleicht dieselben oder ähnliche Probleme mit Ryzen oder dem Mainboard?

Die Hardware wurde noch nicht ausgetauscht, ist mit der jetzigen Marktsituation auch ungünstig und bevor ich voreilig etwas austausche würde ich mir gerne noch andere Meinungen zum Thema anhören.



Ich würde mich über Antworten freuen! 😊



MFG



Thesmo



Nachtrag: Beim Schreiben des Beitrags gab es wieder einen Absturz. Diesmal gab es für 1 Sekunde „Brrrrrr“, dann hat er sich aber selbst neugestartet und es gab einen Eintrag im Log. Dieser Fehler kam bis jetzt nur selten:

WHEA-Logger ID 18

Schwerwiegender Hardwarefehler.



Gemeldet von Komponente: Prozessorkern

Fehlerquelle: Machine Check Exception

Fehlertyp: Cache Hierarchy Error

Prozessor-APIC-ID: 12 (der Fehler kam mehrmals mit anderer APIC-ID)
 

Anhänge

  • DEBUGLED.JPEG
    DEBUGLED.JPEG
    857,4 KB · Aufrufe : 2
Lösung
Hallo,

um das Thema als abgeschlossen zu markieren, schreibe ich hier mal meine Ergebnisse aus den letzten Wochen nieder.



Nachdem ich das Problem durch das Neuaufsetzen von Windows nicht gelöst bekam, habe ich angefangen einzelne Komponenten auszutauschen. Dabei kam Folgendes raus:

  • An der CPU liegt es sehr wahrscheinlich nicht, diese wurde ausgetauscht und selbes Problem (Abstürze) ist aufgetreten.
  • Beim RAM ist es das Gleiche.
  • Alle m.2 SSDs wurden aus dem Rechner entfernt und Windows lief von einer über einen SATA 6Gb-Port angeschlossenen 2,5‘‘ SSD, trotzdem Abstürze.
  • Es wurde ein neues Mainboard und eine CPU bestellt und eingebaut, ebenso Abstürze/Startschwierigkeiten.
  • Das Netzteil wurde getauscht, trotzdem...
Netzteil in der Gold oder Platinum Version ?
Welche Strombuchsen am Netzteil benutzt?
-> Bei Gold müssen es PCIe1+3 sein
Mal ohne Riserkabel probiert? Billige Kabel haben schon zu den seltsamsten Fehlern geführt
 
Hallo Thesmo

Leider kann es an allem liegen. Der Fehler 41 wird protokolliert, wenn der PC ausgeht ohne dass Windows den Fehler untersuchen und protokollieren konnte. Beim nächsten Start sieht Windows dann, dass es nicht richtig beendet wurde und notier der Fehler 41.

Das kann passieren, wenn das Netzteil wegen Überlastung ausgeht. Es kann aber auch von instabilem RAM, der CPU oder dem Board ausgehen. Dazu kann eine so starke Grafikkarte wie die Vega 64 die etwa 300 Watt verbraucht so hohe Spitzenlasten erzeugen, dass das Netzteil abschaltet.

Das Riserkabel würde ich auch weg lassen um diese Fehlerquelle auszuschalten. Dann würde ich die Grafikkarte undervolten um die Spitzenlasten zu reduzieren. Wenn das nicht ausreicht würde ich ein stärkeres Netzteil testen.
 
Netzteil in der Gold oder Platinum Version ?
Welche Strombuchsen am Netzteil benutzt?
-> Bei Gold müssen es PCIe1+3 sein
Mal ohne Riserkabel probiert? Billige Kabel haben schon zu den seltsamsten Fehlern geführt
Es ist das Netzteil in der Gold-Variante und es sind PCIe 1 und 3 belegt. Das Riserkabel zu entfernen ist leider ein etwas größerer Aufwand. Aber ich werde das in Angriff nehmen, wenn sich keine anderen Möglichkeiten bieten.

Hallo Thesmo

Leider kann es an allem liegen. Der Fehler 41 wird protokolliert, wenn der PC ausgeht ohne dass Windows den Fehler untersuchen und protokollieren konnte. Beim nächsten Start sieht Windows dann, dass es nicht richtig beendet wurde und notier der Fehler 41.

Das kann passieren, wenn das Netzteil wegen Überlastung ausgeht. Es kann aber auch von instabilem RAM, der CPU oder dem Board ausgehen. Dazu kann eine so starke Grafikkarte wie die Vega 64 die etwa 300 Watt verbraucht so hohe Spitzenlasten erzeugen, dass das Netzteil abschaltet.

Das Riserkabel würde ich auch weg lassen um diese Fehlerquelle auszuschalten. Dann würde ich die Grafikkarte undervolten um die Spitzenlasten zu reduzieren. Wenn das nicht ausreicht würde ich ein stärkeres Netzteil testen.
Hallo,

Würden die Lüfter noch Laufen und die Grafikkarte leuchten, wenn das Netzteil ausgeht? RAM hatte ich mit memtest ca. 4 Stunden lang Checken lassen ohne Fehler zu finden, deshalb gehe ich mal nicht von einem Fehler dort aus. Es ist aber natürlich alles möglich ☹.

Schon seit etlichen Radeon Treiber Updates ist die Karte Stock auf 210 Watt limitiert und läuft damit ziemlich gut und sparsam. Zudem passieren die Abstürze meist ohne irgendeiner Last auf der Grafikkarte (OBS, Surfen, etc.). Ich werde sie aber trotzdem mal undervolten und schauen ob sich etwas ändert.

Dazu kommt noch die leuchtende Status LED auf dem Mainboard. Dieser Fakt ist für mich wirklich irritierend, aber wahrscheinlich hänge ich mich nur zu sehr daran auf.
 
Ich würde zuerst ohne das Riserkabel testen. Habe schon mehrfach von Abstürzen durch Riserkabel gelesen.
 
Ist das Gehäuse mit den korrekten Abstandhaltern bestückt und das Mainboard hat keinen Kontakt zur Rückseite des Gehäuses?

Welcher Tower Kühler ists? Korrektes Installationskit verwendet und die Schrauben nicht zu fest angezogen? Evtl. mal ne viertel Umdrehung lösen.
 
Wenn ich mir das nochmals durchlese, deutet alles auf die CPU hin. Die Mainboardlampe CPU leuchtet. Der WHEA-Error kommt auch durch CPU-Probleme. Kurz gesagt: Das Mainboard stoppt weil es sieht dass die CPU nicht mehr stabil läuft.

Strom ist ja noch da. Die anderen Komponenten dürften auch noch funktionieren. Aber ohne CPU läuft natürlich nichts mehr.

Ich habe bei Intel ein Tool zur Überprüfung der CPU gefunden:
 
Sicher, dass das bei dem Ryzen hilft?
@Thesmo: hast du HWInfo installiert? Da gab es Probleme mit den neuen 6xxxer von AMD, aber seit der Toyotawerbung ist nicht unmöglich, also: falls es installiert ist kicke das mal.
 
Ist das Gehäuse mit den korrekten Abstandhaltern bestückt und das Mainboard hat keinen Kontakt zur Rückseite des Gehäuses?

Welcher Tower Kühler ists? Korrektes Installationskit verwendet und die Schrauben nicht zu fest angezogen? Evtl. mal ne viertel Umdrehung lösen.
Das Mainboard hat keinen Kontakt zum Gehäuse. Es ist der Alpenföhn Brocken 3 nach Anleitung montiert.
Die Schrauben waren aber recht fest und ich habe sie nun jetzt etwas gelockert.

Sicher, dass das bei dem Ryzen hilft?
@Thesmo: hast du HWInfo installiert? Da gab es Probleme mit den neuen 6xxxer von AMD, aber seit der Toyotawerbung ist nicht unmöglich, also: falls es installiert ist kicke das mal.
Ich hatte tatsächlich HWinfo installiert und habe es nun deinstalliert.
 

Update zur Frage „Zufällige Abstürze in Windows mit Verdacht auf defekte CPU“



Ich hatte die Möglichkeit Komponenten zu tauschen/auszutauschen, um meine Fehlerquelle ausfindig zu machen. Zuerst habe ich die CPU mit einem 3700x getauscht -meine CPU wurde zur Gegenprobe in einen anderen PC eingebaut- bei mir ist es wieder abgestürzt, beim anderen PC nicht. Das gleiche Spiel mit dem RAM. Danach habe ich mir ein anderes Netzteil (Be quiet! Straight Power 11 650W Platinum) ausgeliehen, mit welchem das System (bis jetzt zumindest) 3 Tage lang inkl. Stresstests, OBS, etc. stabil läuft.

Ich hatte dazwischen auch mal testweise das andere Netzteil angeschlossen und diesmal schon beim ersten Starten, bevor der Rechner überhaupt hochfährt, Neustarts. Als er dann endlich hochgefahren war konnte man sehen, dass der RAM (Die XMP-Einstellung war im BIOS noch aktiv) mit nur 2133 Mhz lief. Das war wirklich faszinierend.

Beim Wechsel auf das Be quiet! Straight Power 11 650W Platinum gab es diese Probleme nicht.

Es liegt also wahrscheinlich an einem fehlerhaften Netzteil und ich werde mich nach einem Neuen umschauen müssen.
 
Ich bin überzeugt davon, dass es in solchen Fällen regelmäßiog entweder an der CPU oder am Arbeitsspeicher liegt.
Das ist halt immer das Thema, wenn man die Hardware an die (OC) Grenze knüppelt. Da sucht man sich dann einen Wolf an was es gelegen hat. Auch wenn es hier das Netzteil gewesen zu sein scheint.
Ich weiß schon warum ich von der Drecks Overclockerei die Finger lasse. Das ist mir das Risiko für die Langzeitstabilität einfach nicht wert.
 
Als er dann endlich hochgefahren war konnte man sehen, dass der RAM (Die XMP-Einstellung war im BIOS noch aktiv) mit nur 2133 Mhz lief.
Wenn das BIOS feststellt, dass der RAM nicht stabil läuft, setzt es die Einstellungen auf den Standard zurück und startet so. Das ist absichtlich so gemacht, da man sonst mit zu hohen Einstellungen nicht mehr in BIOS kommen würde um den Takt anzupassen.
 
Wenn das BIOS feststellt, dass der RAM nicht stabil läuft, setzt es die Einstellungen auf den Standard zurück und startet so. Das ist absichtlich so gemacht, da man sonst mit zu hohen Einstellungen nicht mehr in BIOS kommen würde um den Takt anzupassen.
das Kann auch passieren, wenn der PC öfters neustartet. Kann also auch nen Netzteil auslösen
 

Update zur Frage „Zufällige Abstürze in Windows mit Verdacht auf defekte CPU“


Leider treten die Abstürze, nach ca. 3 Tagen fehlerfreier Benutzung, auch mit dem „neuen“ Netzteil auf. Wenn es anscheinend nicht am Netzteil, an der CPU, am RAM oder am Riserkabel/GPU liegt, bleibt nur noch das Mainboard übrig. Oder ist auch ein Schaden an meiner M.2 SSD möglich, welcher auf diese Art von Abstürzen schließen lässt?

Ich werde mir jetzt wohl erstmal ein neues Board aussuchen/bestellen und es damit testen.
 
ausschließen würd ich es nicht, aber wahrscheinlicher ist das Mainboard, meiner Meinung nach.
 
Welches neue Netzteil hast Du denn jetzt drin?
 
Oder ist auch ein Schaden an meiner M.2 SSD möglich, welcher auf diese Art von Abstürzen schließen lässt?
Das würde mich sehr wundern, wenn die SSD so etwas verursachen würde. Das gäbe eher eine Fehlermeldung von Windows. Es muss schon etwas des "lebensnotwendigen" sein (RAM, Board, CPU, Netzteil).
 
Ich hatte beim Einbau an einem Mainboard mal was "auf Masse", da hatte sich eine Schaube zwischen Montageblech und Mainboards, also quasi hinter dem Mainboard verkeilt. Das ist ausgeschlossen ?
 
Oben Unten