Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
Ich habe unter https://www.amd.com/de/support/kb/warranty-information/rma-form ein RMA eingereicht am 19.12.2020 um 19:01. (Ich habe den Prozessor gewerblich gekauft).
@Neutral: Kannst du uns bitte auf dem Laufenden halten, wie das mit AMD klappt?

@all: Ich hab mir ja nun alle drei CPUs über Mindfactory bestellt. Die Seriennummern waren alle recht nah beieinander. Meint ihr, es könnte Sinn machen, bei einem anderen Händler (z.B Arlt) zu bestellen, in der Hoffnung, dass man eine CPU aus einer anderen Charge und damit vielleicht ohne Defekt erhält?
 
@Amtswalter
Ja, ich werde hier alles aktualisieren. Bisher habe ich sofort die 2 typischen E-Mails bekommen (Supportkonto angelegt und zusätzlich die Support-Ticket-Nummer).

Ich will noch mal betonen:
Ich kann den CPU fast wie vorgesehen nutzen, ich muss "nur" Volt und Mhz-Limit im Ryzen Master manuell einstellen. Dann gibt es keine No-Load-Abstürze. Aufgrund der erwartenden Kosten und Nutzen der CPU benötige ich allerdings gute Peak-Performance und Stromsparfunktionen, da er gewerblich zum Einsatz kommt.
Mit etwa 25% weniger Single-Core und 5% weniger Multi-Core-Leistung kann ich also den CPU komplett ohne Abstürze betreiben. Der AMD performt extrem gut. Schade ist eben nur dieser Bug/Defekt/whatever.

Gekauft bei Mindfactory am 16.12.2020. Zusammenhänge zwischen solchen fatalen Bugs und Chargen kann ich mir ehrlich gesagt fast nicht vorstellen. Wenn dieses exakte Problem mehr als nur ein paar sehr wenige Einzelfälle betreffen würde, dann wäre das ein so extremer Fehler, dass es schon mit gigantischer Presse starke Auswirkungen haben müsste. Die Händler haben definitiv kein Interesse an tausenden Supportanfragen und AMD ebenso.
 
Es wäre ja echt schön, wenn das nur ein paar Einzelfälle wären. Aber dafür hab ich schon zu viel über das Problem gelesen. Es scheint doch viele Leute zu betreffen.
Allerdings kommt es mir komisch vor, dass bei mir schon zwei CPUs Probleme machten. Die dritte CPU muss sich gerade beweisen...
 
Hallo an alle,

wie einige hier habe ich ebenfalls zufällige Reboots mit WHEA FehlerID 18:

Schwerwiegender Hardwarefehler.
Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 2


Mein System:
5950x,
3090 FE
Crosshair Viii Hero
G Skill 2 x 16 GB 3200
DPP 850 Watt
1 TB 970 & 980, Crucial 2 TB MX500

Der Crash äußert sich dadurch, dass das System einfach neustartet und danach weiterläuft als wäre nichts gewesen.
Das ganze scheint bei mir auch lastunabhängig zu sein, bisher 2 Crashs beide waren eher unter idle.

Ich wollte dabei mal fragen, in welchen Zeitabständen bei euch ein Reboot auftritt?
Das merkwürdige ist, dass mein System einige Tage durchhält und nicht direkt nach ein paar Minuten/Stunden schon crasht. Bei vielen von euch scheint das System ja schon innerhalb eines Tages mehrmals zu crashen oder?

Habe mein System ziemlich genau 1 Woche in Betrieb und bisher hatte ich 2x einen Reboot. Durch den Abstand der Reboots kann ich deswegen erst nach einigen Tagen sagen, ob ein Fix etwas gebracht hat oder nicht.

Software:
Windows, Chipset, GPU-Treiber aktuell - Keine weiteren großartigen Programme die im Hintergrund laufen.
Bios Version 2702 mit DOCP sonst ist alles stock, also kein PBO.

Vor dem Wechsel auf Crosshair Viii und 5950x liefen die restlichen Komponenten unter Sockel 1151 stabil.
Im R15 habe ich ca. 4300 Punkte und R25 25100 Punkte. Temperatur etwa 65 °C.

Gerade läuft das System komplett stock d.h Ram läuft mit 2133Mhz. Mal sehen...

Ich frage mich halt ob das ganze ein Hardwaredefekt ist sprich CPU oder doch eher softwareseitig bedingt ist z.b. Bios.
 
Zuletzt bearbeitet :
Nun ja wenn die Poster hier recht haben und deren Probleme mit einer anderen cpu schließlich behoben waren - spricht ja doch auch zumindest dafür, dass die Hardware involviert ist. Mich würde an dieser Stelle dann auch noch interessieren, wieviele Leute denn hier defekte cpus von mindfactory haben.



@Amtswalter
Wenn dieses exakte Problem mehr als nur ein paar sehr wenige Einzelfälle betreffen würde, dann wäre das ein so extremer Fehler, dass es schon mit gigantischer Presse starke Auswirkungen haben müsste. Die Händler haben definitiv kein Interesse an tausenden Supportanfragen und AMD ebenso.
Zumindest vorstellen kann ich mir es durchaus auch wenn es nicht das offensichtliche high probability Szenario ist.

Enthusiasten sind generell sicher erstmal sehr viel länger bereit, den Fehler "bei sich" zu suchen. Auch hilft da sicher, dass das ganze gar nicht so einfach zu reproduzieren scheint. Da ist es doch viel einfacher, die Schuld herumzureichen als bei z.b. den "Problemen" der 3080s. Die Pressesamples werden zumindest größtenteils auch einer gewissen Auslese unterlegen haben.

Auch weiss man nicht, wieviele cpus denn tatsächlich im Umlauf sind und wieviele Leute vielleicht auch einfach damit leben, ab und zu mal einen Crash zu haben denn auch meine war zumindest zu dem Stand zu bewegen, sehr selten zu crashen aber zu absolut unakzeptablen Konditionen. Außerdem findet man doch meiner Meinung nach erstaunlich viele Benutzer Beiträge zu dem Problem für ein Produkt der Preisklasse und Verbreitung..





Das in irgendeinem Beitrag auf irgendeiner Seite vielleicht sogar hier erwähnte ccx deaktivieren hat z.B. bei mir dazu geführt, dass der Fehler nicht mehr wirklich aufgetreten ist wobei es natürlich aufgrund der Unregelmäßigkeit schwer abzuschätzen ist. Selbstverständlich keine akzeptable Lösung.

Auch core performance boost abschalten hat für eine Verringerung der Frequenz der Abstürze gereicht, es gab dennoch einen nach knappen sechs Stunden. Ebenfalls natürlich nicht akzeptabel aber immerhin schon mal besser als mit Default settings und mit etwas „
Glück“ alle 15 Minuten.

Da das ganze schwer zu reproduzieren ist habe ich nicht jeden einzelnen Lösungsvorschlag; den ich gelesen habe getestet, aber ich habe noch an diversen Spannungseinstellungen herumgemacht ohne wesentlichen Erfolg und ich insgesamt schon weit mehr gemacht als noch annehmbar ist.



Testsystem:

gigabyte x570 master rev1.0 und gigabyte x570 elite, diverse bios versionen die alle innerhalb von unter einer Stunde mit default settings whea Abstürze hatten.

Sonstige Hardware:

2080s und 1070;

750w Seasonic tx; 1600 Corsair axi;

Mischung aus diversen ssds oder mal m2 Laufwerken;

32gb b die Samsung G skill oder Corsair micron e.



Sobald ich auf den 3900x wechsle ist wieder alles völlig in Ordnung unabhängig der bios version oder sonstigen Einstellungen. Also die cpu wird auf jeden Fall reklamiert ich hoffe das klappt.
 
Zuletzt bearbeitet :
Software:
Windows, Chipset, GPU-Treiber aktuell - Keine weiteren großartigen Programme die im Hintergrund laufen.
Bios Version 2702 mit DOCP sonst ist alles stock, also kein PBO.

Ich frage mich halt ob das ganze ein Hardwaredefekt ist sprich CPU oder doch eher softwareseitig bedingt ist z.b. Bios.
Da hast du das gleiche Board wie ich. Hat es einen Grund, warum du nicht das aktuelle BIOS Version 3003 nutzt?

Die gleiche Frage stelle ich mir auch. Doch momentan deutet viel darauf hin, dass es ein Hardwaredefekt ist.

Ansonsten freue dich, dass der Fehler nur so selten bei dir auftritt. Einen festen Rhythmus gibt es bei mir nicht. Aber teilweise ist es sogar drei oder vier Mal auf 2 Stunden.
 
Nun ja wenn die Poster hier recht haben und deren Probleme mit einer anderen cpu schließlich behoben waren - spricht ja doch auch zumindest dafür, dass die Hardware involviert ist. Mich würde an dieser Stelle dann auch noch interessieren, wieviele Leute denn hier defekte cpus von mindfactory haben.
Bei mir läuft der dritte von Mindfactory.
 
@alle
Ich habe mal den Tausch des Prozessors als direkte Fehlerlösung hevorgehoben. Ebenfalls haben ja nun auch andere schon berichtet das ein Tausch den Fehler behoben hat. Im Fall von @Amtswalter muss man wohl davon ausgehen das wieder ein defekter kam.

-> Mein neu getauschter 5950X läuft immernoch, und läuft und läuft...

Solltet ihr anderer Meinung sein, lasst es ich wissen
Dann entferne ich die Lösung wieder
 
Der Tausch ist momentan wohl die einzige Lösungsmöglichkeit. Sollte nun auch die dritte CPU fehlerhaft sein, bestelle ich mal woanders. Ich hoffe, morgen schon mehr zu wissen.
 
Ich bin nach wie vor froh, dass ich noch einen 3900X im Rechner habe. Das wird nach den vielen Fehlermeldungen bezüglich der Ryzen 5000-Reihe auch so bleiben. Nun kann ich gelassen der Grafikkartenaufrüstung nächstes Jahr entgegenblicken.
 
@Amtswalter
Ja, ich werde hier alles aktualisieren. Bisher habe ich sofort die 2 typischen E-Mails bekommen (Supportkonto angelegt und zusätzlich die Support-Ticket-Nummer).

Ich will noch mal betonen:
Ich kann den CPU fast wie vorgesehen nutzen, ich muss "nur" Volt und Mhz-Limit im Ryzen Master manuell einstellen. Dann gibt es keine No-Load-Abstürze. Aufgrund der erwartenden Kosten und Nutzen der CPU benötige ich allerdings gute Peak-Performance und Stromsparfunktionen, da er gewerblich zum Einsatz kommt.
Mit etwa 25% weniger Single-Core und 5% weniger Multi-Core-Leistung kann ich also den CPU komplett ohne Abstürze betreiben. Der AMD performt extrem gut. Schade ist eben nur dieser Bug/Defekt/whatever.

Gekauft bei Mindfactory am 16.12.2020. Zusammenhänge zwischen solchen fatalen Bugs und Chargen kann ich mir ehrlich gesagt fast nicht vorstellen. Wenn dieses exakte Problem mehr als nur ein paar sehr wenige Einzelfälle betreffen würde, dann wäre das ein so extremer Fehler, dass es schon mit gigantischer Presse starke Auswirkungen haben müsste. Die Händler haben definitiv kein Interesse an tausenden Supportanfragen und AMD ebenso.
Was passiert denn wenn du die CPU und die Soc Spannung über Offset ,+, und einmal nur die Spannung um ein anhebst?
Da wenig Zeit bin ich gerade bei LLC von CPU und Soc von Auto auf Regulär beim ASUS was bei MSI z.b. Mod 4 ist.
 
Hey Casi030, kannst Du mir das etwas genauer beschreiben, also an welcher Stelle und was genau zu verstellen wäre?
Im Ryzen Master im "Erweiterte Ansicht" Modus?

Übrigens kann ich scheinbar frei übertakten (ohne Abstürze), auch costum je Kern, ich könnte sogar sehr nah an das vorgesehene Ergebnis von AMD kommen. Es existieren irgendwie nur Abstürze ohne Last wenn das "Standard"-Profil aktiviert ist im Ryzen Master!?! Ich teste das gerade, was mir nicht bewusst war, ist, dass die Stromsparfunktionen trotz des manuellen Clock-Setzen aktiviert bleiben. (Beim Schreiben dieses Textes ist der CPU auf 411mhz, Maximum sind 3600mhz).

Wenn das so^ ist, dann ist es um so merkwürdiger. Dann kann ich ja einfach versuchen die vorgesehenen Werte zu erreichen oder leicht zu übertreffen und der Fehler ist weg. Stromsparend (und v.a. leise) bleibt der CPU (bzw. Lüfter) so ja dennoch.

Kann mir jemand der den Fehler hat bestätigen, wie es ist, wenn alles von Hand eingestellt ist? Ist dieser Fehler mit "keine Last, stürzt ab" dann auch bei Euch weg?
 
Hey Neutral.
Hatte ich hier schon mal was zu geschrieben.

Einfach beide so ändern,nur halt nicht minus sondern plus zum Testen und den kleinsten Wert bei der Spannung,nicht wie bei mir 100mV weniger.Wobei man das später auch Testen kann.


Ich Teste aber gerade LLC,beide auf kleinster Stufe.Die Spannungen sind bei mir noch auf Auto.
 
Hallo zusammen :)

Hab das selbe Problem....

Erst mit einen 5900X und nun mit meinen 2 Tage alten 5950X.
Es nervt nur noch. Vorallendingen nervt es mich das man nichts
darüber liest und es von AMD und den Herstellern totgeschwiegen wird.
Das ganze sind auch keine "Einzelfälle" mehr.
Gebt mal "Ryzen WHEA Error" ein bei Google ;)

Mein alter 3900XT lief mit dem gleichen Setup stabil.

Ich kann 3 Std. OCCT laufen lassen, 20 x CB R20 und nichts passiert.
Läuft nichts oder surfe ich ein wenig, dann plötzlich neustart ohne das sich
das reproduzieren lässt.
Selbst auf Stock Setting (Bios defaults) stürzt die Kiste ab......
Ich finde es eh seltsam, das manche das Problem mit irgendwelchen Einstellungen
in den Griff bekommen wollen. Das ganze MUSS mindestens @ Stock Setting laufen.
Ein Armutszeugniss für AMD !


Asus Crosshair VIII Bios 3003
2 x 16 GB G.Skill 3600 mhz Neo Serie (Ryzen 5000 certified)
Asus Strix 3080 OC
Asus Thor 1200 Watt
Asus Riuyin 360
 
@alle
Ich habe mal den Tausch des Prozessors als direkte Fehlerlösung hevorgehoben. Ebenfalls haben ja nun auch andere schon berichtet das ein Tausch den Fehler behoben hat. Im Fall von @Amtswalter muss man wohl davon ausgehen das wieder ein defekter kam.
-> Mein neu getauschter 5950X läuft immernoch, und läuft und läuft...
Solltet ihr anderer Meinung sein, lasst es ich wissen
Dann entferne ich die Lösung wieder
Also mir scheint, dass deine Lösung zumindest funktioniert hat.

Finde es auch irgendwo schon befremdlich, dass das Thema gar nicht angerührt wird.
 
Seit dem Umbau auf den Dritten 5950X gestern hatte ich keine Abstürze mehr. Selbst Minecraft, welches vorher recht zuverlässig einen Absturz provoziert hat, lief gerade ohne Probleme. Drückt mir die Daumen, dass es dabei bleibt!
 
Ich kann mir nicht vorstellen das soviele CPUs einen Fehler haben.
Gestern ist er bei mir 2 mal innerhalb von 30 Minuten abgestürzt und heute
noch kein mal (Rechner läuft seit 10 Uhr).
 
Ich kann mir nicht vorstellen das soviele CPUs einen Fehler haben.
Gestern ist er bei mir 2 mal innerhalb von 30 Minuten abgestürzt und heute
noch kein mal (Rechner läuft seit 10 Uhr).
Ich konnte es mir auch nicht vorstellen. Aber was soll es sonst sein? Man kann die gesamte Hardware tauschen und der Fehler bleibt. Tauscht man die CPU, ist der Fehler weg.
Und wenn es nur eine Sache des BIOS oder des Chipsatztreibers wäre, hätte sich AMD sicher schon längst zu Wort gemeldet. Außerdem müsste es dann wirklich alle 5950X betreffen, was ja offensichtlich nicht der Fall ist.
 
Seit dem Umbau auf den Dritten 5950X gestern hatte ich keine Abstürze mehr. Selbst Minecraft, welches vorher recht zuverlässig einen Absturz provoziert hat, lief gerade ohne Probleme. Drückt mir die Daumen, dass es dabei bleibt!
Der war auch von Mindfactory wenn ich das richtig verstanden habe? Na ich drücke dir auf jeden Fall die Daumen und hoffe, dass das bei mir ebenfalls gut ablaufen wird.

Woran auch immer es letztenlich liegen mag - wenn die hardware nicht irgendwo involviert ist wundert es mich doch wieder, dass nicht noch mehr Leute diese Probleme haben und was für Lösungen zumindest zur Abmilderung der Probleme dienen.

Es geht ja auch bei mir und anderen wenn man mal so rumsucht im Internet ja nicht darum, dass deren 5950x keine 2ghz if machen sondern um Instabilitäten mit den default Einstellungen oder extrem konservativen Einstellungen. Auch die sonstigen Komponenten die man so in den Fällen sieht sind jetzt keine Exoten. Oft sind es sogar nur cpu upgrades und das System hat vorher bereits völlig einwandfrei funktioniert. Auf der anderen Seite gibt es ja auch reichlich Nutzer, bei denen die cpu auch völlig fein bei 1900if läuft bei ansonsten ähnlichen Konfigurationen.
 
Status
Nicht offen für weitere Antworten.
Oben Unten