Geteiltes Leid ist halbes Leid? Mitnichten, denn heute beginnt der einzigartige Launch-Marathon, wo sich NVIDIA und AMD quasi gegenseitig die Show stehlen wollen! Und wäre das alles noch nicht genug, gibt es heute nur die GeForce RTX 4060 Ti als Founders Edition bzw. MSRP-Karte ohne OC. Und wenn AMD dann morgen die Radeon RX 7600 auspackt, sollen die OC-Karten der GeForce RTX 4060 Ti den Launch der Radeon RX 7600 stören, deren Boardpartner-Karten dann erst übermorgen gelauncht werden.
Drei Tage mit sich überlappenden Releases sind allerdings nichts, was Kunden und Tester gleichermaßen erfreut. Im Gegenteil, denn dann ist die Informations- und Reizüberflutung perfekt. Das mit der ausufernden Arbeit an solchen Artikeln sowieso. Genau deshalb werde ich die GeForce RTX 4060 Ti heute als MSRP-Karte und OC-Modell gleichermaßen vorstellen, denn dieses Hintertürchen hat uns NVIDIA ja Gott sei Dank offengelassen. Da die Performance-Steigerung der OC-Karten schon bei der RTX 4070 vorhersehbar und vor allem einheitlich messbar war, spare ich mir den überflüssigen Zweiteiler morgen und packe bereits heute alles in diesen einen Artikel. Den Rest kann man ja übertragen und die AIC-Karten als Hands-On zeigen. Die Einzeltests mache ich dann nach der Computex.
Und was macht der Kunde? Für eine UVP von 439 Euro lässt NVIDIA heute die untere Mitteklasse von der Leine und hofft, damit neue Kunden zu gewinnen und AMD zu ärgern, die in diesem Segment aktuell keine neuen Karten anbieten können. Im Endeffekt misst man sich, das kann ich schon einmal spoilern, leistungsmäßig eher mit einer GeForce RTX 3070 FE 8 GB in Full-HD. Das werde ich am Schluss noch preislich einordnen, will es aber trotzdem einmal voranstellen. Die ältere GeForce RTX 3060 Ti wird in jedem Fall deklassiert, nicht nur an der Steckdose. Wie das genau aussieht und wo AMDs ältere 6000er Karten noch mitmischen können, wird der heutige Test natürlich zeigen.
Ich habe die NVIDIA GeForce RTX 4060 Ti FE mit der Palit RTX 4060 Ti Dual zuvor Performance-technisch verglichen: Der Unterschied liegt wieder nur bei bzw. sogar unter einem Prozent, was als Messungenauigkeit und Chiplotterie durchgeht, wobei die Palit-Karte den etwas schlechteren Kühler als die FE besitzt. Deshalb werde ich heute für die Performance etwas anderes tun, als alle MSRP-Karten buchhalterisch korrekt gegenüberzustellen. Gleich lange Balken interessieren ja eh keinen. Die Einzelkarten werde ich dann später noch nach der Computex Schritt für Schritt im Detail vorstellen, denn es gibt durchaus Unterschiede bei der technischen Umsetzung, den Kühler und der Optik. Doch alles zu seiner Zeit. Es wird also noch mehrere Einzelreviews geben, keine Angst. Nur für heute war das einfach alles zu viel.
Ich teste stattdessen heute die NVIDIA GeForce RTX 4060 Ti FE 8GB im Auslieferungszustand, wobei sie stellvertretend für die gesamte 160-Watt-Klasse der sogenannten MSRP-Karten antritt, denn die Performance ist identisch. Und dazu gibt es natürlich als Topping den Durchlauf mit den 175 Watt als maximalem Power Limit, wo ich den Takt noch einmal um 210 MHz angehoben habe. Dass man damit im Bereich der morgen erst zu launchenden OC-Karten vorstößt, ist ja nicht meine Schuld. Die Karte kann es und deshalb zeige ich es auch. Und ohne verbotenerweise etwas zu spoilern: mehr als 165 Watt habe ich trotzdem nie gebraucht, auch nicht am Taktlimit. Denn irgendwann limitiert immer die Spannung, egal wie hoch man das Power-Limit setzt.
Wichtiges Vorwort
Natürlich gibt es wie gewohnt viele Benchmarks, den umfassenden Teardown, eine sehr aufwändige Platinen- und Kühler-Analyse mit einigem Reverse-Engineering, sowie die Analyse der Leistungsaufnahme und der Lastspitzen samt passender Netzteilempfehlung. Da ich weiß, dass viele Kollegen auch noch einmal die ganzen technischen Details samt Theorie wiederholen, die ja bereits vorab schon in diversen Häppchen dargereicht wurden, spare ich mir das heute im ganz großen Umfang und verweise nur noch einmal kurz auf die bereits bekannten Daten. Dazu gehört auch NVIDIAs Erklärung zum Cache und warum dies den Speicherausbau entlasten soll. Aber Ihr wollt ja heute echten Zahlen sehen und kein PR-Feuerwerk. Die Specs kommen natürlich gleich noch. Unser Chip auf dem Package mit der Nummer 266 auf der FE stammt übrigens aus der Kalenderwoche 45 in 2022.
Der AD 106 und die neue Ada-Architektur
Der 190 mm² große Chip der NVIDIA GeForce RTX 4070 wird ebenfalls im TSMC 4N Prozess gefertigt und verfügt über 22.9 Milliarden Transistoren. Der AD106-351 verfügt noch über drei Graphic Processing Clusters (GPC) und 34 neue Streaming-Multiprozessoren (SM) mit 4352 CUDA Cores, deren Performance und Energieeffizienz im Vergleich zu Ampere deutlich gestiegen ist. Dazu kommen 136 Tensor-Kerne der 4. Generation und Optical Flow, was transformative KI-Technologien, einschließlich NVIDIA DLSS und dem neuen Bildraten-Vervielfacher NVIDIA DLSS 3 ermöglicht.
Die 34 RT-Kerne der 3. Generation bieten bis zu 2-fache Raytracing-Leistung, Shader Execution Reordering (SER) verbessert die Raytracing-Operationen zudem um das Doppelte. Dazu kommen noch insgesamt 17 Texture Processing Clusters (TPC), 136 Texture Units (TU) und 48 ROPs. Der L2-Cache ist insgesamt 32768 KB groß und die Karte nutzt, wie auch die GeForce RTX 4070 Ti, die bekannten 8 GB GDDR6 mit MHz Takt an einem eher schmalen 128-bit Interface, was einer Datenrate von 18 Gbps und einer Bandbreite von 288 GB/s entspricht. Der AD106-351 der GeForce RTX 4060 Ti bietet in der Summe nur noch einen NVDEC (Decoder) statt zwei und einen einzelnen NVENC (Encoder). Der AV1 Encoder soll bis zu 40% effizienter als H.264 arbeiten.
Die RTX 4060 Ti bietet eine Rechenleistung von bis zu 22 Teraflops bei einer Genauigkeit von 32 Bit im einfachen Genauigkeitsbereich (FP32). Ein weiterer wichtiger Aspekt der RTX 4060 Ti ist der Energieverbrauch. Mit einer Boardpower von 160 W (16 GB Variante 165 Watt) und einem durchschnittlichen Energieverbrauch von etwa 140 W beim Spielen ist diese Grafikkarte energieeffizient und dennoch leistungsfähig.
Die bereits genannten 18 Gbps GDDR6 128-Bit-Speicher wirken etwas spärlich, wenn man die Bandbreiten von 488 GB/s oder 608 GB/s der älteren GeForce RTX 3060 Ti berücksichtigt. Hier sollte allerdings der bei Ada Lovelace im Vergleich zu Ampere deutlich erweiterte L2-Cache beachtet werden: Während die GeForce RTX 3060 Ti noch über 4 MB L2-Cache verfügt, verfügt die RTX 4060 Ti über einen 32 MB großen L2-Cache. Dieser reduziert den Datenverkehr über den Speicherbus und ermöglicht so die effizienteste Kombination aus Leistung und Energieeffizienz für Spiele in 1080p-Auflösung.
Wie man im Bild unten sehen kann, finden alle Berechnungen in den Kernen statt. Diese müssen daher schnell und effizient auf Daten zugreifen können, um den Anforderungen moderner Spiele gerecht zu werden. Hier kommt der L1-Datencache der GPU ins Spiel. Jedes Streaming-Multiprozessor (SM) verfügt über einen extrem schnellen L1-Datencache direkt neben seinen Verarbeitungskernen, wodurch der L1 der erste Speicherbereich ist, in dem die GPU nach Informationen sucht. Aufgrund der räumlichen Nähe zum Kern kann der L1-Cache allerdings nicht besonders groß sein und er fällt mit 4352 KB auch dementsprechend aus.
Verglichen mit einer 128-Bit-Ampere-GPU bietet die L2-Cache-Architektur von Ada somit eine 16-fache Kapazitätssteigerung. Darüber hinaus wurde die Bandbreite des L2-Caches in den Ada-GPUs im Vergleich zu vorherigen GPUs erheblich erhöht. Dies ermöglicht eine schnellstmögliche Datenübertragung zwischen den Kernen und dem L2-Cache. Der größere L2-Cache von Ada führt zu deutlich mehr Cache-Treffern im L2-Bereich und reduziert gleichzeitig den Datenverkehr über den Speicherbus. Ob das am Ende funktioniert, werden wir gleich noch sehen.
Die Karte setzt nach wie vor auf ein PCIe Gen. 4 Interface und nur beim externen Stromanschluss mit dem 12VHPWR-Anschluss (12+4 Pin) auf ein Element der PCIe Gen. 5 Spezifikation. Die TGP liegt bei 160 (175) Watt und kann, je nach Boardpartner, auch weiter angehoben werden (was eher sinnlos ist, weil die Spannung irgendwann sowieso limitiert).
- 1 - Einführung, technische Daten und Technologie
- 2 - Die GeForce RTX 4060 Ti im Detail
- 3 - Test System im igor'sLAB MIFCOM-PC
- 4 - Teardown: PCB und Komponenten
- 5 - Gaming Performance FHD (1920 x 1080)
- 6 - Gaming-Performance WQHD (2560 x 1440)
- 7 - Gaming Performance DLSS vs. DLSS3 vs. FSR
- 8 - Latenzen und DLSS 3.0
- 9 - Details: Leistungsaufnahme und Lastverteilung
- 10 - Lastspitzen, Kappung und Netzteilempfehlung
- 11 - Temperaturen, Taktraten und Infrarot-Analyse
- 12 - Lüfterkurven und Lautstärke
- 13 - Zusammenfassung und Fazit
418 Antworten
Kommentar
Lade neue Kommentare
Urgestein
Moderator
1
Urgestein
1
Urgestein
Mitglied
Urgestein
Veteran
1
Veteran
Veteran
Neuling
Mitglied
Mitglied
Urgestein
Mitglied
1
1
Alle Kommentare lesen unter igor´sLAB Community →