NVIDIA vs. AMD and workstation vs. consumer: Who has the edge in the AI graphics card benchmarks?

Urgestein

1,151 Kommentare 902 Likes

#1 May 23, 2024

Das war sehr umfangreich. Also mit einer 4070 Ti super ist man schon gut bedient und ich bereue es nach wie vor, dass ich Nvidia nicht schon 2015 ins Portfolio genommen habe. Dieses Unternehmen kennt gerade keine Grenzen.
Nachtrag:

View image at the forums

Antwort 2 Likes

letauch

Mitglied

12 Kommentare 9 Likes

#2 May 23, 2024

Ahoi,

an der Börse gilt wie immer: hinterher ist man immer schlauer.

Grüße
letauch

eastcoast_pete

Urgestein

1,772 Kommentare 1,107 Likes

#3 May 23, 2024

Ja, momentan ist Nvidia hier dominant, keine Frage. Da ja jetzt die viel beworbenen NPUs/AI ASICs auch ihren Einzug in Notebooks feiern (die Snapdragon X mit Windows-on-ARM sind ja gerade überall zu sehen), wär es auch spannend, diese SoCs mit (laut Microsoft) starken, dedizierten NPU Kernen durch einige der Test Parkours hier zu schicken, auch um die KI Leistung dieser SoCs einordnen zu können (gilt mE ebenso für Phoenix/Hawks). Und, zumindest theoretisch, sollten hier Anwendungen, die besonders auf schnelle Kommunikation zwischen CPU und GPU bzw NPU Kernen angewiesen sind, besonders profitieren.

Antwort 2 Likes

RazielNoir

Veteran

464 Kommentare 224 Likes

#4 May 23, 2024

Die RTX 4000 ADA SFF mit TensorRT ist ziemlich das effizienteste Modell, wenn ich den Overallscore richtig sehe. Auf Niveau einer 4070ti bzw. 7900XT bei 70w!

Urgestein

2,845 Kommentare 911 Likes

#5 May 23, 2024

View image at the forums

UL Procyon AI Computer Vision Benchmark

NNAPI-Leistung von Android-Geräten mit UL Procyon AI Computer Vision Benchmark testen und vergleichen

View image at the forums

benchmarks.ul.com

Sehr interessant, wie soll das Unabhängig Funktionieren, wenn der Tensor Code nur von einem Hardware Hersteller Supportet wird ?

Anders herum gefragt, warum sollte ich als Unabhängiger Coder auf Tensor Cores gehen ?

Davon mal ab, Bilder Generieren in 1024p ?

Warten wir besser auf die NPUs ;)

Igor Wallossek

10,664 Kommentare 20,093 Likes

#6 May 23, 2024

Warum wohl habe ich die NV-Karten wohl auch mit alternativem Code gemessen? Bei der Bildgenerierung gabs dann für NV alternativ Intels OpenVINO. Ich kenne keinen Benchmark, der mehr APIs unterstützt und vor allem in der Pro Version vom Tester auch gescriptet werden kann. Insofern ist Dein Einwurf etwas am Thema vorbei. Heute gings auch nur um Grafikkarten und keine NPUs. Das ist wieder ein anderes Thema und längst in Vorbereitung. Nur ist es so, dass nicht mal AMD irgendeinen vergleichbaren Absatz bietet.

Du arbeitest lokal, nicht auf einer Serverfarm. Und es sind viele, nicht nur eins. :D

Die werden gegen jede noch so kleine NV Karte mit Tensor Cores erst mal gehörig abstinken. Aber für einfache LM wirds schon reichen. Ich versuche gerade, passende Hardware zu beschaffen, aber fast alle mauern noch.

Urgestein

2,845 Kommentare 911 Likes

#7 May 23, 2024

Ich meinte jetzt nicht deine Vergleich hier, daher habe ich auch die Homepage des Benchmarks verlinkt.

Falls es doch noch Nvidia unabhängige Coder gibt: https://www.amd.com/en/products/sof... including open frameworks, models, and tools.

Urgestein

1,151 Kommentare 902 Likes

#8 May 23, 2024

Tensor Cores und Frame Generation. War da was? Solange AMD da nicht nachziehen kann, wird Nvidia immer davonziehen.

Igor Wallossek

10,664 Kommentare 20,093 Likes

#9 May 23, 2024

ROCm... Naja, da muss schon noch mehr kommen. AMDs Software bietet eine Reihe von Optimierungen für KI-Workloads, aber das wars dann auch schon.

Aktuell sind Microsofts Windows ML, Qualcomms SNPE, Intels OpenVINO, Apples Core ML und halt NVIDIAs TensorRT das Maß der Dinge.

Yumiko

Urgestein

633 Kommentare 312 Likes

#10 May 23, 2024

Ist das so?
Beispielsweise für den Preis einer 4090 bekommt man 3x 7900xt welche zusammen deutlich schneller sind nach obigen Benchmarks (KI Anwendungen sind massiv parallel).
Beim Verbrauch (je nach Stromkosten) kann sich das natürlich irgendwann drehen.

Igor Wallossek

10,664 Kommentare 20,093 Likes

#11 May 23, 2024

Je nach Anwendung. Wenn TensorRT genutzt werden kann, ist AMD mit RDNA3 fast komplett hilflos. Nicht alles lässt sich über veile Devices hin parallelisieren und dann braucht man immer noch ein performantes API. Da sehe ich meist ein Software-Problem bei AMD, zumindest im Desktop-Bereich.

Antwort 3 Likes

Urgestein

1,151 Kommentare 902 Likes

#12 May 23, 2024

Und ein performantes Netzteil für 3x 7900XT

RazielNoir

Veteran

464 Kommentare 224 Likes

#13 May 23, 2024

Oder die Passende Plattform

https://www.amd.com/en/developer/resources/ryzen-ai-software.html

Urgestein

2,845 Kommentare 911 Likes

#14 May 23, 2024

Da kommt auch mehr, aber nicht auf Basis von TensorRT ;)

https://www.amd.com/en/technologies/xdna.html

View image at the forums

ipat66

Urgestein

1,453 Kommentare 1,487 Likes

#15 May 23, 2024

Stand heute bekommt man eine 4090 für 1730 Euro.
Eine 7900XTX bekommt man für ab 950 Euro...
Das sind also eher knapp zwei 7900 XTX für den Preis einer 4090.
Edit: Bei den 7900 XT für 700 Euro wären wir bei 2100 Euro, bei 3 Stück

Zudem braucht es im KI-Produktivbereich nur eine 4070 TI Super, um die gleiche bzw. teils viel bessere Leistung im Vergleich zu einer 7900 XTX zu erreichen.
Eine 4070 TI Super bekommt man ab 850 Euro....
Also: 100 Euro gespart mit im Vergleich weniger Energieverbrauch .

Das erkenne ich zumindest aus Igor's Diagrammen... :)

Antwort 2 Likes

Urgestein

2,845 Kommentare 911 Likes

#16 May 23, 2024

Auf den Benchmark bezogen stimmt das auch.
Die Frage ist, welche Relevanz hat z.B. ein Mobile Benchmark auf einer 4070 TI ?

Kommt jetzt wieder: Liebling, ich habe die Kinder geschrumpft ?

Urgestein

1,151 Kommentare 902 Likes

#17 May 23, 2024

Ist auch mein Denkansatz. Da muss AMD bei der nächsten Generation noch ein, zwei Schippen drauflegen.

Urgestein

2,845 Kommentare 911 Likes

#18 May 23, 2024

Dann will ich dich sehen, wie du ein, zwei Geldbeutel mehr drauflegst. ;)

Urgestein

1,151 Kommentare 902 Likes

#19 May 23, 2024

Der Markt bestimmt den Preis. Siehe Nvidia. Soviele 4090 Besitzer gibbet nicht.