De GPU’s uit de Blackwell RTX 50-serie markeren het einde van een wachttijd van twee jaar sinds de lancering van de GPU’s uit de Ada Lovelace RTX 40-serie eind 2022. Nvidia heeft aangekondigd dat de komende kaarten uit de GeForce RTX 50-serie tijdens de CES 2025-keynote zijn gearriveerd, met specificaties en prijzen en zelfs een prestatievoorbeeld. Er is een grote claim. Nieuwe technologieën zoals DLSS 4 spelen een sleutelrol in deze claims. Omdat het een nieuw halo-onderdeel is, vervangt de RTX 5090 de RTX 4090 met meer geheugen. Verwerk meer heeft meer functies en meer macht hebben Nog niet beschikbaar Maar er gebeurt veel dat de moeite waard is om te analyseren voordat de kaart wordt vrijgegeven.
Zal de RTX 5090 een van de beste grafische kaarten zijn als hij op de markt komt? Als je met ‘beste’ ‘snelste’ bedoelt, dan lijdt het weinig twijfel dat hij zijn voorganger zal overtreffen. Zal het twee keer zo snel zijn? Het hangt ervan af hoe je prestaties wilt meten. Maar dat geeft veel vertrouwen in AI-technieken die anders zijn dan traditionele weergave. Laten we eens kijken naar de specificaties en functies die we kennen om te bespreken hoe de nieuwe en oude koning onder de GPU’s eruit zal zien.
grafische kaart | RTX5090 | RTX4090 |
---|---|---|
architectuur | GB202 | 102 n.Chr |
Proces knooppunt | TSMC 4NP | TSMC 4N |
Transistoren (miljarden) | 92 | 76,3 |
Vormgrootte (mm^2) | 744 | 608,4 |
SM | 170 | 128 |
GPU-shaders | 21760 | 16384 |
Tensor kern | 680 | 512 |
RT-as | 170 | 128 |
Boost-klok (MHz) | 2407 | 1977 |
VRAM-snelheid (Gbps) | 28 | 21 |
Veeram (GB) | 32 | 24 |
VRAM-busbreedte | 512 | 384 |
L2-cache | 128? | 72 |
Render-uitvoereenheid | 240? | 176 |
Textuurtoewijzingseenheid | 680 | 512 |
TFLOPS FP32 (boost) | 104,8 | 82,6 |
TFLOPS FP16 (INT8 TOP) | 1676? (3352) | 661 (1321) |
Bandbreedte (GB/s) | 1792 | 1008 |
TBP (Watt) | 575 | 450 |
Lanceringsdatum | januari 2025 | Okt 2022 |
Lanceringsprijs | 1.999 dollar | 1.599 dollar |
Laten we het eerst over de ruwe specificaties hebben. De RTX 5090 heeft 170 Blackwell Streaming Multiprocessors (SM) vergeleken met 128 SM in de 4090. Dat zijn 33% meer GPU-kernen en meer CUDA-kernen, tensorkernen, RT-kernen, textuureenheden enz rechtstreeks gekoppeld aan het aantal kleine en middelgrote bedrijven, dus in totaal een stijging van 33%.
Kloksnelheid speelt ook een rol, en de 4090 heeft in vergelijking een boostklok van 2520 MHz. (afhankelijk van berekening en Officiële specificaties van Nvidia) 2407 MHz boostklok betekent dat de 5090 voor onbewerkte verwerking ‘slechts’ een verbetering van 27% heeft ten opzichte van de 4090. Ervan uitgaande dat er echter geen andere architectonische verschillen bestaan, is dit vrijwel zeker geen goede veronderstelling.
Capaciteit, geheugen, snelheid en bandbreedte zijn allemaal hoger met de RTX 5090 dankzij GDDR7 en een grotere, sterkere chip. De RTX 5090 heeft 33% meer VRAM dan de 4090, die 33% hoger kan worden overgeklokt om meer bandbreedte te bieden is 78% beter. We weten niet wat de L2-cachegrootte is en of er andere wijzigingen zijn. Zou dat invloed kunnen hebben op de bandbreedte? En beide zijn belangrijke overwegingen. Toch is dat een enorme toename van de bandbreedte voor onbewerkt geheugen.
Nvidia heeft groot ingezet op AI met de RTX 50-serie, en dat is waar we de grootste veranderingen zagen. De RTX 4090 heeft 661 TFLOPS aan FP16-tensorverwerking (met schaars) en 1321 TOPS (teraops) aan INT8-tensorverwerking (opnieuw met schaarsheid). ) wat meer is dan AMD’s RX 7900 XTX, die slechts 123 TFLOPS/TOPS aan FP16/INT8-verwerking biedt. (zonder fragmentatie), maar het verbleekt nog steeds in vergelijking met de RTX 5090
We zijn niet zeker van de FP16-cijfers, maar ervan uitgaande dat Nvidia dezelfde verhouding volgt als zijn voorganger, zal de RTX 5090 tot 1676 TFLOPS aan FP16-tensorverwerking leveren, en het dubbele voor 3352 TOPS aan INT8-tensorverwerking (beide zijn schaars) Dat is een toename van 154% (2,54x) in de rekenprestaties van AI voor de volgende generatie, en Nvidia is van plan het potentieel van AI goed te benutten.
Zoals we elders hebben besproken, zal Nvidia DLSS 4 profiteren van nieuwe functies in Blackwell om AI-algoritmen aan te sturen. Multi-frame generatie zal “de toekomst voorspellen” en maximaal drie extra frames creëren uit de geregende frame-rijder (en mogelijk schaling) omdat het frameprojectie gebruikt in plaats van interpolatie. Het afstemmen van de latentie zou dus niet te veel moeten verschillen van wat we hebben gezien bij het genereren van DLSS 3-frames, maar de extra frames zullen ervoor zorgen dat alles er soepeler uitziet.
Hoe voelt het eigenlijk? Wij hebben nog niet de kans gehad om het zelf te testen. Daarom zullen wij een definitief oordeel achterwege laten. Maar we zijn behoorlijk wantrouwend. Het zou goed kunnen werken. Maar één frame wordt weergegeven op basis van gebruikersinvoer. Dit werd gevolgd door drie door AI gegenereerde frames zonder nieuwe gebruikersinvoer. Er zal niet hetzelfde gevoel zijn als in een game waarbij elk frame nieuwe gebruikersinvoer ontvangt en volledig wordt weergegeven.
Er zijn nog meer veranderingen. Dat staat ook op het punt te gebeuren. Sommige zijn exclusief voor de Blackwell RTX 5090 en andere zullen werken met oudere RTX-kaarten. RTX Neural Materials lijkt AI-compressie en machine learning te gebruiken om de geheugenvereisten voor texturen en materiaalbeschrijvingen te verminderen. Om dit te laten werken, moet de hardwarepijplijn echter naast shaders ook AI kunnen gebruiken. Het wordt dus weer een bijzondere serie, slechts 50 series.
De opschaling van DLSS Transformer maakt daarentegen gebruik van een opnieuw getraind netwerk dat is gebouwd op AI-transformatoren in plaats van het convolutionele neurale netwerk (CNN) dat wordt gebruikt met het boosting-algoritme. De omvang van eerdere DLSS Transformers vormde de kern van de AI-revolutie. Het aandrijven van zaken als ChatGPT, DALL-E en andere AI-tools voor het maken van inhoud. Nvidia laat oude en nieuwe DLSS-opschaling zien. Zeer indrukwekkend En wij willen het zelf uitproberen. Bovendien lijkt het nieuwe DLSS Transformer-algoritme sneller te werken dan de oude CNN-versie en zal beschikbaar zijn voor alle RTX GPU’s.
Nvidia’s prestatievoorbeeld suggereert dat de RTX 5090 tot twee keer sneller kan zijn dan de RTX 4090. En het toont ook een paar games die geen DLSS 4 of zelfs DLSS 3 hebben, voor het geval de wateren modderig worden. Kijkend naar de resultaten van Far Cry 6 lijkt het erop dat de 5090 ongeveer 27% efficiënter is dan de 4090 in games waarin de nieuwe AI-functies geen deel uitmaken van de vergelijking. In A Plague Tale: Requiem neemt het verschil toe tot ongeveer 43%. (ja, ik tel pixels!) In games die DLSS 4 MFG gebruiken (vergeleken met DLSS 3 FG), laat Nvidia een verbetering van 2,3x–2,45x zien.
Betekent dit dat de RTX 5090 de hogere prijs waard is? Wij denken dat het grotendeels zal afhangen van wat je doet. Het is vrijwel zeker dat er veel mensen en bedrijven zullen zijn die geïnteresseerd zijn in AI en die de kans zullen grijpen om $ 1.999 uit te geven voor een RTX 5090. Diezelfde groepen hebben de afgelopen jaren RTX 4090-kaarten gekocht tijdens generatieve tests 5090 laat ook een significante prestatieverbetering van 2x zien met behulp van Flux.dev.
Maar wat als je vooral games speelt en niet van framing houdt? Het is waarschijnlijk geen goed idee om achterover te leunen en te zien hoe de zaken verlopen. Hoe zal het zich in de loop van de tijd ontwikkelen? Misschien zal het daadwerkelijke gebruik van DLSS 4 er goed uitzien en aanvoelen. Of misschien zal het trekken van 575 W piekvermogen via de nieuwe 16-pins connector resulteren in Meltgate Part 2, maar hoe je het ook snijdt, Tweeduizend is veel geld om uit te geven aan een gaming-GPU – en je zult zeker de rest willen. van uw pc, afhankelijk van de taak. Dit komt omdat het aandrijven van de RTX 5090 en het voortdurend updaten van games een zeer krachtige pc vereist.