Mit der Blackwell-Architektur hat Nvidia eine neue GPU-Generation eingeführt, die zahlreiche technologische Weiterentwicklungen gegenüber dem Ada-Lovelace-Vorgänger aufweist. Die Architektur bildet die technische Grundlage der GeForce-RTX-5000-Serie und bringt sowohl strukturelle als auch funktionale Neuerungen mit sich, die sich auf Leistung, Effizienz und Feature-Set der Grafikkarten auswirken. Die Fertigung erfolgt erneut bei TSMC im 4N-Prozess, einer leicht modifizierten 5-nm-Fertigung, die speziell auf die Anforderungen von Nvidia zugeschnitten ist. Trotz vergleichbarer Strukturbreite zu Ada Lovelace erzielt Blackwell eine höhere Leistung-pro-Watt.
Ein zentrales Merkmal der Blackwell-Architektur ist der Wechsel von einem monolithischen Chipdesign hin zu einem Multi-Chip-Modul (MCM). Die Architektur trennt Rechenlogik und Speichersteuerung physisch in zwei separate Chips innerhalb eines Packages. Diese Aufteilung verbessert die Fertigungsausbeute, senkt die Produktionskosten und ermöglicht eine bessere Skalierbarkeit:
Die Struktur der Streaming Multiprocessors (SMs) wurde gegenüber der Ada-Generation deutlich überarbeitet. Pro SM stehen mehr CUDA-Kerne zur Verfügung, ergänzt durch aktualisierte Tensor- und RT-Kerne. Darüber hinaus wurde die Cache-Architektur optimiert. Die Größe des L2-Caches wurde auf bis zu 128 MB erhöht (modellabhängig), was die Speicherbandbreite entlastet und insbesondere bei speicherintensiven Anwendungen (z. B. hochauflösendes Texturstreaming) für geringere Latenzen sorgt.
Die Blackwell-Architektur integriert Raytracing-Kerne der vierten Generation, welche die Leistung bei komplexen Lichtberechnungen im Vergleich zur dritten Generation in Ada Lovelace deutlich steigern. Die in Blackwell verbauten Tensor-Kerne der fünften Generation wurden auf moderne KI-Modelle ausgelegt, insbesondere auf Transformer-Netzwerke, wie sie etwa bei DLSS 4.0 zum Einsatz kommen. Die Tensor-Kerne übernehmen in der RTX-5000-Serie unter anderem Aufgaben wie Frame-Interpolation, Auflösungs-Skalierung (Super Resolution), physikalische Simulationen und Gesichtsanalyse (z. B. für virtuelle Charaktere in Spielen).
Blackwell im Vergleich mit Ampere und Ada (Bildquelle: Nvidia).
Die preisliche Staffelung zum Marktstart (Bildquelle: Nvidia).
Mit Blackwell kommt erstmals der neue GDDR7-Speicherstandard im Consumer-Grafikkartenbereich zum Einsatz. GDDR7 ermöglicht deutlich höhere Datentransferraten – bis zu 32 Gbps pro Pin, abhängig vom konkreten Modell. In Verbindung mit breiteren Speicherinterfaces (z. B. 512 Bit bei der RTX 5090) erreicht die Speicherbandbreite Werte von über 1,7 TB/s.
Die Architektur ist ausgelegt auf den Betrieb mit DLSS 4.0 (Deep Learning Super Sampling), das im Vergleich zu DLSS 3 neue Funktionen bietet, darunter eine erweiterte Multi-Frame Generation. Während DLSS 3 ein gerendertes Frame plus einen KI-generierten Zwischenframe erzeugte, erlaubt DLSS 4 die Berechnung von mehreren Zwischenframes pro gerendertem Frame, was in bestimmten Szenarien eine noch stärkere Steigerung der Bildwiederholrate ermöglicht. Das dahinterliegende KI-Modell wurde von Convolutional Neural Networks (CNNs) auf Transformer-basierte Architekturen umgestellt, was die Bildqualität bei Bewegung, Kantenglättung und Detailrekonstruktion weiter verbessert. Die Tensor-Kerne der fünften Generation sind speziell auf diese Modelle hin optimiert.
Auch Nvidia Reflex wurde weiterentwickelt: In Verbindung mit der Blackwell-Architektur wird Reflex 2.0 eingeführt, das die Eingabelatenz durch optimierte GPU-Pipeline-Steuerung nochmals senkt.
Der GB202-Chip ist das Flaggschiff der RTX Blackwell GPU-Reihe und treibt die GeForce RTX 5090-Grafikkarte an. Die GB203-GPU wird in der GeForce RTX 5080 und GB205 in der GeForce RTX 5070 verwendet. Diese GPUs basieren auf derselben Architektur und sind für unterschiedliche Marktsegmente konfiguriert. Die vollständige GB202-GPU umfasst 12 Grafikverarbeitungscluster (GPCs), 96 Texturverarbeitungscluster (TPCs), 192 Streaming-Multiprozessoren (SMs) und eine 512-Bit-Speicherschnittstelle mit sechzehn 32-Bit-Speichercontrollern.
Die vollständige GB202-GPU (Bildquelle: Nvidia).
#Ada Lovelace #Apple #Apps #ASUS #Benchmark #BIOS #Blackwell #DLSS #Gamer #Gaming #GeForce #Google #Grafikchip #Grafikkarte #INNO3D #Intel #KFA2 #Kühlung #Künstliche Intelligenz #Lüfter #Maus #Netzteil #Nvidia #Overclocking #PCIe #Raytracing #Sapphire #Smartphone #SMS #ZOTAC
Es gibt mittlerweile viele gute Gaming-Notebooks im Angebot. Dadurch ist die Wahl, welcher Laptop es sein sollte, nicht immer leicht....
Beim Gaming entscheidet nicht nur das Spiel selbst über die Qualität des Erlebnisses. Fehlt die richtige Hardware, mangelt es an...
Mit der WD Red Pro 26 TB bringt Western Digital ein weiteres CMR-basiertes NAS-Laufwerk auf den Markt, das sich an professionelle...
Mit der neuen Pocket SSD stellt Verbatim ein kompaktes, portables Solid-State-Drive vor, das auf hohe Übertragungsraten und Mobilität ausgelegt ist....
Sapphire bringt mit dem NITRO+ B850A WIFI 7 ein neues Mainboard auf Basis des AMD B850-Chipsatzes auf den Markt. Es...
Im günstigeren Preissegment hat Nvidia die GeForce RTX 5070 installiert, die auf der abgespeckten Blackwell-Variante GB205 basiert. Wir haben uns ein Custom-Design von Hersteller KFA2 im Test genauer angesehen.
Mit der Einführung der RTX 5070 Ti rollt Nvidia die neue Blackwell-Architektur auch in niedrigeren Preisregionen aus. Wir haben uns einen frischen KFA2-Boliden mit 1-Click OC und schicker RGB-Beleuchtung angesehen.
Mit der GeForce RTX 5080 X3 OC von INNO3D haben wir ein weiteres Custom-Design auf Basis der neuen Blackwell-Architektur im Testlab empfangen. Mehr zum Praxistest des Boliden in unserem Artikel.