GeForce RTX 4070 Ti
Die GeForce RTX 4070 Ti basiert auf der AD104-GPU und verfügt über 7680 CUDA-Kerne, die 40 Shader-Teraflops mit FP32-Präzision für das Grafik-Rendering liefern, 240 Tensor-Kerne der 641. Generation, die 60 Billionen Sparse-Matrix-Operationen für KI- und DLSS-Verarbeitung bieten, 93 RT 12-Kerne der Generationen Ada-Architektur mit 6 RT-TFLOPS-Leistung für Raytracing-Grafikbeschleunigung der nächsten Generation und 40 GB GDDR4070X-Speicher. Wie alle GPUs der GeForce RTX 3-Serie verfügt die RTX XNUMX Ti über Innovationen von Ada, darunter Shader Execution Reordering (SER), eine neue Optical-Flow-Engine, neue RT-Kerne und DLSS XNUMX.
NVIDIA Ada-Architektur
Die NVIDIA Ada-Architektur ist ein riesiger Leistungssprung. Zahlreiche Verbesserungen machen es zum schnellsten und fortschrittlichsten. Die RTX 4070 Ti wird mit dem kundenspezifischen 4N-Prozess von TSMC hergestellt und enthält 35,8 Milliarden Transistoren und 7680 CUDA-Kerne. Hardwarebeschleunigtes Tracing, Tensor Cores der 1. Generation zur Verbesserung der KI-Leistung, Encoder der XNUMX. Generation mit Unterstützung für AVXNUMX-Kodierung und -Decodierung und DLSS-Verbesserungen, die hohe Bildraten in kompetitiven Spielen und Ultra-Einstellungen mit aktiviertem Raytracing liefern.
NVIDIA Ada Streaming-Multiprozessor
RTX-Grafikkarten haben drei Hauptprozessoren: programmierbare universelle CUDA-Kerne, die universelle Shader und CUDA-Anwendungen verarbeiten, RT-Kerne, um die Berechnung von Strahlschnittpunkten mit Dreiecken und Begrenzungsvolumen zu beschleunigen, RT-Kerne der Ada-Architektur, mit denen die Berechnungsrate von Schnittpunkten verdoppelt wird Dreiecke, der letzte Prozessortyp - Verarbeitungspipeline für künstliche Intelligenz, die als Tensorkerne bezeichnet wird.
Ada verbessert alle drei RTX-Prozessoren
Programmierbare Shader: 40 Shader-Teraflops im Vergleich zu 21,7 Teraflops auf der RTX 3070 Ti. Der Ada-Shader-Prozessor enthält eine wichtige neue Technologie namens Shader Execution Reordering (SER), die die Arbeit im laufenden Betrieb neu ordnet und eine zweifache Beschleunigung für Raytracing-Shader bietet. SER ist eine ebenso große Innovation für GPUs wie einst die Out-of-Order-Ausführung für CPUs.
Gen 4 Tensor Cores: Der neue Tensor Core in Ada beinhaltet die NVIDIA Hopper FP8 Transformer Engine, die bis zu 641 FP8-Präzisions-Tensor-Teraflops auf spärlichen Matrizen in der RTX 4070 Ti für Training und KI-Inferenz liefert, gegenüber 174 Tensor-Teraflops auf spärlichen Matrizen in der RTX 3070Ti. Im Vergleich zu FP16 reduziert FP8 den Speicherbedarf um die Hälfte und verdoppelt die KI-Leistung.
Gen 3 RT Cores: Die neue Opacity Micromap Engine ist durchschnittlich doppelt so schnell wie Schnittpunktberechnungen für Oberflächen mit einem Texturtransparenztest, wenn Entwickler diese Funktion verwenden, und die neue Micro-Mesh Engine erhöht die geometrischen Details ohne die Kosten für das Zusammenbauen und Speichern von BVH. Der Durchsatz von Ada bei Crossover-Tests beträgt 93 RT-TFLOPS im Vergleich zu 42,5 RT-TFLOPS des 3070 Ti.
Tensorkerne der 4. Generation
Tensorkerne sind Hochleistungsrechenkerne, die für Matrixmultiplikations- und Additionsoperationen spezialisiert und angepasst sind, die in Anwendungen der künstlichen Intelligenz und für Hochleistungsrechnen verwendet werden. Tensorkerne bieten eine revolutionäre Leistung für Matrixberechnungen, die für das Training mehrschichtiger neuronaler Netze und die Schlussfolgerung bereits trainierter Netze von entscheidender Bedeutung sind. Zu Beispielanwendungen mit Inferenz gehört NVIDIA DLSS 3 für Gamer, bei dem ein separates neuronales Netzwerk für die Generierung hochwertiger Frames verantwortlich ist, die alle vom NVIDIA Tensor Core angetrieben werden. DLSS ist so beliebt geworden, dass es bereits über 250 Spiele gibt, die diese Technologie unterstützen, bei der Spieler die Leistung mit einem Klick verdoppeln können. Darüber hinaus haben viele kreative Apps damit begonnen, KI-Funktionen zu verwenden, um Künstlern dabei zu helfen, Inhalte schneller und in besserer Qualität zu erstellen. Heute verwenden mehr als 110 beliebte kreative Anwendungen Tensor- und RT-Core-Beschleunigung auf RTX-Grafikkarten. Und exklusive NVIDIA-Anwendungen wie z Sendung и Canvas, bieten Tools zum Entfernen von Rauschen, Erstellen virtueller Hintergründe und viele andere KI-gestützte Effekte für Videostreaming und Konferenzen.
Der Ada Tensor Core der vierten Generation baut auf den Fähigkeiten früherer Ampere-GPUs auf, die viele neue Datentypen unterstützten, und fügte eine strukturierte Sparsity-Beschleunigung hinzu, um den Durchsatz früherer Turing-Kerne zu verdoppeln. Tensorkerne der Ada-Generation unterstützen das neue FP8-Datenformat, das erstmals in der NVIDIA-Hopper-GPU-Architektur eingeführt wurde. Im Vergleich zu FP16 reduziert FP8 den Speicherbedarf um die Hälfte und verdoppelt die KI-Leistung. Mit dem neuen FP8-Format und der Sparsity-Funktion liefert die GeForce RTX 4070 Ti 641 TFLOPS Leistung für KI-Workloads.
RT-Kerne der 3. Generation
Die RT-Kerne der dritten Generation von Ada sind dedizierte Hardwareblöcke zur Beschleunigung von BVH-Traversal- und Strahldreieck-Schnittpunktberechnungen, die für die Beschleunigung von Raytracing entscheidend sind. Die RT-Kerne von RTX-Grafikkarten sind völlig unabhängig, sie führen alle BVH-Durchquerungs- und Schnittpunktberechnungen durch, wodurch SM-Streaming-Multiprozessoren mit CUDA-Kernen entlastet und für andere Aufgaben wie Pixel-Shading, Vertex-Shading und allgemeine Berechnungen freigegeben werden.
Die RT-Kerne der Ada-Architektur bieten im Vergleich zu NVIDIA Ampere-GPUs 2-mal schnellere Dreiecksstrahlen-Schnittpunkttests, sodass Entwickler ihre virtuellen Welten mit mehr Details ausstatten können. Ada RT-Kerne enthalten auch neue Opacity Micromap Engine-Blöcke, die das Alpha-getestete Geometrie-Tracing um den Faktor 2 beschleunigen, was Entwicklern helfen wird, ressourcenintensive Szenen mit Vegetations- und Partikeleffekten für das Tracing bis zu 2x zu beschleunigen. Die neuen RT-Kerne enthalten auch Displaced MicroMesh Engine-Blöcke, die im laufenden Betrieb Mikromesh erzeugen, um zusätzliche Geometrie zu erzeugen.
All diese Raytracing-Leistungsverbesserungen verschaffen der Ada-Architektur einen großen Vorsprung. Wenn neue Spiele auftauchen, die Ada-Technologien verwenden, um die Leistung zu steigern, werden die Grafikkarten der RTX 40-Serie zweifellos schneller und der vorherigen Generation von Grafikkarten der RTX 30-Serie voraus sein. Ein Beispiel ist ein aktuelles Remaster. Portal mit RTX basierend auf dem RTX Remix, in dem NVIDIA neue Features der Ada-Architektur verwendet, wie die OMM- und SER-Engines (die sich übrigens in den Einstellungen deaktivieren lassen), zusammen ermöglichen sie der RTX 4090 bis zu 3 Mal schneller als die RTX 3080 Ti ohne Verwendung von DLSS, und bei Verwendung des DLSS 3-Frame-Generators kann der Vorteil bis zu fünfmal so groß sein.