enfrdepluk
Suche finde 4120  disqus socia  tg2 f2 lin2 in2 X-Symbol 3 y2  p2 Tik steam2

Funktionen der GeForce GTX 280-Architektur

 

Die bisher produktivste Single-Chip-Lösung war die GeForce GTX 280 – sie hat 240 Shader-Prozessoren, 80 Textur-Prozessoren und unterstützt bis zu 1 GB Videospeicher. Tatsächlich kann man sich den modernen Grafikkern der GeForce-GTX-200-Familie als universellen Chip vorstellen, der zwei unterschiedliche Modi unterstützt – Grafik und Computing. Die Chiparchitektur der GeForce 8- und 9-Familien wird normalerweise durch Arrays skalierbarer Prozessoren (Scalable Processor Array, SPA) dargestellt. Die Architektur der GeForce-GTX-200-Chipfamilie basiert auf einer überarbeiteten und verbesserten SPA-Architektur, bestehend aus einer Reihe sogenannter „Texture Processing Clusters“ (TPC, Texture Processing Clusters) im Grafikmodus bzw. „Stream Processing Clusters“ in paralleler Rechenmodus. 
 

1

Darüber hinaus besteht jedes TPC-Modul aus einem Array von Streaming-Multiprozessoren (SM, Streaming Multiprocessors), und jeder SM enthält acht Prozessorkerne, die auch Stream-Prozessoren (SP, Streaming Processor) oder Thread-Prozessoren (TP, Thread Processor) genannt werden. Jeder SM enthält auch Texturfilterprozessoren für den Grafikmodus, die auch für verschiedene Filteroperationen im Rechenmodus verwendet werden.


Unten sehen Sie ein Blockdiagramm der GeForce 280 GTX im traditionellen Grafikmodus.

3

Durch Umschalten in den Rechenmodus verwaltet der Hardware-Thread-Manager (oben) die TPC-Threads.

4

Näherer Blick auf den TPC-Cluster: Shared Memory pro SM; Jeder SM-Prozessorkern kann Daten zwischen anderen SM-Kernen über verteilten Speicher austauschen, ohne dass auf ein externes Speichersubsystem zugegriffen werden muss.

Daher verwendet die einheitliche Shader- und Computerarchitektur von NVIDIA zwei völlig unterschiedliche Rechenmodelle: Für den TPC-Betrieb wird MIMD (Multiple Instruction, Multiple Data) verwendet, für SM-Berechnungen - SIMT (Single Instruction, Multiple Thread), erweiterte Version, SIMD (Single Instruction , mehrere Daten).
In Bezug auf die allgemeinen Eigenschaften hat die GeForce GTX 200-Familie im Vergleich zu früheren Chipgenerationen die folgenden Vorteile:

Fähigkeit, dreimal mehr Datenströme pro Zeiteinheit zu verarbeiten
Neues Befehlsplaner-Design mit 20 % mehr Effizienz bei der Texturverarbeitung
512-Bit-Speicherschnittstelle (384 Bit für die vorherige Generation)
Optimierter Z-Sampling- und Komprimierungsprozess, um bessere Leistungsergebnisse bei großen Bildschirmgrößen zu erzielen
Architekturverbesserungen zur Verbesserung der Schattenverarbeitungsleistung
Full-Speed-Framebuffer-Blending (gegenüber halber Geschwindigkeit bei der 8800 GTX)
Verdoppelter Befehlspuffer für verbesserte Rechenleistung
Verdoppelte Registeranzahl zur schnelleren Berechnung langer und komplexer Shader
Fließkommazahl mit doppelter Genauigkeit, kompatibel mit der IEEE 754R-Version
Hardwareunterstützung für 10-Bit-Farbraum (nur DisplayPort)

Hier ist eine Liste der Hauptmerkmale der neuen Chips:

NVIDIA PhysX-Unterstützung
Unterstützung für Microsoft DirectX 10, Shader Model 4.0
Unterstützung für NVIDIA CUDA-Technologie
PCI Express 2.0-Busunterstützung
Unterstützung für die GigaThread-Technologie
NVIDIA Lumenex-Engine
128-Bit-Gleitkommazahl (HDR)
OpenGL 2.1-Unterstützung
Unterstützt Dual-Dual-Link-DVI
Unterstützung für NVIDIA PureVideo HD-Technologie
Unterstützung für NVIDIA HybridPower-Technologie

Unabhängig davon wird darauf hingewiesen, dass DirectX 10.1 von der GeForce GTX 200-Familie nicht unterstützt wird. Der Grund liegt darin, dass bei der Entwicklung von Chips einer neuen Familie nach Rücksprache mit Partnern der Fokus nicht auf der Unterstützung des noch wenig nachgefragten DirectX 10.1 lag, sondern auf der Verbesserung der Architektur und Performance der Chips.

Basierend auf einer Reihe physikalischer Algorithmen ist die NVIDIA PhysX-Technologie eine leistungsstarke Physik-Engine für Echtzeit-Computing. Derzeit ist die PhysX-Unterstützung in mehr als 150 Spielen implementiert. Kombiniert mit kraftvoll GPUDie PhysX-Engine sorgt für eine deutliche Steigerung der physischen Rechenleistung, insbesondere in Momenten wie der Entstehung von Explosionen mit fliegendem Staub und Fragmenten, Charakteren mit komplexen Gesichtsausdrücken, neuen Waffentypen mit fantastischen Effekten, realistisch abgenutzten oder zerrissenen Stoffen, Nebel usw Rauch mit dynamischer Strömung um Objekte.

Viele Entwickler und Spieleentwickler streben schon lange danach, physikalische Effekte in Spiele zu implementieren. Diese Richtung wird von Jahr zu Jahr relevanter. In modernen Spielen wird die Interaktion von Objekten mit der Umgebung durch die Kräfte von zwei Engines ausgeführt, die die größte Popularität erlangt haben - Havok und PhysX.

Havok ist die älteste Engine, auf der viele Spiele für PC und Konsolen geschrieben werden. Bereits 2006 demonstrierte die damals unabhängige ATI die Beschleunigung physikalischer Effekte durch die Kräfte von Radeon X1900XT-Grafikkarten. Havok wurde jedoch später von Intel gekauft, das erklärte, dass die physikalischen Effekte von dieser Engine mithilfe von Prozessoren berechnet würden.

5

PhysX wurde von AGEIA entwickelt, die „Physik“ mit Beschleunigern ihres eigenen Designs implementierte. Doch trotz der großen Popularität dieser Engine bei Spieleentwicklern erwies sich die Implementierung physikalischer Effekte in Spielen durch spezialisierte Beschleuniger als sehr umstritten.

Und letztes Jahr kaufte NVIDIA AGEIA PhysX. Es wurde erklärt, dass die PhysX-Engine durch Treiberoptimierung an die Verwendung von GeForce 8800GT und höheren Grafikkarten angepasst wird.

Eine weitere wichtige Neuerung sind neue Energiesparmodi. Durch den Einsatz präziser 65-nm-Prozesstechnologie und neuer Schaltungslösungen konnte eine flexiblere und dynamischere Steuerung des Stromverbrauchs erreicht werden. So beträgt der Verbrauch der Grafikchips der GeForce GTX 200-Familie im Standby-Modus bzw. im 2D-Modus etwa 25 W; beim Abspielen eines Blu-ray-DVD-Films - ca. 35 W; Bei voller 3D-Last liegt die TDP bei maximal 236 W. Der GeForce GTX 200-Grafikchip kann dank der Unterstützung der HybridPower-Technologie bei Motherboards, die auf nForce HybridPower-Chipsätzen mit integrierter Grafik basieren (z. B. nForce 780a oder 790i), vollständig deaktiviert werden, während der Grafikstream mit geringer Intensität einfach berechnet wird GPU, integriert in die Systemplatine. Darüber hinaus GPU Die GeForce GTX 200-Familie verfügt außerdem über spezielle Module zur Steuerung des Stromverbrauchs, die dazu dienen, GPU-Einheiten auszuschalten, die derzeit nicht verwendet werden.

6

Der Benutzer kann ein System basierend auf zwei oder drei Grafikkarten der GeForce GTX 200-Familie im SLI-Modus konfigurieren, wenn er Motherboards verwendet, die auf den entsprechenden nForce-Chipsätzen basieren. Im traditionellen Standard-SLI-Modus (mit zwei Grafikkarten) wird eine Leistungssteigerung von etwa 60–90 % bei Spielen angegeben; im 3-Wege-SLI-Modus – die maximale Anzahl von Bildern pro Sekunde bei maximalen Bildschirmgrößen.

Als Teil der Ankündigung der neuen GPU-Familie GeForce GTX 200 bietet NVIDIA einen völlig neuen Blick auf die Rolle von CPU und GPU in modernen ausgewogenen Desktop-Systemen. Ein solcher optimierter PC, der auf dem Konzept des heterogenen Computing (d. h. der Berechnung eines Stroms von heterogenen, heterogenen Aufgaben) basiert, hat laut NVIDIA-Experten eine viel ausgewogenere Architektur und ein deutlich größeres Rechenpotenzial. Darunter versteht man die Kombination einer relativ mäßig leistungsfähigen CPU mit der leistungsstärksten Grafik oder sogar SLI-System, das Spitzenleistungen in den anspruchsvollsten Spielen, 3D- und Medienanwendungen ermöglicht.

Auf der anderen Seite ist intensives Rechnen mit Hilfe moderner Grafikkarten schon lange nichts Neues, aber mit dem Erscheinen der GeForce-GTX-200-Grafikprozessorfamilie erwartet NVIDIA ein deutlich steigendes Interesse an der CUDA-Technologie.

CUDA (Compute Unified Device Architecture) ist eine Computerarchitektur, die darauf abzielt, komplexe Probleme in Verbraucher-, Geschäfts- und technischen Bereichen zu lösen - in allen datenintensiven Anwendungen, die NVIDIA-GPUs verwenden. Aus Sicht der CUDA-Technologie ist der neue Grafikchip GeForce GTX 280 nichts anderes als ein leistungsstarker Multi-Core (Hunderte von Kernen!) Prozessor für paralleles Rechnen.


Wie oben erwähnt, kann man sich den Grafikkern der GeForce-GTX-200-Familie als einen Chip vorstellen, der Grafik- und Rechenmodi unterstützt. In einem dieser Modi - "Computing" - verwandelt sich dieselbe GeForce GTX 280 in einen programmierbaren Multiprozessor mit 240 Kernen und 1 GB dediziertem Speicher - eine Art dedizierter Supercomputer mit Teraflop-Leistung, der die Leistung von Anwendungen, die Daten gut parallelisieren, erheblich steigert , zum Beispiel Videocodierung, wissenschaftliches Rechnen usw.


Die Grafikprozessorfamilien GeForce 8 und 9 waren mit mehr als 70 Millionen verkauften Einheiten die ersten auf dem Markt, die die CUDA-Technologie unterstützten, und das Interesse am CUDA-Projekt wächst ständig. Erfahren Sie hier mehr über das Projekt und laden Sie die Dateien herunter, die Sie für den Einstieg benötigen. Als Beispiel zeigen die folgenden Screenshots Beispiele für Rechenleistungsgewinne, die von unabhängigen Benutzern der CUDA-Technologie erzielt wurden.

7

Im Vergleich zum bisherigen Spitzenreiter GeForce 8800 GTX verfügt das neue Flaggschiff GeForce GTX 280 über die 1,88-fache Anzahl an Prozessorkernen; in der Lage, etwa 2,5 weitere Threads pro Chip zu verarbeiten; hat die doppelte Größe von Dateiregistern und Unterstützung für Gleitkommaberechnungen mit doppelter Genauigkeit; unterstützt 1 GB Speicher mit 512-Bit-Schnittstelle; ausgestattet mit einem effizienteren Befehlsverteiler und verbesserten Kommunikationsfähigkeiten zwischen Chipelementen; verbesserter Z-Puffer und Komprimierungsmodul, Unterstützung für 10-Bit-Farbpalette usw.


 Erstmals positioniert sich eine neue Generation von GeForce-GTX-200-Chips nicht nur als leistungsstarker 3D-Grafikbeschleuniger, sondern auch als ernsthafte Computerlösung für paralleles Rechnen.

Spezifikationen NVIDIA GeForce GTX 280

Name GeForce GTX 280
Kern GT200 (D10U-30)
Verfahrenstechnik (µm) 0.065
Transistoren (Millionen) 1400
Kernfrequenz 602
Speicherfrequenz (DDR) 1107
Bus- und Speichertyp GDDR3 512-Bit
Bandbreite (Gb/s) 141,67
Einheitliche Shader-Blöcke 240
Häufigkeit einheitlicher Shader-Einheiten 1296
TMU pro Förderer 80
ROP 32
Shader-Modell 4.0
Füllrate (Mtex/s) 48160
DirectX 10
Schnittstelle PCIe 2.0

Es gab keine Revolution; der neue GT200-Grafikprozessor und die heute getestete Grafikkarte GeForce 280GTX (285GTX, 295GTX) sind Weiterentwicklungen der Unified-Shader-Architektur von NVIDIA. Der neue Grafikprozessor enthält eine größere Anzahl an Funktionseinheiten als seine Vorgänger und darf daher zu Recht als der leistungsstärkste bezeichnet werden GPU heute.