enfrdepluk
Suche finde 4120  disqus socia  tg2 f2 lin2 in2 X-Symbol 3 y2  p2 Tik steam2

GeForce GTX 960

960

Mit der Grafikkarte GeForce GTX 960 brachte NVIDIA die Vorteile der „Maxwell“-Architektur auf den Mainstream-Markt. Grafikkarten haben solche architektonischen Vorteile wie Speicherkomprimierung, DSR, MFAA, VXGI und DirectX 12 erhalten. Für NVIDIA werden die eigenen GameWorks- und PhysX-APIs immer wichtiger, dazu gibt es noch keine Neuigkeiten, aber Käufer der GeForce GTX 960 werden es tun profitieren ebenfalls von ihrer Unterstützung.

Die Grafikkarte GeForce GTX 960 verwendet GPU GM206 liegt wahrscheinlich nicht in der Vollversion vor – mit der Bezeichnung GM206-300-A1. Der Kristall ist mit 2,94 Milliarden Transistoren bestückt, er ist deutlich weniger komplex als AMDs „Tahiti“ oder „Tonga“. Da die Referenzgrafikkarte GeForce GTX 960 nicht aufgeführt ist, haben die Angaben zur Basisfrequenz und zum Boost in der obigen Tabelle keine praktische Bedeutung. NVIDIA gibt eine Basisfrequenz von 1.126 MHz und eine Frequenz an GPU Boost – 1.178 MHz. NVIDIA hat 2.048 MB GDDR5-Speicher mit 1.750 MHz verbaut, der Speicher ist über eine 128-Bit-Schnittstelle angebunden. Das Ergebnis ist eine Speicherbandbreite von 112,2 GB/s – nicht viel im Vergleich zur Konkurrenz. Vergessen Sie jedoch nicht, dass NVIDIA eine Speicherkomprimierungstechnologie verwendet, die theoretisch die effektive Speicherbandbreite erhöht, die von NVIDIA versprochenen 148,8 GB/s jedoch immer noch selten erreicht.

Diag 1

GPU Der GM206 setzt auf 1.024 Stream-Prozessoren, die in acht SMM-Blöcken (Streaming Multiprocessors) mit jeweils 4x 32 Stream-Prozessoren organisiert sind. Vier SMMs bilden einen GPC-Cluster, wir erhalten jeweils zwei solcher Cluster GPU. 8 (SMM) x 4 (блока SMM) x 32 потоковых процессора как раз дают 1.024 потоковых процессора.

Jedes SMM verwendet acht Textureinheiten. Dementsprechend ergeben acht SMMs in der GeForce GTX 960 64 Textureinheiten. Zwei 64-Bit-Speichercontroller sind mit 32 Raster-Operations-Pipelines (ROPs) verbunden.

smm

NVIDIA konnte dank mehrerer Lösungen eine höhere Effizienz von Maxwell erreichen. Der L2-Cache in der „Maxwell“-Architektur wurde auf 2.048 KB gegenüber 256 KB in der „Kepler“-Architektur erhöht. Die Cache-Bandbreite blieb bei 512 Bytes pro Takt. Im Vergleich zur Maxwell-Architektur der ersten Generation wurde der Gesamtspeicher für jedes SMM leicht erhöht. Jetzt sind es schon 96 kb, nicht 64 kb. Wir können auch die neue Polymorph Engine Version 3.0 bemerken.

Die PolyMorph 3.0-Engine ist für Texturabfragen, Tessellation, Attributeinstellung, Sichtfeldtransformation und Streaming-Ausgabe verantwortlich. Die Ergebnisse der Berechnungen des SMM-Clusters und der PolyMorph 3.0-Engine werden dann an die Rasterisierungs-Engine übergeben. Im zweiten Schritt beginnt der Tessellator mit der Berechnung der Positionen der Flächen, je nach Entfernung wird der gewünschte Detaillierungsgrad gewählt. Die angepassten Werte werden an das SMM-Cluster gesendet, wo Domänen- und Geometrie-Shader damit arbeiten. Der Domain-Shader berechnet die endgültige Position jedes Dreiecks basierend auf Hull-Shadern und Tessellatoren. In diesem Stadium werden Verschiebungskarten überlagert. Der Geometrie-Shader vergleicht dann die berechneten Daten mit den tatsächlich sichtbaren Objekten und sendet die Ergebnisse zur endgültigen Berechnung an die Tessellations-Engine zurück. In der letzten Phase führt die PolyMorph 3.0-Engine eine Sichtfeldtransformation und Perspektivkorrektur durch. Abschließend werden die berechneten Daten per Streamausgabe ausgegeben, der Speicher wird für weitere Berechnungen freigegeben.

Kommen wir zu den einzelnen Blöcken des SMM-Multiprozessors. Jeder Block von 32 Stream-Prozessoren ist mit einem Befehlspuffer und einem Warp-Scheduler ausgestattet. Die beiden Dispatcher arbeiten mit jeweils 16.384 32-Bit-Registern. Betrachtet man die "Kepler"-Architektur, so gab es 192 Stream-Prozessoren, auf denen vier Warp-Scheduler und acht Dispatch-Einheiten mit insgesamt 65.536 32-Bit-Registern liefen. Theoretisch gibt es für jeden Stream-Prozessor in der Maxwell-Architektur 512 Register, bei Kepler waren es etwa 341. Auch diese Maßnahme trug zu einer Leistungssteigerung von Stream-Prozessoren um bis zu 35% bei.

Spezifikationen GeForce GTX 960

 Datum der Veröffentlichung  22 Januar 2015 Jahr
 Startpreis, $  199

Chip

 Modell GPU 28 nm GM206-300
 Kerne: TMUs : ROPs 1024: 64: 32

Frequenzen

 Frequenz GPU(Boost), MHz 1127 (1178)
 Speicherfrequenz (effektiv), MHz 1753 (7012)
 Leistung FP32, GFLOPS 2,308

Память

 Videospeichergröße, MB  2048/4096
 Speicherbus, Bit  128
 Speicherbandbreite, GB/s  112

Schnittstelle und TDP

 PCI-Express-Schnittstelle  3.0 x16
 TDP. Di 120

Auch das Verhältnis zwischen Stream-Prozessoren und den sogenannten Special Function Units (SFU) hat sich etwas verändert. In der Kepler-Architektur betrug das Verhältnis 6/1, in Maxwell sank es auf 4/1. Gleiches gilt für das Verhältnis von Stream-Prozessoren und Lese-/Schreibeinheiten (Load/Store, LD/ST). Spezielle Blöcke für Berechnungen mit doppelter Genauigkeit werden im Diagramm nicht angezeigt, sie werden höchstwahrscheinlich in dargestellt GPU GM210 (ähnlich GK110 und GK104). Aber laut NVIDIA beträgt das Verhältnis von einfacher zu doppelter Präzision 1/24, genau wie bei den „Kepler“-Chips der ersten Generation (GK104).

Bei der Videoverarbeitungs-Engine (Video Engine) sind geringfügige Änderungen gegenüber der vorherigen Implementierung der „Maxwell“-Architektur aufgetreten. Es bietet jetzt nicht nur Hardware-Kodierung für H.265, sondern auch Hardware-Dekodierung. Der GeForce GTX 980 und der GeForce GTX 970 fehlte ebenfalls die HDCP-Unterstützung in HDMI 2.2, der GeForce GTX 960 und GPU GM206 wurde hinzugefügt.