enfrdepluk
Suche finde 4120  disqus socia  tg2 f2 lin2 in2 X-Symbol 3 y2  p2 Tik steam2

GeForce GTX 1080

1080

GeForce GTX 1080 – auf Basis gebaut GPU GP104 ist der zweitälteste Chip der Pascal-Reihe. P104 ist im Vergleich zu P100 in der Anzahl der Transistoren und der Chipfläche fast halb so groß. Wenn wir von der Maxwell-Linie ausgehen, dann nimmt der neue Chip hinsichtlich der Leistung eine Zwischenposition zwischen dem GM204, den NVIDIA in der GeForce GTX 970/980 verwendet, und dem GM200 (GeForce GTX 980 Ti und GTX 980 TITAN X) ein „physikalische“ Parameter des Kristalls und in Bezug auf die Anzahl der CUDA-Kerne und Texturmodule. Die Back-End-Konfiguration des GP104 weist ihn eindeutig als Nachfolger des GM204 aus, da er außerdem über einen 256-Bit-Speicherbus verfügt, der von acht Controllern und 64 ROPs gemeinsam genutzt wird.

sm.gp104.800

Aus Sicht der Anordnung von Recheneinheiten GPU Die Pascal-Architektur in der GP104-Implementierung folgt eng den in Maxwell festgelegten Prinzipien. Die gesamte Rechenlogik ist in Strukturen namens Graphics Processing Cluster (GPC) konzentriert – in diesem Prozessor gibt es vier davon. Im GPC stecken fünf Stream-Multiprozessoren, die jeweils über 128 CUDA-Kerne, 8 Textureinheiten und einen L1-Cache-Bereich verfügen, der im Vergleich zu Maxwell von 24 auf 48 KB vergrößert ist. Jeder GPC enthält außerdem eine einzelne Polymorph-Engine (Raster-Engine im Diagramm), die die ersten Rendering-Stufen ausführt: Erkennung von Polygonkanten, Projektion und unsichtbares Ausschneiden von Pixeln.

Die Hauptleistung des 16-nm-Verfahrens drückt sich hier in fast verdoppelten Taktfrequenzen im Vergleich zur GeForce GTX 980 aus: Die Basisfrequenz liegt bei 1607 MHz, der Boost-Takt bei 1733 MHz (da letztere in typischen Anwendungen die durchschnittliche Frequenz ist, die GTX 1080 kann auf höhere Werte beschleunigen.

Der GP64-Prozessor führt Berechnungen mit doppelter Genauigkeit (FP104) mit einer Geschwindigkeit von 1/32 von FP32 durch – dabei erbt er von Chips der zweiten und nachfolgenden Staffel der Maxwell-Familie. Die Pascal-Architektur kann FP16-Operationen auch mit der doppelten Leistung von FP32 ausführen, während Maxwell sie mit der gleichen Geschwindigkeit ausführt. Hinsichtlich der Leistungsaufnahme liegt die GeForce GTX 1080 in der gleichen Klasse wie die GeForce GTX 980 – 180 W. Basierend auf diesen Daten und der angegebenen TFLOPS-Leistung für die GTX 980 und GTX 1080 erhalten wir einen Energieeffizienzgewinn von 63 % für Pascal im Vergleich zu Maxwell. Die RAM-Kapazität beträgt 8 GB GDDR5X – ein Volumen, das bisher AMD-basierten Grafikkarten vorbehalten war GPU Hawaii, mit einem 512-Bit-Speicherbus.

Mikrometer gddr5x 575px

Einer der Hauptunterschiede zwischen GDDR5X und GDDR5 ist die Fähigkeit, vier Datenbits pro Signalzyklus (QDR – Quad Data Rate) zu übertragen, im Gegensatz zu zwei Bits (DDR – Double Data Rate), wie dies bei allen vorherigen Modifikationen von der Fall war DDR-SDRAM-Speicher. Die physikalischen Frequenzen der Speicherkerne und der Datenübertragungsschnittstelle liegen etwa im gleichen Bereich wie die der GDDR5-Chips.

Spezifikationen GeForce GTX 1080 

 Datum der Veröffentlichung  27 Mai 2016 Jahr
 Startpreis, $  599

Chip

 Modell GPU 16 nm GP104-400
 Kerne: TMUs : ROPs 2560: 160: 64

Frequenzen

 Frequenz GPU(Boost), MHz 1607 (1733)
 Speicherfrequenz (effektiv), MHz 1251 (10008)
 Leistung FP32, GFLOPS 8,228

Память

 Videospeichergröße, MB  8192
 Speicherbus, Bit  256
 Speicherbandbreite, GB/s  320

Schnittstelle und TDP

 PCI-Express-Schnittstelle  3.0 x16
 TDP. Di 180

Und um den erhöhten Durchsatz der Chips mit Daten zu sättigen, verwendet GDDR5X einen von 8n auf 16n erhöhten Daten-Prefetch. Bei einer 32-Bit-Schnittstelle eines separaten Chips bedeutet dies, dass der Controller in einem Speicherzugriffszyklus nicht 32, sondern 64 Byte Daten auswählt. Infolgedessen erreicht der resultierende Schnittstellendurchsatz 10–14 Gbit/s pro Kontakt bei einer CK-Frequenz (Befehlstakt) von 1250–1750 MHz – dies ist die Frequenz, die von Dienstprogrammen zur Überwachung und Übertaktung von Grafikkarten angezeigt wird – wie z GPU-Z. Zumindest sind solche Indikatoren mittlerweile im Standard enthalten, doch in Zukunft will Micron Zahlen bis zu 16 Gbit/s erreichen.

Der nächste Vorteil von GDDR5X ist das erhöhte Chipvolumen – von 8 auf 16 Gbps. Die GeForce GTX 1080 wird mit acht 8-GB-Chips geliefert, aber in Zukunft werden Grafikkartenhersteller in der Lage sein, die RAM-Menge zu verdoppeln, wenn leistungsfähigere Chips verfügbar werden. GDDR5X erlaubt wie GDDR5 die Verwendung von zwei Chips auf einem 32-Bit-Controller im sogenannten Clamshell-Modus, der es ermöglicht, 32 GB Speicher auf einem 256-Bit-GP104-Bus anzusprechen.

55

Die Maxwell-Architektur verfügt bereits über die umfangreichste GPU mit Unterstützung für neue Rendering-Funktionen im DirectX 12-Standard (Feature Level 12_1) auf den Markt. Pascal erweitert dieses Arsenal um einige weitere Optionen, die auch Potenzial für den Einsatz im VR-Bereich haben. Async Compute ist eine der Funktionen von DirectX 12, die bisher nur AMD-Prozessoren auf Basis der GCN-Architektur vorbehalten war und die dynamische Zuweisung von Ressourcen ermöglicht GPU zwischen Grafik- und Rechenlast, so dass die nach Abschluss einer der Aufgaben frei werdenden Ressourcen sofort für die verbleibende Aufgabe genutzt werden können.

Während AMD in mehreren Konfigurationen GPU Während NVIDIA auf die Synchronisation über den PCI-Express-Bus umgestellt hat, setzt NVIDIA bei SLI weiterhin auf eine separate Schnittstelle. Was jedoch der öffentlichen Aufmerksamkeit entgangen ist, ist die Tatsache, dass bei ausreichend hohen Abständen des Bildschirms GPU Einige Daten tauscht NVIDIA auch über PCI Express aus. Dies deutet darauf hin, dass SLI in der Form, die in früheren NVIDIA-Architekturen implementiert wurde, bereits seine Durchsatzgrenze erreicht hat. Nach unserem Kenntnisstand sind es 1 GB/s, was nicht mehr ausreicht, um Frames in einer Auflösung von 3840x2160 bei 60 Hz auszutauschen.

sm.sli.800

Doch statt komplett auf PCI Express umzusteigen, hat Pascal die bestehende Schnittstelle neu gestaltet. Traditionell verfügt eine NVIDIA-Grafikkarte über zwei SLI-Anschlüsse, die zur Kommunikation gleichzeitig betrieben werden GPU mit seinen Nachbarn in einer Dreifach- oder Vierfachkonfiguration, in einer Doppelprozessorkombination wird jedoch nur ein Kanal für die Datenübertragung verwendet. Verwenden Sie zwei Kanäle im Tandem GPU ist der offensichtlichste Weg, die Produktivität zu steigern, und genau das ist bei Pascal passiert.

NVIDIA hat auch eine spezielle Bridge herausgebracht, die in mehreren Versionen unterschiedlicher Länge erhältlich ist und verbesserte physikalische Eigenschaften aufweist, damit die Schnittstelle mit einer Frequenz betrieben werden kann, die von den vorherigen 400 MHz auf 650 MHz erhöht wurde.