Radeon R9 290X
Der neue Hawaii-Grafikchip im Herzen der AMD Radeon R9 290X-Grafikkarte basiert auf der uns bereits bekannten Graphics Core Next (GCN)-Architektur, die für Rechenleistung und zur vollständigen Unterstützung aller DirectX 11.2-Features leicht modifiziert wurde zuvor in Chip Bonaire (Radeon HD 7790) durchgeführt, der auch die Basis für die Radeon R7 260X wurde. Die architektonischen Änderungen in Bonaire und Hawaii beziehen sich auf Verbesserungen der Rechenleistung (Unterstützung für mehr gleichzeitig ausgeführte Threads) und eine neue Version der AMD PowerTune-Technologie, auf die wir weiter unten näher eingehen werden.
Zu den neuen Funktionen in DirectX 11.2 gehören Kachelressourcen, die die Hardwarefunktionen des virtuellen Speichers von Hawaii nutzen GPU, sogenannte teilweise residente Texturen (PRT). Mithilfe des virtuellen Videospeichers ist es einfach, effektive Hardwareunterstützung für Algorithmen zu erhalten, die es Anwendungen ermöglichen, große Mengen an Texturen zu verwenden und diese in den Videospeicher zu streamen. PRT ermöglicht es, die Effizienz der Videospeichernutzung bei solchen Aufgaben zu steigern, und ähnliche Techniken werden bereits in einigen Spiele-Engines verwendet.
Obwohl die Fähigkeiten von GCN erweitert wurden, stellt AMD die größte Herausforderung bei der Entwicklung eines neuen Top-End dar GPU Es gab eine Verbesserung der Energieeffizienz des Chips, da Tahiti bereits zu viel Strom verbrauchte und Hawaii über mehr Recheneinheiten verfügte. Sehen wir uns an, was die AMD-Ingenieure geschafft haben, um ein wettbewerbsfähiges Produkt auf den Markt zu bringen:
Der neue Grafikprozessor ist logisch in vier Teile (Shader Engine) aufgeteilt, die jeweils 11 erweiterte Recheneinheiten (Compute Unit) inklusive Texturmodulen, einen Geometrieprozessor und einen Rasterizer sowie mehrere ROP-Einheiten enthalten. Mit anderen Worten, das Blockdiagramm des modernsten AMD-Chips ist dem Diagramm von NVIDIA-Chips, die auch eine ähnliche Organisation haben, noch ähnlicher geworden.
Insgesamt umfasst der Hawaii-Grafikchip: 44 Compute Units mit 2816 Stream-Prozessoren, 64 ROP-Einheiten und 176 TMU-Einheiten. Berücksichtigt GPU verfügt über einen 512-Bit-Speicherbus bestehend aus acht 64-Bit-Controllern sowie 1 MB L28-Cache. Es wird mit der gleichen 6.2-nm-Prozesstechnologie wie Tahiti hergestellt, enthält aber bereits 4.3 Milliarden Transistoren (Tahiti hat XNUMX Milliarden).
Betrachten Sie ein Blockdiagramm der Shader-Engine, aus der die Hawaii-GPU besteht. Dies ist ein Large-Block-Teil des Chips, der vier dieser Engines enthält:
Jede Shader-Engine umfasst einen Geometrieprozessor und einen Rasterizer, die in der Lage sind, ein Geometrieprimitiv pro Taktzyklus zu verarbeiten. Es sieht so aus, als ob Hawaiis geometrische Leistung nicht nur zugenommen hat, sondern im Vergleich zu den vorherigen auch recht ausgeglichen sein sollte GPU AMD-Unternehmen.
Eine GCN-Architektur-Shader-Engine kann bis zu vier erweiterte Render-Back-Ends (RB)-Blöcke enthalten, die jeweils vier ROP-Blöcke enthalten. Die Anzahl der Compute Units in der Shader-Engine kann auch unterschiedlich sein, aber in diesem Fall sind es 11 davon, obwohl die Caches für Anweisungen und Konstanten auf jeweils vier Compute Units aufgeteilt sind. Das heißt, es wäre logischer, nicht 11, sondern 12 Recheneinheiten in die Shader Engine aufzunehmen, aber es scheint, dass eine solche Anzahl nicht mehr in Hawaiis Stromverbrauchsgrenzen enthalten war.
Die Recheneinheit der GCN-Architektur umfasst verschiedene Funktionseinheiten: Texturabrufmodule (16 Stück), Texturfiltermodule (vier Stück), eine Verzweigungsvorhersageeinheit, einen Scheduler, Recheneinheiten (vier Vektor- und eine Skalar), First-Level-Cache Speicher (16 KB pro Recheneinheit), Speicher für Vektor- und Skalarregister und gemeinsam genutzter Speicher (64 KB pro Recheneinheit).
Da die Hawaii-GPU über vier Shader-Engines verfügt, verfügt sie über insgesamt vier Geometrieverarbeitungseinheiten und Rasterisierungs-Engines. Dementsprechend das neue Oberteil GPU AMD kann bis zu vier geometrische Grundelemente pro Taktzyklus verarbeiten. Darüber hinaus hat Hawaii die Pufferung geometrischer Daten verbessert und die Caches für geometrische Grundparameter erhöht. Insgesamt führt dies zu einer erheblichen Leistungssteigerung bei großen Berechnungsmengen in Geometrie-Shadern und bei aktiver Nutzung der Tessellation.
Außerdem wurden einige Änderungen an den Rechenfunktionen des neuen, wenn auch grafischen, aber immer noch Prozessors vorgenommen. Der Chip enthält zwei DMA-Engines, die die volle Nutzung der PCI-Express-3.0-Busfähigkeiten ermöglichen, eine bidirektionale Bandbreite von 16 GB/s ist deklariert. Als relativ neu kann man auch die Möglichkeit des asynchronen Rechnens bezeichnen, das mittels acht (im Falle des Hawaii-Chips) Asynchronous Compute Engines (ACE) durchgeführt wird.
ACE-Blöcke arbeiten parallel zum Grafikbefehlsprozessor und jeder von ihnen ist in der Lage, acht Befehlsströme zu verwalten. Diese Organisation bietet unabhängige Planung und Betrieb in einer Multitasking-Umgebung, Zugriff auf Daten im globalen Speicher und L2-Cache sowie einen schnellen Kontextwechsel. Dies ist insbesondere bei Rechenaufgaben sowie bei Gaming-Anwendungen bei der Nutzung wichtig GPU sowohl für grafische als auch für allgemeine Computeranwendungen. Außerdem könnte diese Innovation theoretisch von Vorteil sein, wenn der Zugriff auf Funktionen auf niedriger Ebene genutzt wird GPU Verwendung von APIs wie Mantle.
Kommen wir zurück zu den Merkmalen von Hawaii, die sich auf das grafische Rechnen beziehen. Aufgrund steigender Genehmigungsanforderungen mit erwarteter Ausbreitung UltraHD-Monitore wird es notwendig, die Rechenkapazitäten von Rasteroperationseinheiten - ROP - zu erhöhen. Der Hawaii-Chip enthält 16 Render Back End (RBE)-Blöcke, doppelt so viele wie Tahiti. Sechzehn RBEs enthalten 64 ROPs, die bis zu 64 Pixel pro Takt verarbeiten können, was in manchen Fällen sehr nützlich sein kann.
Was das Speichersubsystem betrifft, so verfügt Hawaii über 1 Megabyte L16-Cache, der in 64 Abschnitte von 33 KB unterteilt ist. Behauptet als eine 2%ige Steigerung des Cache-Speichers und eine Steigerung des internen Durchsatzes um ein Drittel. Der Gesamtdurchsatz von L1 / L1-Caches wird mit XNUMX TB / s angegeben.
Der Speicherzugriff erfolgt über acht 64-Bit-Controller, die zusammen einen 512-Bit-Bus bilden. Die Speicherchips in der Radeon R9 290X sind mit 5.0 GHz getaktet, was eine Gesamtspeicherbandbreite von 320 GB/s ergibt, über 20 % höher als die Radeon HD 7970 GHz. Gleichzeitig wurde die vom Speichercontroller belegte Chipfläche im Vergleich zum 20-Bit-Controller in Tahiti um 384 % reduziert.
Radeon R9 290X-Spezifikationen
Name | Radeon R9 290X |
Kern | Hawaii |
Verfahrenstechnik (µm) | 0.028 |
Transistoren (Millionen) | 6200 |
Kernfrequenz | 1000 |
Speicherfrequenz (DDR) | 5000 |
Bus- und Speichertyp | GDDR5 512-Bit |
Bandbreite (Gb/s) | 320 |
Einheitliche Shader-Blöcke | 2816 |
Häufigkeit einheitlicher Shader-Einheiten | 1000 |
TMU pro Förderer | 176 |
ROP | 64 |
Füllrate (MPix/s) | 64600 |
Füllrate (Mtex/s) | 176400 |
DirectX | 11.2 |
Speicherkapazität | 4096 |
Schnittstelle | PCI-E 3.0 x16 |
Im Vergleich zum Vorgänger Radeon HD 7970 Hawaii-Performance angesichts der Radeon R9 290X wird um etwa 40-60% steigen.