Radeon R9 Wut X
Fury X ist die erste Lösung, die die neue Art von High Bandwidth Memory verwendet. HBM-Speicher übertrifft GDDR5-Speicher in jeder Hinsicht und bietet mehr Bandbreite bei geringerem Stromverbrauch und einer viel kleineren physischen Größe, was dazu beiträgt, kleinere Formfaktoren zu berücksichtigen.
Die Fiji-GPU, auf der die neue Grafikkarte basiert, verwendet den alten bewährten 28-nm-Prozess von TSMC, da der übergangsweise 20-nm-Prozess die Erwartungen nicht erfüllte und kaum Verbesserungen gegenüber 28 nm brachte.
Fiji ist der größte von AMD veröffentlichte ASIC geworden. Die Die-Fläche beträgt 596 mm2, was 36% größer ist als die Fläche von Hawaii (438 mm2) und fast gleich der Fläche von NVIDIA GM200 (601 mm2).
AMD hat nie interne Namen für Zwischenversionen von GCN veröffentlicht, aber basierend auf den Gesamtmerkmalen von Fidschi fällt es in die Kategorie, die informell GCN 1.2 genannt wird. GCN wurde erstmals in der Tahiti-GPU (Radeon HD 7970) eingeführt und hat einen doppelten Zweck: 3D-Grafik-Rendering und gleichermaßen General Purpose Computing (GP).GPU). Die letztgenannte Funktion ist auf das Vorhandensein von Hardware-Schedulern im Kern sowie auf die potenzielle Fähigkeit aller GCN-basierten ASICs zurückzuführen, Operationen mit doppelter Präzision (FP64) mit der halben Geschwindigkeit von FP1 auszuführen.
Beide Funktionen fressen einen erheblichen Teil des Transistorbudgets des Prozessors auf, was es ziemlich beeindruckend macht, dass AMD in der Lage war, Chips auf bis zu 8,9 Milliarden Transistoren zu skalieren, ohne von den Prinzipien abzuweichen, die in den frühen Tagen von GCN festgelegt wurden. Die FP64-Leistung in Consumer-Produkten auf Basis von Fidschi ist auf 1/16 von FP32 begrenzt, aber AMD wird sicherlich FirePro-Beschleuniger herausbringen, die die Fähigkeiten des neuen ASIC voll ausschöpfen werden.
Von den GCN 1.1-Produkten hat Fiji die flexible Steuerung von Frequenz und Versorgungsspannung geerbt GPU, ein XDMA-Block, der die Synchronisierung mehrerer ermöglicht GPU in CrossFre über PCIe-Bus und Audio-DSP TrueAudio.
Version 1.2 brachte Leistungsoptimierungen für GCN für geometrische Prozessoren sowie ein neues verlustfreies Farbkomprimierungsformat, das Speicherbusbandbreite spart. Darüber hinaus wurde es möglich, H.264-Videos mit einer Auflösung von zu kodieren und zu dekodieren Ultra HD.
Aufgrund der Konfiguration der Recheneinheiten lässt sich Fidschi am ehesten als Doppel-Tahiti beschreiben. Fidschi und Hawaii haben ein Verhältnis von 16:11 (ca. 45 % Steigerung) in Bezug auf die Anzahl der Shader-ALUs (Stream-Prozessoren) und Textureinheiten.
Ein solch ungewöhnliches Verhältnis in der Konfiguration von Shader-ALUs und Textureinheiten in Hawaii und Fidschi sieht verdächtig aus. Und das aus gutem Grund. Das Fidschi-Blockdiagramm zeigt die Anzahl der größten Bausteine GPU – Shader Engine – entspricht immer noch vier, aber die Lautstärke von jedem hat zugenommen. Somit wird das vordere Ende des Chips, das die Dreiecksrasterung durchführt, zu seinem Flaschenhals.
HBM ist ein Gemeinschaftsprojekt von AMD und SK Hynix, das beide Probleme durch zwei Technologien lösen soll: a) RAM-Chips in einen dreidimensionalen „Stapel“ packen; b) Verbindungen mit GPU über ein Siliziumsubstrat (Interposer).
Bei der mehrschichtigen Verpackung von Mikroschaltkreisen sind Leiter, die es ermöglichen, zwei übereinander angeordnete Siliziumchips zu verbinden, keine Überraschung mehr. Die Innovation von Hynix liegt in den Leitern, die durch mehrere Siliziumschichten verlaufen - TSVs (Through-silicon vias).
Seltsamerweise ist der Silizium-Interposer eine weniger ausgefeilte Technologie. Diese "Dichtung" wird auf Standard-Fotolithografiegeräten hergestellt, dies erfordert jedoch keine fortschrittlichen Technologien - ein Standard von 65 nm reicht aus. Silizium selbst spielt hier nur die Rolle eines Substrats, in das Kupferverbindungen eingelegt werden. Dann werden auf mikroskopisch kleinen Metallkugeln (Mikrobumps), die sich an den Stellen bilden, an denen die Verbindungen an die Oberfläche kommen, mehrschichtige Chips HBM und ASIC Fiji installiert.
Die HBM-Implementierung für auf Fidschi basierende Produkte umfasst vier „Stacks“ mit jeweils 1 GB, verbunden mit GPU 4096-Bit-Bus. Die Chips arbeiten mit einer Frequenz von 500 MHz mit DDR-Technologie (1 Gbit/s pro Leitung). Somit erreicht der resultierende Schnittstellendurchsatz 512 Gbit/s.
Technische Daten Radeon Radeon R9 Fury X
|
||||||
Chip
|
||||||
Frequenzen
|
||||||
Память
|
||||||
Schnittstelle und TDP
|
Fury X ist mit einem voll funktionsfähigen Fiji-Chip ausgestattet und hat eine offizielle TDP von 275 W. Oberes Taktlimit GPU beträgt 1050 MHz. Da HBM-Speicherchips auf einem gemeinsamen Substrat mit installiert sind GPUAuf der Außenseite der Platine befinden sich lediglich die Stromversorgung und die I/O-Anschlüsse. Daher hat die Radeon R9 Fury