Funktionen der Radeon HD 3870-Architektur

Es ist heute für niemanden ein Geheimnis, dass sich die erste Generation serienmäßig hergestellter Grafikprozessoren, die DirectX 10 unterstützen, sowie darauf basierende Videoadapter als äußerst erfolglos erwiesen – vor allem hinsichtlich der Leistung. Trotz der innovativen Architektur schnitten die ATI Radeon HD 2600 und die Nvidia GeForce 8600 bei Spielen bei weitem nicht mit den Besten ab und waren den Lösungen der vorherigen Generation oft unterlegen, wenn auch nicht so perfekt, aber ohne offensichtliche Engpässe in Form einer geringen Anzahl von Aktoren. sowie unzureichende Optimierungstreiber. Ein ebenso wichtiger limitierender Faktor war die Verwendung eines 128-Bit-Speicherbusses durch beide Giganten des Grafikmarktes, der eindeutig nicht in der Lage ist, Daten zu sättigen GPU in modernen Spielen, insbesondere bei Verwendung von FSAA und hohen Auflösungen.
Es schien, dass AMD, der derzeitige Eigentümer aller Vermögenswerte von ATI Technologies, sich mit der „Waffe der Vergeltung“ beeilen sollte, insbesondere angesichts der zunehmend prekären Lage des Unternehmens im Bereich der 2006D-Grafik für Verbraucher. Unter der Führung von AMD sank der Umsatz von ATI im zweiten Kalenderquartal 40 dieses Jahres im Vergleich zum zweiten Quartal 2006 um 19,1 %, während der Radeon-Marktanteil von ATI von 27,6 % zum Zeitpunkt der Ankündigung von ATI-AMD auf XNUMX % sank Fusion. Offensichtlich benötigte AMD dringend Maßnahmen, um die Situation zu korrigieren und wieder auf Kurs zu kommen. Kurze Ankündigung von Neuem GPU Der RV670 und die Etablierung von Massenlieferungen darauf basierender Lösungen könnten genau solche Maßnahmen sein, zumal der Prozessor bereits im August letzten Jahres erfolgreich getestet wurde, Advanced Micro Devices jedoch beschlossen hat, im Rahmen davon eine neue Linie von ATI Radeon HD auf den Markt zu bringen die Ankündigung einer neuen Gaming-Plattform mit dem Codenamen „Spider“. Der Start wurde wiederum wiederholt verschoben, da AMD Phenom-Prozessoren Probleme hatten, die erforderlichen Taktraten zu erreichen. Infolgedessen wurde die Ankündigung der Plattform auf den 19. November verschoben, und selbst zu diesem Zeitpunkt konnten die neuen AMD-Prozessoren nur die 2.30-GHz-Marke erreichen, und die Grafiksparte musste weiterhin Verluste hinnehmen. Kehren wir jedoch zum RV670 zurück, der, wenn auch mit Verzögerung, endlich das Licht der Welt erblickte.
Zuvor wurde ATI Technologies wiederholt und zu Recht für die Verwechslung der Namen seiner Produkte kritisiert. Da es sich um eine Abteilung von Advanced Micro Devices handelt, hat es seine Gewohnheiten bis heute nicht geändert. Es wurde erwartet, dass auf RV670 basierende Videoadapter Radeon HD 2950 heißen würden, was aus der Sicht des gesunden Menschenverstandes durchaus logisch wäre – der neue Chip konnte nicht als revolutionär bezeichnet werden; Es handelte sich um eine natürliche Weiterentwicklung des R600. Stattdessen wurde das Benennungssystem komplett geändert und die neue Familie wurde Radeon HD 3800 genannt, als ob sie darauf basieren würde GPU neue Generation. Das Vorhandensein der Unterstützung für DirectX 10.1 war nicht die Grundlage für die Vergabe des Status von „Lösungen der nächsten Generation“ an neue Produkte. Es wurde jedoch getan, und neue AMD ATI Radeon-Grafikkarten werden wie folgt gekennzeichnet:
ATI Radeon HD 3850
ATI Radeon HD 3870
ATI Radeon HD 3800: Architektur
AMD ging bei der Beherrschung subtilerer technischer Prozesse weiter als Nvidia – sein Chip wurde zum weltweit ersten Grafikprozessor mit 55-nm-Produktionsstandards, was es zumindest im älteren Radeon HD 700-Modell ermöglichte, die 3800-MHz-Marke souverän zu überschreiten. Gleichzeitig ist es mehreren gelungen, die Komplexität des Chips zu reduzieren, höchstwahrscheinlich durch die Optimierung der internen Architektur des Chips und die Vereinfachung der Topologie des Ringspeicher-Controllers, da im Hinblick auf die Anzahl der Funktionsblöcke RV670 entspricht R600. Dies ist das erste Mal seit langer Zeit, dass ein neues GPU Hinsichtlich der Transistoranzahl liegt ATI hinter der ähnlich eingestuften Nvidia-GPU zurück. Unter diesem Gesichtspunkt ist es ATI erneut gelungen, technologisch führend zu werden, aber wie schlagen sich die neuen Produkte im Vergleich zur GeForce 8800 GT?
Erstens ist die ATI Radeon HD 3800 der Nvidia GeForce 8800 GT in der Kernfrequenz überlegen, was jedoch durch eine geringere Anzahl an Funktionseinheiten, beispielsweise TMU, ausgeglichen wird. Ein wesentlicher Vorteil bei der Anzahl der Ausführungseinheiten ist, wie wir bereits wissen, nicht unbedingt ein solcher, und es geht nicht nur und nicht so sehr darum, dass die ALUs in Nvidia-Chips mit einer höheren Frequenz arbeiten: Die in Radeon HD implementierte VLIW-Architektur erfordert Besonders sorgfältige Treiberoptimierung zur Gewährleistung einer effizienten Parallelisierung des Shader-Codes. Andernfalls, wenn nicht alle ALUs mit unabhängigen Anweisungen geladen werden können, sinkt die Leistung der superskalaren Shader-Prozessoren von Radeon HD stark; Im schlimmsten Fall kann nur 1 von 5 ALUs in jedem der 64 solcher Prozessoren verwendet werden. Ironischerweise hat AMD/ATI Technologies die größten Schwierigkeiten mit der Softwareoptimierung, da es vor der offiziellen Veröffentlichung keinen Zugriff auf den Code von Spielen hat, die im Rahmen von Nvidias „The Way It's Meant To Be Played“-Programm entwickelt wurden. Oft wirkt sich dieser Sachverhalt direkt auf die Leistung von AMD/ATI-Grafiklösungen in Spielen aus, und natürlich nicht zum Besseren.
Wenn Sie sich ausschließlich auf das Blockschaltbild des RV670 konzentrieren, werden Sie keine Unterschiede zum R600 erkennen können. Sie liegen auf einer tieferen Ebene, daher sollten wir ausführlicher über sie sprechen. Zu den bemerkenswerten Unterschieden zwischen RV670 und R600 gehören die Unterstützung von DirectX 10.1 (Shader Model 4.1) und das Vorhandensein eines vollwertigen UVD-Hardware-Videoprozessors, ähnlich dem, der in der ATI Radeon HD 2600 enthalten ist.
Wie der R600 besteht jeder RV670-Shader-Prozessor aus sechs Einheiten – fünf ALUs und einer Einheit zur Ausführung von Flusskontrollanweisungen wie Verzweigungen, Übereinstimmungsprüfungen, Schleifen und Unterprogrammaufrufen. Darüber hinaus enthält es auch eine Reihe von Allzweckregistern
Von den fünf ALUs sind vier einfach und können einen FP-MAD-Befehl pro Taktzyklus ausführen, und die fünfte ALU kann zusätzlich komplexe Befehle wie SIN, COS, LOG, EXP usw. ausführen. Diese Architektur ist äußerst flexibel und hoch skalierbar, ihr Schwachpunkt ist jedoch die Abhängigkeit von Softwareoptimierungen. Obwohl die ATI Radeon HD-Grafikkerne über einen speziellen Aufgabenverteilungsmanager verfügen, hängt seine Wirksamkeit direkt von der Effizienz des Shader-Code-Compilers ab, der Teil der Treiber ist. Tatsache ist, dass die superskalare Architektur ihre größte Effizienz erreicht, wenn alle ALUs damit beschäftigt sind, unabhängige Operationen auszuführen, und dies ist ziemlich schwierig zu erreichen, da in 3D-Anwendungen viele Operationen von den Ergebnissen vorheriger Operationen abhängen.
Auch architektonisch unterscheiden sich die Textur- und Rasterprozessoren der ATI Radeon HD 3800 nicht von ähnlichen Einheiten der ATI Radeon HD 2900. Da es sich um komplexe Geräte handelt, kann über ihre Gleichwertigkeit mit herkömmlichen TMUs und ROPs nur annähernd gesprochen werden. Insgesamt verfügt der RV670 über vier große Texturprozessoren, von denen jeder die folgenden Blöcke enthält:
8 Texturadressierungseinheiten
20 Textur-Sampling-Einheiten
4 Texturfiltereinheiten
Jeder der RV670-Rasterprozessoren enthält:
4 Arbeitsblöcke mit Alphakanal und Nebel
8 Arbeitsblöcke mit Z- und Schablonenpuffern
4 Mischblöcke
16 Multisampling-Verarbeitungseinheiten
Damit entspricht er in etwa 4 klassischen ROPs und kann pro Takt vier Pixel verarbeiten, also insgesamt 16, da es insgesamt vier solcher Prozessoren gibt. Bei der Arbeit mit einem Z-Puffer, also Pixeln, die keine Farbdaten enthalten, verdoppelt sich die Leistung und beträgt 32 Pixel pro Taktzyklus. Ebenso wie die Texturmodule wurden auch bei den RV670-Rasterprozessoren einige gravierende Änderungen vorgenommen, die ihnen die Unterstützung von DirectX 10.1-Funktionen verleihen.
Der Speichercontroller des RV670 wurde verbessert und der neue Chip nutzt die Speicherbandbreite wesentlich effizienter, sodass er auf Augenhöhe mit dem R600 konkurrieren kann. In der Praxis können wir jedoch nur eine Verringerung der Breite des externen Speicherbusses von 512 auf 256 Bit sowie eine Verringerung der Gesamtbreite der internen Ringbusse des Controllers von 1024 auf 512 Bit feststellen. Etwas subtilere Änderungen bleiben uns leider verborgen, und wir können nicht sagen, ob die behauptete vergleichbare Leistung des RV670 und des R600 darauf zurückzuführen ist oder auf die ineffiziente Nutzung der Speichersubsystemfunktionen des letzteren. Wir neigen zur zweiten Option, da das Vorhandensein eines externen 512-Bit-Speicherbusses mit einer Bandbreite von über 100 GB/s unter realen Gaming-Bedingungen der ATI Radeon HD 2900 XT oft keine Vorteile verschaffte.
Der ATI RV670 ist außerdem die weltweit erste Desktop-GPU, die die gleichen erweiterten Energieverwaltungsfunktionen wie die mobilen Grafikkerne von ATI bietet. Dank der ATI PowerPlay-Technologie kann der neue Chip seine Frequenzen und die Versorgungsspannung flexibel steuern und sogar ungenutzte Blöcke abschalten, wenn die Belastung des Kerns gering ist. Im Gegensatz zu anderen Desktops GPUDie Unterstützung für Energiesparfunktionen im RV670 ist auf Hardwareebene implementiert, was eine schnellere Reaktion auf Laständerungen ermöglicht und Fehler bei der Bestimmung des GPU-Betriebs eliminiert.
In der Geschichte von ATI Technologies gab es bereits Fälle, in denen das Unternehmen einen Standard unterstützte, der zuvor nicht weit verbreitet war. Somit unterstützte die ATI Radeon 8500 die Pixel Shader 1.4-Spezifikationen, die Teil von DirectX 8.1 waren. Diese Spezifikationen waren deutlich flexibler als die von Nvidia-Chips unterstützten PS1.0/1.1/1.3 und ermöglichten bessere Spezialeffekte, wurden aber aufgrund der begrenzten Unterstützung während des Lebenszyklus der ATI Radeon 8000 A ähnlich von Spieleentwicklern nie weit verbreitet Das Schicksal ereilte die Shader Model 2.0b-Unterstützung, die in der ATI Radeon X700/X800/X850-Familie implementiert wurde, sowie die von Nvidia geförderte Shader Model 2.0a in der GeForce FX-Familie. DirectX 9 Shader Model 3.0 erlangte erst nach dem Erscheinen von Game-Ports der Microsoft Xbox 360- und Sony PlayStation 3-Spielekonsolen nennenswerte Verbreitung, was eindeutig außerhalb des Lebenszyklus der GeForce 6 und der frühen GeForce 7 lag.
DirectX 10.1 wurde die erste und letzte Untergruppe von DirectX 10. Es wurde offiziell in aufgenommen Windows Vista mit Service Pack 1
Wichtige Neuerungen in DirectX 10.1:
Unterstützung für Arrays von Cubemaps: Ermöglicht Ihnen eine akzeptable Geschwindigkeit bei der Verwendung globaler Szenenbeleuchtung, indem Sie in einem Rendering-Durchgang auf mehrere Cubemaps zugreifen. Diese globale Beleuchtungsmethode umfasst die Berechnung indirekter diffuser Beleuchtung, Brechungen, weicher Schatten und eine genauere Berechnung von Reflexionen.
Verbesserte verzögerte Rendering- und FSAA-Techniken: Unterstützung für unabhängige Mischmodi für jedes MRT, obligatorische Unterstützung für MSAA 4x, Unterstützung für das Schreiben von Pixelabdeckungsmasken aus dem Shader, Auswahl von Musterbeispielen, Abtastung aus dem Multisampling-Puffer, Unterstützung für Filter zur Identifizierung erforderlicher Pixel Kantenglättung.
Die Anzahl der Vertex-Shader-Register wurde erhöht: Die neuen Spezifikationen sehen 32 Register statt 16 in den DirectX-10-Spezifikationen vor.
Gather4-Unterstützung: Ähnlich der Fetch4-Funktion in der ATI Radeon X1000 ermöglicht sie das Abrufen eines Blocks von 4 Pixeln (2x2) für eine Einzelkomponententextur. Dient dazu, die Arbeit mit Schattenkarten zu beschleunigen und die Qualität der Schatten zu verbessern.
Verbesserte Misch- und Filtertechniken: Unterstützung für die LOD-Anweisung, die den Detaillierungsgrad für ein gefiltertes Texturbeispiel zurückgibt, eingeführte Unterstützung für INT16 zum Mischen und FP32 zum Filtern (INT8 und FP16 in DirectX 10)
Die RV670-GPU verfügt über eine beeindruckende Kerngröße – obwohl sie aus 666 Millionen Transistoren besteht, beträgt ihre Fläche nur 192 Quadratmillimeter (13.7 x 14 mm). Dies zeigt deutlich, wozu der neue 55-nm-Prozess in der Lage ist. Außer dem ATI-Logo und dem Herstellungsdatum enthält der Kern keine für den Endbenutzer aussagekräftigen Informationen. Unser Exemplar wurde in Woche 39 des Jahres 2007 hergestellt, die vom 23. bis 29. September fiel. Da ATI Radeon HD-GPUs trotz der Tatsache, dass verschiedene Domänen mit 26 verschiedenen Frequenzen arbeiten, keine unterschiedlichen Taktraten für verschiedene Teile des Chips angeben, ist es üblich, nur die „Hauptfrequenz“ des Chips anzugeben; bei der Radeon HD 3870 sind es 775 MHz. Die Verpackung des Kristalls verfügt über keinen Schutzrahmen, daher sollte beim Ein- und Ausbau des Kühlsystems darauf geachtet werden, ein Absplittern des Kerns zu vermeiden.
Hinsichtlich der Blockkonfiguration gibt es keine Unterschiede zur ATI Radeon HD 2900 XT: Der Chip enthält 320 ALUs, gruppiert in 64 superskalare Recheneinheiten zu je 5 ALUs. Darüber hinaus sind 4 ALUs in jedem dieser Blöcke in der Lage, einfache Anweisungen wie MAD (Multiply+Add) auszuführen, und die fünfte, komplexere ALU kann auch transzendente Anweisungen wie SIN, COS, LOG, EXP usw. ausführen. Darüber hinaus enthält jeder Rechenprozessor eine Verzweigungssteuereinheit, die für die Ausführung von Flusskontrollanweisungen (Vergleiche, Schleifen, Unterprogrammaufrufe usw.) verantwortlich ist. Der einzige Unterschied zum R600 besteht in diesem Fall in der Unterstützung der erweiterten Funktionen von DirectX 10.1 (Shader Model 4.1).
Technische Daten ATI Radeon HD 3870
Name | Radeon HD 3870 |
Kern | RV670 |
Verfahrenstechnik (µm) | 0.055 |
Transistoren (Millionen) | 666 |
Kernfrequenz | 775 |
Speicherfrequenz (DDR) | 1125 (2250) |
Bus- und Speichertyp | GDDR4 256-Bit |
Bandbreite (Gb/s) | 72 |
Einheitliche Shader-Blöcke | 320 |
Häufigkeit einheitlicher Shader-Einheiten | 775 |
TMU pro Förderer | 16 (insgesamt) |
ROP | 16 |
Texturen pro Uhr | 16 |
Texturen pro Durchgang | 16 |
Shader-Modell | 4.1 |
Füllrate (MPix/s) | 12400 |
Füllrate (Mtex/s) | 12400 |
DirectX | 10.1 |
Kantenglättung (max.) | MS-24x |
Anisotrope Filterung (max.) | 16x |
Speicherkapazität | 512 |
Schnittstelle | PCI-E 2.0 |
RAMDAC | 2x400 |
Obwohl die Grafikkarten ATI Radeon HD 3870 und ATI Radeon HD 3850 über eine gute Leistung verfügen, hinterließ die Positionierung des Modells HD 3870 einen sehr unangenehmen Beigeschmack. Wie sich herausstellte, hatten wir anstelle der Konkurrenz zwischen den Produkten GeForce 8800 GT 512 MB und Radeon HD 3870 die Zurückhaltung von AMD, mit Nvidia zu konkurrieren. ATI konkurrierte immer noch nicht in Bezug auf die Geschwindigkeit, sondern in Bezug auf den Preis.
Need for Speed Pro Street