3DMark 2006

Baujahr: 2006
Entwickler: Futuremark Corporation
Plattform: PC
Minimale Systemanforderungen:
Betriebssystem: Microsoft Windows 2000 oder XP Betriebssystem
Prozessor: x86-kompatibler Prozessor mit MMX-Unterstützung, 2000 MHz
Arbeitsspeicher: (512 MB empfohlen)
DIRECTX: DirectX9.0c oder höher (erforderlich)
Dies zeigt sich auch daran, dass drei der vier sogenannten „Grafiktests“ dieses Pakets nichts anderes als verbesserte Versionen der 3DMark05-Spieletests sind. Tatsächlich sind die Unterschiede zwischen der neuen und der alten Version weniger qualitativer als quantitativer Natur: Zu den grundlegend neuen Funktionen zählen die Unterstützung von HDR, Uniform Shadow Maps und Multi-Core CPU und ein Schwerpunkt auf der Verwendung von Shader Model 3.0, wenn auch nicht ausschließlich – 2 von 2.0 Grafiktests werden innerhalb von Shader Model XNUMX ausgeführt.
Die restlichen Änderungen sind quantitativer Natur: Erneut wurden die Details der Testszenen, die Anzahl der Lichtquellen, die Komplexität der verwendeten Shader, die Auflösung von Texturen usw. erhöht. Daher konzentriert sich das allgemeine Konzept von 3DMark06 auf SM3.0-kompatible GPUs.
3DMark06: Grafik-Engine-Funktionen
Wie Sie wissen, wurde für 3DMark05 eine neue Grafik-Engine entwickelt, die nichts mit der zuvor verwendeten MAX-FX-Engine gemein hat, sondern viel mehr Ähnlichkeit mit echten Spiele-Engines hatte. Die 3DMark06-Engine ist ihre Modifikation, die volle Unterstützung für Shader Model 3.0 sowie Texturen und Blending im FP16-Format erhielt. Die letzten beiden Punkte bedeuten nichts anderes als die Möglichkeit, HDR zu nutzen. Futuremark prognostiziert, dass High Dynamic Range Support in Spielen der nächsten Generation weit verbreitet sein wird, obwohl die Anzahl solcher Spiele derzeit sehr gering ist. Wie in 3DMark05 werden die Shader, aus denen ein bestimmtes Material besteht, dynamisch im HLSL-Format generiert. Sie werden dann automatisch oder nach einem benutzerdefinierten Profil optimal auf die im System installierte GPU kompiliert.
Die Unterstützung von Texturen und Blending im FP16-Format ist ausschließlich für SM3.0-Grafiktests erforderlich. Diese Tests verwenden auch die FP16-Filterung, aber wenn GPU Dieses Feature nicht unterstützt, wird zur Emulation ein spezieller Shader verwendet, der es Karten auf Radeon X3.0-Basis ermöglicht, die SM1000/HDR-Tests zu bestehen, da diese GPUs keine Texturfilterung im Gleitkommaformat unterstützen. SM3.0/HDR-Grafiktests verwenden eine Nachbearbeitung, bei der dem Bild folgende Effekte überlagert werden: ein Bloom-Effekt, ein „Stern“-Effekt, der einen Kameraverschluss mit sechs Lamellen emuliert, sowie ein Reflexionseffekt, der auftritt Linsen. Abschließend durchläuft das resultierende Bild einen Tone-Mapping-Prozess, um die richtigen Farbwerte für herkömmliche Displays zu erhalten.
Das neue Testpaket nutzt laut Entwickler bis auf das vFace-Register alle wesentlichen Features von SM3.0:
-vpos registrieren
-Abgeleitete Anweisungen
-Dynamische Flusskontrolle
-Eine große Anzahl von Interpolatoren
-Eine große Anzahl von Konstanten
-Mehr Unterrichtsfächer
-Texturanweisungen mit explizitem LODVertex
-Texturabruf aus dem Vertex-Shader (erforderlich, um den Shader-Partikel-Test zu bestehen)
Dynamische Schatten sind seit 3DMark2001 in den Grafiktestsuiten von Futuremark aufgetreten. Dann wurden sie mithilfe von Projektionsschattenkarten erstellt, was eine ziemlich anspruchslose Methode war, die eine Reihe von Einschränkungen aufwies, insbesondere konnte das Objekt keinen Schatten auf sich selbst werfen. Außerdem wurde der Schatten auf alle Flächen unterhalb des Objekts projiziert, sogar auf den Boden des Raums mehrere Stockwerke tiefer. 3DMark03 verwendet eine andere Technik zur Erzeugung dynamischer Schatten, die sogenannten Stencil Shadows. Diese Methode funktioniert anders: Die Kanten des Objekts, von der Seite der Lichtquelle aus gesehen, werden als Polygon ohne Beleuchtung hervorgehoben. Alles, was sich im Volumen dieses Polygons befindet, liegt im Schatten. Diese Technik ist frei von den Nachteilen der vorherigen und ermöglicht es dem Objekt, einen Schatten auf sich selbst zu werfen, aber sie ist nicht universell und eignet sich nur für bestimmte Arten von Szenen und für Low-Poly-Objekte.
Tatsache ist, dass das Abtasten der Kanten des Objekts, das zum Volumen des Schattens werden soll, ein ziemlich ressourcenintensiver Vorgang ist, und die Polygone, die diese Volumen bilden, verbrauchen einen großen Teil der Szenenfüllgeschwindigkeit, obwohl sie unsichtbar sind.
Im 3DMark05 wurde eine neue Methode zur Erzeugung dynamischer Schatten angewendet, die sogenannte LiSPSM-Maps (Light Space Perspective Shadow Maps) verwendet. 3DMark hat diese Technik durch die Verwendung eines anderen Typs von Schattenkarten namens Cascaded Shadow Maps oder CSM verbessert. Die Verwendung von CSM ermöglicht es Ihnen, Schatten für alle Objekte auf dem Bildschirm zu erhalten, unabhängig von ihren Winkeln.
Bei dieser Methode wird der Ansichtskegel entlang der Z-Achse in fünf Abschnitte unterteilt. Jeder Abschnitt wird mit einer einheitlichen Standard-Schattenkarte im Format 5 x 2048 schattiert. Wenn GPU Unterstützt Tiefentexturen, wird eine Tiefenkarte im D24X8- oder DF24-Format verwendet, andernfalls wird die R32F-Komponente der Textur in einer 32-Bit-Gleitkommadarstellung als Tiefenkarte verwendet. Hardware-Shading ist standardmäßig aktiviert (außer beim D24X8 in den SM3.0/HDR-Tests), kann aber auf Wunsch des Benutzers deaktiviert werden.
Jede Methode hat ihre Nachteile. Obwohl die Auflösung von Tiefenkarten sehr hoch ist, reicht diese manchmal nicht aus, und wie beim 3DMark05 kann es teilweise zu einem Flimmern an den Rändern des Schattens kommen – dem sogenannten Projection Aliasing (Projektions-Aliasing). Dieses Phänomen kann auftreten, wenn die Richtung der Normalen senkrecht oder fast senkrecht zur Beleuchtungsrichtung ist. Derzeit ist es fast unmöglich, es ohne erhebliche Leistungseinbußen loszuwerden.
Um Schattenkanten in der neuen Engine zu glätten, verwenden die SM3.0/HDR-Tests ein Array bestehend aus 16 Samples (4x4). Für jedes Schattenkantenpixel wird dieses Array um einen zufälligen Winkel gedreht. Das Vorhandensein von 16 Referenzpunkten verbessert die Qualität der Schattenglättung, erfordert jedoch zusätzliche Hardwareressourcen. Punktstichproben werden sowohl für Hardware-Schattenkarten als auch für R32F-Schattenkarten verwendet. Die SM2.0-Tests verwenden einen kleineren Kern bestehend aus 4 Pixeln (2x2), aber wenn GPU Hardware unterstützt Samples aus dem Tiefenpuffer im D24X8-, DF24- oder Fetch4-Format, es wird nur ein bilineares Sample entnommen. Die Qualität der Glättung variiert etwas. Falls der Benutzer die Rendering-Leistung verschiedener Architekturen vergleichen möchte, kann die Hardware-Shadow-Mapping deaktiviert werden; In diesem Fall werden dynamische Schatten immer mit R32F-Tiefenkarten erstellt und ihr Anti-Aliasing erfolgt durch vier Samples.
Das Generieren dynamischer Schatten mit Tiefenkarten macht beim 3DMark06 Sinn, da diese Methode laut Futuremark bereits von Spieleentwicklern genutzt wird und weiter genutzt wird. Bei der Texturkomprimierung werden alle Farbkarten in 3DMark06 mit dem DXT1-Algorithmus komprimiert, Alpha-Karten werden mit dem DXT3-Algorithmus komprimiert und normale Karten werden mit dem DXT5-Algorithmus komprimiert. Die 3Dc-Methode, die spezifisch für ATI Radeon X700- und höhere Karten ist, wird nicht unterstützt.
3DMark06: Grafikbenchmarks
Insgesamt gibt es im neuen Futuremark-Paket vier Grafiktests, die sich in zwei Gruppen aufteilen. Der erste arbeitet im Rahmen von SM2.0, der zweite ist darauf ausgelegt, vom SM3.0-Grafikbeschleuniger unterstützt zu werden. Beginnen wir der Reihe nach mit SM2.0-Tests. Der erste SM2.0-Grafiktest ist eine überarbeitete Version des ersten Spieletests „Return to Proxycon“, der in 3DMark05 enthalten war. Die im Test gezeigte Szene gehört zum Genre der Sci-Fi-XNUMXD-Shooter. Eine Gruppe Space Marines, unterstützt von schwer gepanzerter Infanterie, greift die Raumstation Proxycon an und erobert sie, um ein Artefakt zu extrahieren (die Szene damit ist im Modus zu sehen). Demo). Im Vergleich zum Original hat sich die Anzahl der Lichtquellen deutlich erhöht (26 gegenüber 8), die Auflösung der Shadow Maps hat zugenommen und die Detailgenauigkeit der Szene ist höher geworden.
Der Test ist im Vergleich zu modernen Schützen etwas untypisch - bei letzteren sind solche großflächigen Freiflächen und Schlachten selten. Das auffälligste Beispiel dafür ist Doom III mit seinen zahlreichen schmalen Korridoren und seltenen Lücken in geräumigen Räumen. Ausnahmen im Sci-Fi-Shooter-Genre sind heute selten, kommen aber immer noch vor. In Starship Troopers sieht man beispielsweise auch größere Szenen mit 200-300 Feindmodellen im Bild.

Auch der zweite SM2.0-Grafiktest ist nicht neu – sein Vorläufer ist der zweite 3DMark05-Gaming-Test „Firefly Forest“. Grundlage des Tests ist nach wie vor dynamisch generierte Vegetation, von der es im Test jede Menge gibt. Obwohl der Szenenraum in diesem Fall sehr begrenzt ist, kann er aufgrund der großen Vegetationsmenge als gutes Testgelände für die Leistung dienen GPU beim Anwenden von Schatten und Arbeiten mit Beleuchtung, Beurteilung der Effizienz von Scheitelpunktprozessoren sowie Zentralprozessoren des Systems;). Im Vergleich zum ähnlichen 3DMark05-Test tauchte im Test ein weiteres „Glühwürmchen“ auf, die Methode zum Anwenden von Schatten wurde geändert und die Auflösung von Tiefenkarten/Hardware-Schattenkarten erhöht.

Die folgenden beiden Tests verwenden ausschließlich das SM3.0-Profil und funktionieren daher nur auf Grafikkarten, die Shader Model 3.0 unterstützen. Der erste SM3.0-Grafiktest ist nichts anderes als eine deutlich überarbeitete und verbesserte Version des dritten 3DMark03-Spieletests namens „Canyon Flight“. In dieser Testszene kommt HDR zum Einsatz, unter anderem beim Ausarbeiten von Reflexionen/Refraktionen (Brechung).
Die Wasseroberfläche verwendet wie zuvor Tiefennebel, um die Illusion von Tiefe zu erzeugen, aber zusätzlich wird ihre Oberfläche mit zwei scrollenden Normalkarten und vier vier Gerstner-Wellenfunktionen verzerrt, was dazu führt, dass Wasser sehr realistisch aussieht. Komplexer heterogener Nebel wird verwendet, um ein feuchtes Klima zu simulieren. Außerdem ist der Algorithmus zum Rendern des Himmels kompliziert. Die Szene hat immer noch nur eine Lichtquelle – die Sonne, aber aufgrund des großen Maßstabs und der komplexen Form der Schluchtwände ist es sehr schwierig, dynamische Schatten anzuwenden.

Der zweite SM3.0-Grafiktest sucht seinesgleichen in früheren Versionen von 3DMark und ist komplett neu. Es demonstriert den Einsatz von HDR und dynamischen Schatten in großen Bereichen am Beispiel einer verlassenen Arktisstation. Das Hauptmerkmal des Tests ist der Tageswechsel, bei dem man die Verlängerung der von Objekten geworfenen Schatten beobachten kann, was die Flexibilität der CSM-Methode demonstriert. Snow verwendet ein Blinn-Phong-Schattierungsmodell, 2 normale Karten und 1 Farbkarte und einen Streueffekt unter der Oberfläche, der es fast nicht von der Realität zu unterscheiden macht. Außerdem kann der Test als Indikator für die Leistung des Grafikadapters bei der Arbeit mit Partikelsystemen dienen - mit ihrer Hilfe wird ein Schneesturm in der Szene simuliert.

3DMark06: CPU-Benchmarks
Eines der Merkmale des neuen 3DMark06 ist die neue Ideologie zur Berechnung des endgültigen Index. Während die vorherige Version dieses Benchmarks ein Endergebnis lieferte, das ausschließlich auf der Leistung des Grafiksubsystems basierte, wird der 3DMark06-Index sowohl auf Grundlage der Messwerte des Grafiktests als auch der CPU-Tests berechnet. Das heißt, das Endergebnis des Tests hängt sowohl von der Geschwindigkeit der Grafikkarte als auch von der Leistung ab. CPU.

Diese Innovation ist auf den Wunsch der Entwickler zurückzuführen, den 3DMark06 nicht nur zu einem Benchmark zur Bestimmung der relativen Leistung des Video-Subsystems zu machen, sondern auch zu einem Maß für die Leistung der gesamten Plattform in Bezug auf moderne 3D-Spiele. Dieser Ansatz hat eine völlig logische Berechtigung: Moderne Spieleanwendungen stellen mittlerweile ziemlich hohe Anforderungen nicht nur an die Grafikleistung, sondern auch an die Leistung der Rechenressourcen des zentralen Prozessors. Es wird erwartet, dass sich dieser Trend auch in Zukunft fortsetzen wird, da Entwickler von Spielesoftware den Themen der hochwertigen Modellierung der physischen Umgebung und der künstlichen Intelligenz von im Spiel operierenden Objekten immer mehr Aufmerksamkeit schenken werden.
Also der Test CPU im 3DMark06 ist zu einem integralen und wichtigen Bestandteil geworden. Vor diesem Hintergrund haben die Futuremark-Programmierer diesen Test realistischer gestaltet. Es ist kein Geheimnis, dass beispielsweise der Test CPU im 3DMark05 hatte wenig mit der Gaming-Leistung zu tun. Das ist überhaupt nicht überraschend: Die Prozessorleistung wurde mit konstruierten Algorithmen gemessen, die nichts mit der Realität zu tun hatten. Insbesondere wurde der Prozessorindex im 3DMark05 basierend auf den Ergebnissen des Prozessors berechnet, der Vertex-Shader ausführte. Die üblichen CPU eine Spielaufgabe, nicht wahr?
Das Problem bei der Bewertung der Prozessorleistung in früheren 3DMark-Tests bestand darin, dass ihnen spezielle Algorithmen fehlten, die denen in echten Spielen ähnelten. Im neuen 3DMark06-Test wurde dieser Mangel behoben. 3DMark06-Prozessortests basieren auf speziellen Algorithmen, die direkt mit der Belastung zusammenhängen CPU in 3D-Spielen.
Die Messung der Prozessorleistung im 3DMark06 erfolgt durch die Simulation einer realen Spielsituation, die die Designer im Red-Valley-Benchmark nennen. Die Action in diesem Test findet rund um eine Festung statt, die zwischen zwei Bergen eingeklemmt ist. Der Fuß dieser Berge ist mit Schluchten übersät, entlang derer Hochgeschwindigkeitsautos rasen, deren Aufgabe es ist, zur Festung durchzubrechen, Kollisionen zu vermeiden und feindliche Streitkräfte zu verteidigen. Die Verteidigung dieses Außenpostens erfolgt über eine Art fliegende Panzer, die zwar langsam, aber mit Kurzstreckenraketen bestückt sind. Insgesamt nehmen 87 Bots dieser beiden Typen an der Red Valley-Szene teil.
Die Grafikausgabe während des Prozessor-Benchmarks übernimmt vollständig das Video-Subsystem. Um den Einfluss der Grafikleistung auf das Ergebnis von Prozessortests zu reduzieren, wird eine Auflösung von 640 x 480 verwendet und zusätzlich dynamische Schatten deaktiviert. Gleichzeitig ist der Prozessor ausschließlich mit seinen typischen Funktionen beschäftigt: Er ist mit Spiellogik betraut, modelliert die physische Umgebung und stattet Bots mit künstlicher Intelligenz aus. Physik in Red Valley wird mit der AGEIA PhysX-Bibliothek berechnet, die derzeit bei Spieleentwicklern sehr beliebt ist, während die Intelligenz von Bots durch das Lösen von Problemen zum Finden von Pfaden in einem Diagramm erreicht wird.
Anzumerken ist, dass der Prozessortest aufgrund der Vielzahl intelligenter Bots, die Red Valley bevölkern, etwas an eine Echtzeitstrategie erinnert. Es sollte jedoch klar sein, dass 3DMark06 nicht wie moderne Spiele sein soll. Der Zweck dieses Benchmarks besteht darin, zukünftige Spieleanwendungen zu simulieren, von denen die Futuremark-Entwickler glauben, dass sie eine viel größere Anzahl aktiver intelligenter Objekte aufweisen werden als moderne Spiele.
Um die Spiele von morgen zu realisieren, mussten die Entwickler von 3DMark06 den Prozessortest für modernste Dual-Core-Prozessoren optimieren. Darüber hinaus ist dieser Test in der Lage, effizient zu laden und CPU mit einer großen Anzahl von Kernen, zumal die Aufgabe, optimale Pfade für eine große Anzahl von Objekten zu finden, leicht parallelisiert werden kann. Im Allgemeinen werden die Berechnungen im Prozessortest wie folgt in Threads aufgeteilt: Ein Thread berechnet die Spiellogik und steuert den Zählvorgang, der zweite Thread simuliert die Physik der Umgebung, die restlichen Threads (ihre Anzahl hängt von der Anzahl der Rechenkerne im System ab) lösen die Probleme der Suche nach optimalen Pfaden.
Beim Testen von Prozessoren im 3DMark06 nimmt die Red-Valley-Szene zweimal mit unterschiedlichen Algorithmuseinstellungen teil. Das erste Mal werden mehr Ressourcen für die Modellierung künstlicher Intelligenz aufgewendet, das zweite Mal liegt der Schwerpunkt auf der Berechnung der Physik der Umgebung.
3DMark06: theoretische Tests
Als Teil dieser Kategorie enthält 3DMark06 alle theoretischen Tests, die Teil von 3DMark05 waren, sowie zwei neue Tests – Shader Particles Test (SM3.0) und Perlin Noise (SM3.0). Wie der Name schon sagt, benötigen beide Tests Shader Model 3.0-Unterstützung, um zu funktionieren.
Shader-Partikeltest (SM3.0) - erinnert ein wenig an den Partikelsystemtest von 3DMark 2001, nutzt aber im Gegensatz zu diesem die Fähigkeiten von Shader Model 3.0. Das physikalische Modell des Partikelverhaltens wird unter Verwendung von Pixel-Shadern berechnet, dann wird ihre Visualisierung unter Verwendung der Textur-Sampling-Funktion von Vertex-Shadern durchgeführt. Mittels Euler-Integration werden die Bahnen von 409600 Teilchen in einem einfachen Gravitationsfeld bei mittlerem Widerstand berechnet und die Kollision dieser Teilchen mit dem Höhenfeld überprüft. Zusätzlich zur Shader Model 3.0-Unterstützung erfordert der Test, dass die GPU in der Lage ist, Texturen von Vertex-Shadern (Vertex Texture Fetch) abzurufen, daher funktioniert er nur auf Karten mit der GeForce 6/7-Architektur – ATI Radeon X1000 unterstützt kein VTF.
Perlin-Rauschen (SM3.0) - nutzt sogenanntes 3D-Perlin-Rauschen, um realistisch wechselnde Wolken zu simulieren. Perlin-Rauschen ist häufig die Grundlage für prozedurale Texturen und einige Modellierungstechniken und wird in Zukunft nur noch beliebter, da die mit seiner Hilfe erzeugten Effekte zwar eine hohe Rechenleistung erfordern, das Speichersubsystem des Videoadapters jedoch relativ wenig belasten , deren Leistung deutlich langsamer wächst GPU. Der in diesem Test verwendete Pixel-Shader besteht aus 495 Anweisungen, davon 447 arithmetische Anweisungen und 48 Textur-Lookups. Als Referenz: Die Mindestspezifikationen, die in den SM3.0-Standard passen, erfordern die Unterstützung von Shadern mit einer Länge von bis zu 512 Anweisungen. Alle Texturanweisungen erstellen eine einzelne 32-Bit-Textur mit einer Auflösung von 256 x 256. Sein Volumen beträgt nur 64 KB, sodass der Test hinsichtlich der Größe und Frequenz des Videospeichers anspruchslos ist.
Alle anderen Tests, einschließlich Batch-Size-Tests, bleiben gleich.




