Gerätebeschreibung AMD Radeon HD 7800-Serie. Referenzinformationen zu AMD Radeon-Grafikkartenfamilien. Übertaktung und Temperaturen

7800-Serie mit voneinander abweichenden Merkmalen. Der auf der Graphic Core Next-Mikroarchitektur erstellte Chip nimmt einen Platz ein, der 2,8 Milliarden Transistoren entspricht. Wie die meisten Radeon-Karten verfügt sie über die Eyefinity-Technologie, die den gleichzeitigen Anschluss von bis zu sechs Monitoren ermöglicht. Sie können unabhängig voneinander arbeiten oder einen großen Monitor bilden. Es hängt alles davon ab, welche Einstellungen vorgenommen werden.

Radeon 7850

Diese Grafikkarte der AMD 7800-Serie verfügt über eine Prozessorfrequenz von 800 Megahertz. Für hohe Leistung und Durchsatz (153 Gigabit pro Sekunde) sorgt ein 256-Bit-Bus. Das Computersystem verarbeitet Daten im Wert von 1,76 Teraflops. Es gibt 16 Recheneinheiten und 64 Textureinheiten. Es gibt zwei Kerne für Rechenprozesse.

Das Speicherformat entspricht der GDDR5-Kennzeichnung und die Unterstützung von DirectX Version 11 trägt dazu bei, die Interaktion mit Betriebssystemanwendungen zu beschleunigen. Um die Leistung der Karte besser zu optimieren, ist es notwendig, Treiberaktualisierungen zu überwachen, da nur diese alle Funktionen der GPU vollständig freischalten und Zugriff auf die erforderlichen Einstellungen ermöglichen können. Grundlegende Treiber, die die Grafikkarte im System identifizieren, sind im Lieferumfang der Karte enthalten. Die aktualisierte Version kann auf der AMD-Website eingesehen werden.

Dieser Grafikprozessor der AMD Radeon HD 7800-Serie unterstützt die neuesten integrierten Technologien, mit denen Sie hochwertige und flüssige Bilder in 60 Bildern genießen können. Die Auflösung kann 4096 x 2160 Pixel erreichen. Gleiches gilt für den Audiostream, der alle modernen Anforderungen erfüllt und einen hochwertigen Klang erzeugt.

Radeon 7870

Diese Grafikkarte der AMD Radeon HD 7800-Serie ist ein leistungsstarker Nachfolger der Vorgängerkarte. Ganze Gigahertz stehen ihm für die Zusammenarbeit mit dem Grafikprozessor zur Verfügung. Die Leistung für Rechenoperationen ist deutlich höher als in der Vorgängerversion – 2,56 Teraflops. Es gibt 20 Recheneinheiten und 80 Textureinheiten.

Da es sich hierbei um das Flaggschiff der 7800er-Serie handelt, ist es seinem Bruder in vielerlei Hinsicht überlegen. Die Unterstützung der Tessellationstechnologie ist in Grafikkarten dieses Herstellers schon seit langem implementiert, in dieser Version wird sie jedoch an ihre Grenzen gebracht. Jetzt können Sie ein dreidimensionales Bild genießen, das durch seinen Realismus und seine Details besticht. Und verbessertes Anti-Aliasing trägt dazu bei, ein glattes und angenehmes Bild zu erzielen.

In anderen Parametern ist dieser Vertreter der AMD Radeon HD 7800-Serie in seinen Eigenschaften völlig identisch mit der vorherigen Grafikkarte. Beide Karten unterstützen die 3D-Technologie sowohl in Videos als auch in Spielen. Es ist auch möglich, mehrere Karten anzuschließen, um die Leistung zu verbessern. Dieser Parameter kann jedoch auch von den Fähigkeiten des Motherboards abhängen.

  • Chip-Codename: „Tahiti“
  • 4,3 Milliarden Transistoren (mehr als 60 % mehr als der Cayman und genau doppelt so viele wie der Cypress)
  • 384-Bit-Speicherbus: sechs 64-Bit-breite Controller, die GDDR5-Speicher unterstützen
  • Kerntakt: bis zu 925 MHz (für Radeon HD 7970)
  • 32 GCN-Recheneinheiten, darunter 128 SIMD-Kerne, bestehend aus insgesamt 2048 Gleitkomma-ALUs (Ganzzahl- und Gleitkommaformate, Unterstützung für FP32- und FP64-Präzision innerhalb des IEEE 754-Standards)
  • 128 Textureinheiten, mit Unterstützung für trilineare und anisotrope Filterung für alle Texturformate
  • 32 ROP-Einheiten mit Unterstützung für Anti-Aliasing-Modi mit programmierbarer Abtastung von mehr als 16 Abtastungen pro Pixel, einschließlich mit FP16- oder FP32-Frame-Buffer-Format. Spitzenleistung bis zu 32 Samples pro Takt und im Nur-Z-Modus – 128 Samples pro Takt
  • Integrierte Unterstützung für sechs Monitore, einschließlich HDMI 1.4a und DisplayPort 1.2

Technische Daten der Radeon HD 7970-Grafikkarte

  • Kernfrequenz: 925 MHz
  • Anzahl Universalprozessoren: 2048
  • Anzahl der Texturblöcke: 128, Mischblöcke: 32
  • Effektive Speicherfrequenz: 5500 MHz (4x1375 MHz)
  • Speichertyp: GDDR5
  • Speicherkapazität: 3 Gigabyte
  • Speicherbandbreite: 264 Gigabyte pro Sekunde.
  • Theoretische maximale Füllrate: 29,6 Gigapixel pro Sekunde.
  • Theoretische Textur-Abtastrate: 118,4 Gigatexel pro Sekunde.
  • Zwei CrossFire-Anschlüsse
  • PCI Express 3.0-Bus
  • Stromverbrauch: von 3 bis 250 W
  • Ein 8-poliger und ein 6-poliger Stromanschluss
  • Dual-Slot-Design
  • Empfohlener Preis für den US-Markt: 549 $

Technische Daten der Radeon HD 7950-Grafikkarte

  • Kernfrequenz: 800 MHz
  • Anzahl Universalprozessoren: 1792
  • Anzahl der Texturblöcke: 112, Mischblöcke: 32
  • Effektive Speicherfrequenz: 5000 MHz (4x1250 MHz)
  • Speichertyp: GDDR5
  • Speicherkapazität: 3 Gigabyte
  • Speicherbandbreite: 240 Gigabyte pro Sekunde.
  • Theoretische maximale Füllrate: 25,6 Gigapixel pro Sekunde.
  • Theoretische Textur-Abtastrate: 89,6 Gigatexel pro Sekunde.
  • Zwei CrossFire-Anschlüsse
  • PCI Express 3.0-Bus
  • Anschlüsse: DVI Dual Link, HDMI 1.4, zwei Mini-DisplayPort 1.2
  • Stromverbrauch: von 3 bis 200 W
  • Dual-Slot-Design
  • US-UVP: 449 $

Bemerkenswert ist die hohe Komplexität des neuen Chips – 4,3 Milliarden Transistoren, was mehr als der Hälfte der Transistorenzahl des bisherigen Top-End-Grafikprozessors entspricht. Die Herstellung eines solch komplexen Kristalls wurde durch den Einsatz einer modernen 28-Nanometer-Prozesstechnologie ermöglicht, und der neue Chip war flächenmäßig sogar etwas kleiner als der Cayman. Und seine praktischen Eigenschaften, die sich auf die Leistung auswirken, wurden spürbar verbessert: die Anzahl der ALUs, TMUs und des Speicherbusses. Lediglich die Anzahl der ROP-Blöcke erhöhte sich nicht und die Frequenz des GDDR5-Videospeichers blieb auf dem gleichen Niveau.

Das Namensprinzip für die Grafikkarten des Unternehmens bleibt gleich. Die Radeon HD 7970 ist die produktivste Single-Chip-Lösung des Unternehmens, nach einiger Zeit erschien das etwas später angekündigte Junior-Modell HD 7950. Die HD 7970 hatte zunächst keine Konkurrenten auf dem Markt und ersetzte keine bestimmte Grafikkarte aus der AMD-Reihe, sondern rückte sie nach unten. Was den Vergleich mit dem Konkurrenten betrifft: NVIDIA veröffentlichte seine 28-Nanometer-Lösung viel später.

Die neue AMD-Grafikkarte ist mit dem gleichen GDDR5-Speicher ausgestattet, sein Volumen ist jedoch statt 2 Gigabyte in der Vorgängergeneration auf 3 Gigabyte gestiegen. Dies geschah aufgrund der Erweiterung des Speicherbusses von 256 Bit auf 384 Bit. Und jetzt können Sie entweder 1,5 GB oder 3 GB auf die neue Platine stecken. Aus Marketing-Sicht wäre die Installation eines kleineren Volumens natürlich ein klarer Nachteil, daher hat man sich für die Installation von 3 GB entschieden, obwohl das heute etwas übertrieben ist. Nur in ultrahohen Auflösungen und mit MSAA 16x reichen 1,5-2 GB nicht aus. Allerdings verfügt AMD auch über Eyefinity und bei Spielen auf drei oder mehr Monitoren nimmt der Bildschirmpuffer ein sehr großes Volumen ein.

Schauen wir uns also die Radeon HD 7970 an. Die neue Grafikkarte der oberen Preisklasse verfügt über ein Dual-Slot-Kühlsystem, das über die gesamte Länge der Karte mit einem von allen modernen AMD-Boards bekannten Kunststoffgehäuse abgedeckt ist. Lediglich das Design dieses Gehäuses hat sich ein wenig verändert, obwohl der hintere Teil immer noch über die Leiterplatte hinausragt. Allerdings wurde das Design des Streifens mit Pins geändert – um die Kühlung der Grafikkarte zu verbessern, war einer der beiden Steckplätze (die Hälfte des Streifens) ausschließlich mit einem Belüftungsloch zur Wärmeabfuhr belegt.

Anwender sollten jedoch nicht unter einer Verringerung der Anzahl direkt auf der Platine verlöteter DVI-Anschlüsse leiden. Der Einfachheit halber liegt dem Paket ein spezieller HDMI-DVI-Adapter bei, mit dem Sie zwei Monitore mit DVI-Anschlüssen anschließen können. Der Stromverbrauch der neuen Karte ist übrigens nicht geringer als der der Radeon HD 6970, daher musste sie mit einem Satz aus einem 8-Pin- und einem 6-Pin-Stromanschluss ausgestattet werden.

Doch bei der neuen Radeon HD 7970 hat sich das Kühlsystem zum Besseren verändert. Es kommen eine neue Generation der Verdampfungskammer und ein neuer größerer Kühler mit neu geformten Schaufeln und erhöhter Leistung (mehr Luftstrom) zum Einsatz. Das Ergebnis ist eine Steigerung der Kühlereffizienz bei gleichzeitiger Reduzierung der Geräuschentwicklung.

Auch der Dual-BIOS-Firmware-Schalter, über den wir in der Beschreibung der Radeon HD 6900 geschrieben haben, ist nicht von der Platine verschwunden. Kurz gesagt: Die Grafikkarte verfügt über zwei BIOS-Versionen, eine mit der Möglichkeit, die Firmware individuell zu flashen, und die andere Zweitens mit werkseitig fest codierter Firmware. Diese praktische Lösung gefiel sowohl den Anwendern als auch AMD selbst so gut, dass man beschloss, sie weiterhin mit Top-End-Lösungen auszustatten.

Wir können diese Lösung nur begrüßen, die in verschiedenen Fällen im Zusammenhang mit unerwarteten Problemen beim Flashen (z. B. Stromausfall während des Vorgangs) wirklich hilft und Ihnen die angstfreie Durchführung verschiedener Experimente mit BIOS-Images ermöglicht. Es ist nicht verwunderlich, dass AMD immer wieder auf hervorragende Übertaktungsfähigkeiten der neuen Grafikkarte hinweist:

Wie Sie sehen, ist eine Übertaktung auf eine Frequenz von 1 GHz und höher praktisch versprochen, wenn man nicht den kleinen Hinweis (der im Screenshot nicht enthalten war) berücksichtigt, dass die Garantie auch bei Ausfall der Grafikkarte erlischt als Ergebnis eines Experiments mit der Erhöhung der Frequenz aus den Einstellungen Videotreiber.

Architektonische Merkmale der Radeon HD 7970

Um die Relevanz der architektonischen Änderungen auf den Südinseln zu würdigen, werfen wir zunächst einen Blick auf die Entwicklung von GPUs in den letzten Jahren, dargestellt durch AMD. Bis 2002 waren Grafikchips spezielle Hardware, die ausschließlich Grafikberechnungen durchführen konnte. Die damaligen Videochips hatten eine eingeschränkte Funktionalität; sie konnten nur Texturen anwenden und filtern, Geometrie verarbeiten und eine primitive Rasterung durchführen und waren daher überhaupt nicht für universelle Rechenaufgaben geeignet.

Im Laufe der nächsten Jahre wurde die GPU um grundlegende Programmierbarkeit erweitert, konzentrierte sich aber auch ausschließlich auf Grafikaufgaben. Dies war die Zeit der Unterstützung für DirectX 8 und 9, Shader-Programme mit eingeschränkten Funktionen und der Fähigkeit, mit Gleitkomma zu rechnen. Die damaligen Videochips verfügten über spezielle ALU-Einheiten für die Vertex- und Pixelverarbeitung sowie dedizierte Caches für Pixel, Texturen und andere Daten. Die Vielseitigkeit war noch nicht einmal annähernd erreicht.

Erst 2007 erwarb AMD die einheitliche DirectX 10-Shader-Architektur sowie die Möglichkeit, die GPU mit speziellen Tools zu programmieren: CAL, Brook, ATI Stream. GPUs dieser Zeit verfügten bereits über erweitertes Caching und Unterstützung für lokale und globale gemeinsame Daten. Architektonisch basierten die Chips auf VLIW5- und VLIW4-Blöcken, waren flexibel genug für einige grundlegende nicht-grafische Berechnungen, konzentrierten sich aber dennoch auf Grafikalgorithmen.

Jetzt ist es Zeit für eine neue Architektur, die noch besser für Allzweck-Computing geeignet ist – Graphics Core Next (GCN). Dies ist eine neue Architekturära für AMD, weshalb der Name gewählt wurde. Die neuen GPUs bieten hervorragende Grafikverarbeitungsfähigkeiten und Leistung, die vorgenommenen Architekturänderungen zielen jedoch in erster Linie darauf ab, die Position im Nicht-Grafik-Computing zu verbessern und die Leistung und Effizienz bei komplexen Allzweckaufgaben zu steigern. Das neue GPU-Design ist für sogenanntes heterogenes Computing gedacht – eine Mischung aus Grafik- und Allzweck-Computing in einer Multitasking-Umgebung. Die GCN-Architektur ist flexibler geworden und soll sich noch besser für die energieeffiziente Ausführung verschiedener Aufgaben eignen.

Der Grundblock in der neuen Architektur ist der GCN-Block. Auf diesen „Bausteinen“ basieren alle neuen Grafikprozessoren der Southern Islands-Serie. Die Architektur verwendet erstmals für AMD-Grafikchips ein Nicht-VLIW-Design, sie verwendet Vektor- und Skalareinheiten und eine der wichtigsten Änderungen besteht darin, dass jede der GCN-Rechnereinheiten über einen eigenen Scheduler verfügt und Anweisungen aus verschiedenen Programmen ausführen kann (Kernel).

Die neue Computerarchitektur ist auf eine hohe Effizienz beim Laden von Recheneinheiten in einer Multitasking-Umgebung ausgelegt. Die GCN-Recheneinheit ist in vier Unterabschnitte unterteilt, von denen jeder in jedem Taktzyklus mit seinem eigenen Befehlsstrom arbeitet. Threads können auch den von GCN bereitgestellten Skalarblock für Flusskontrolle oder Zeigeroperationen verwenden. Die Kombination aus Vektor- und Skalarblöcken bietet ein sehr einfaches Programmiermodell. Beispielsweise sind Funktionszeiger und Stapelzeiger viel einfacher zu programmieren und die Aufgabe des Compilers wird jetzt erheblich vereinfacht, da die Ausführungseinheiten skalar sind.

Jeder GCN-Block verfügt über 64 KB dedizierten lokalen Datenspeicher für den Datenaustausch oder die Erweiterung des lokalen Registerstapels. Der Block umfasst außerdem einen Cache der ersten Ebene mit Lese- und Schreibfunktionen und eine vollwertige Texturpipeline (Abtast- und Filtereinheiten). Daher ist die neue Recheneinheit in der Lage, unabhängig zu arbeiten, ohne einen zentralen Planer, der in früheren Architekturen für die Verteilung der Arbeit auf die Einheiten zuständig war. Jetzt ist jeder der GCN-Blöcke in der Lage, Befehle selbst zu planen und zu verteilen; ein Rechenblock kann bis zu 32 verschiedene Befehlsströme ausführen, die aus verschiedenen virtuellen Adressräumen im Speicher stammen können und vollständig geschützt und unabhängig voneinander sind.

Frühere AMD-GPU-Architekturen nutzten die Architekturmodelle VLIW4 und VLIW5, und obwohl sie für Grafikaufgaben gut genug sind, sind sie für allgemeine Rechenaufgaben nicht effizient genug, da es unter solchen Bedingungen sehr schwierig ist, alle Ausführungseinheiten mit Arbeit zu belasten. Die neue GCN-Architektur bietet die gleiche große Anzahl an Ausführungseinheiten, jedoch mit einer skalaren Ausführung, die die Einschränkungen und Abhängigkeiten von Registern und Anweisungen beseitigt. Der Übergang von der VLIW-Architektur zur skalaren Ausführung sorgt für eine spürbare Vereinfachung von Codeoptimierungsaufgaben.

Bei der Ausführung von Anweisungen auf der vorherigen VLIW4-Architektur muss sich der Compiler mit Registerkonflikten auseinandersetzen, eine komplexe Verteilung von Anweisungen an Ausführungseinheiten in der Codekompilierungsphase durchführen usw. Gleichzeitig erfordert das Erreichen einer hohen Leistung häufig eine nicht triviale Optimierung, die ist für die meisten Grafikaufgaben geeignet und für andere Berechnungen deutlich weniger flexibel. Die neue Architektur bietet eine erhebliche Vereinfachung der Entwicklung und des Supports, eine vereinfachte Erstellung, Analyse und Erkennung von Fehlern im Low-Level-Code sowie eine stabile und vorhersehbare Leistung.

Speicher-Caching-Subsystem

Es gibt nie genug Bandbreite, Arbeitsspeicher und Caches, und es besteht immer Bedarf und Methoden, diese zu erhöhen. Die neuen GPUs von AMD nutzen einen vollständigen zweistufigen Lese-/Schreib-Cache. Jede Recheneinheit verfügt über 16 Kilobyte First-Level-Cache und das Gesamtvolumen des Second-Level-Cache beträgt 768 Kilobyte (insgesamt verfügt der Chip über 512 KB L1 und 768 KB L2), was 50 % mehr als beim Vorgängerchip ist , das überhaupt keine Schreibfunktionen im L2-Cache hat.

In Bezug auf die Leistung kann jede GCN-Recheneinheit in einem Taktzyklus 64 Byte Daten vom/zum L1-Cache oder globalen Speicher empfangen oder schreiben, der zum Datenaustausch zwischen Befehlsthreads verwendet wird. Jeder Abschnitt des L2-Cache der zweiten Ebene ist in der Lage, die gleiche Datenmenge zu senden und zu empfangen. Dadurch erreicht die Top-End-GPU des Unternehmens 2 Terabyte/s für L1 und 700 GB/s für L2, was 50 % mehr ist als die bisherige Top-End-Lösung von AMD.

Tahiti-GPU

Nachdem wir uns nun die geringfügigen architektonischen Änderungen in der neuen Southern Islands-Serie angesehen haben, ist es an der Zeit, sich den Details der leistungsstärksten Lösung der Linie zuzuwenden, der Radeon HD 7900, die zwei Modelle umfasst. Beachten wir zunächst einmal die schiere Komplexität der neuen GPU, denn sie umfasst mehr als 4,3 Milliarden Transistoren, also doppelt so viele wie in dem Chip, auf dem die Radeon HD 5870 basiert! Möglich wurde ein solch leistungsstarker Chip natürlich nur durch den Einsatz der neuen 28-nm-Prozesstechnologie. Was hat er also in sich?

Die Anzahl der geometrischen Blöcke hat sich im Vergleich zum Cayman nicht geändert, es sind immer noch zwei davon, aber die Effizienz ihrer Arbeit wurde deutlich gesteigert – darauf gehen wir etwas später noch näher ein. Im GPU-Diagramm sehen wir 32 Recheneinheiten der GCN-Architektur, die auf der Radeon HD 7970 verfügbar sind, und im Fall der Lösung der unteren Preisklasse sind einige davon deaktiviert. Betrachtet man die Spitzenrechenleistung der Lösung, so liegt sie bei fast 3,8 Teraflops (Gleitkommaoperationen pro Sekunde), was für eine GPU bisher einen absoluten Rekord darstellt.

Jeder GCN-Block enthält 16 Textureinheiten, was einer endgültigen Zahl von 128 TMUs pro Chip oder mehr als 118 Gigatexeln/Sek. entspricht – und dies ist zum Zeitpunkt der Veröffentlichung ein weiterer Rekord und wird nicht der letzte sein. Die Anzahl der ROP-Blöcke hat sich jedoch nicht geändert, es gibt immer noch 32 davon in 8 vergrößerten RBE-Blöcken. Eine weitere interessante Architekturänderung besteht darin, dass ROP-Blöcke nun nicht mehr wie bisher an Speicherkanäle, sondern an GCN-Blöcke „angehängt“ werden.

Obwohl theoretisch die Schreibgeschwindigkeit in den Framebuffer nahezu unverändert geblieben ist und maximal möglich sind die gleichen 32 Farbwerte und 128 Tiefenwerte pro Takt, hat sich die praktische Füllrate in realen Anwendungen aufgrund der Erhöhung deutlich erhöht Speicherbandbreite. Den Messungen von AMD zufolge verzeichnete der Cayman nur 23 Pixel pro Takt, während der neue Tahiti nahe an die theoretischen 32 Pixel pro Takt herankam.

Das ist verständlich, denn AMDs neuer Videochip verfügt über einen 384-Bit-Speicherbus – sechs 64-Bit-Kanäle, genau wie die aktuelle Top-End-Lösung des Konkurrenten. Es ist diese eineinhalbfache Erhöhung der Speicherbandbreite, die es ermöglicht, die tatsächliche Geschwindigkeit des Texturabrufs und des Schreibens in den Framebuffer zu erhöhen. Eine Bandbreite von 264 GB/Sek. sollte dabei helfen, an die theoretischen Werte von 118 Gigapixel/Sek. und 30 Gigapixel/Sek. heranzukommen, und im praktischen Teil werden wir dies überprüfen.

Im Fall der „abgespeckten“ Radeon HD 7950 GPU umfasst Tahiti 28 aktive Recheneinheiten der GCN-Architektur von 32 physisch auf dem Chip verfügbaren. Bei der Junior-Lösung der Radeon-HD-7970-Serie entschied man sich, vier davon zu deaktivieren. Da jede GCN-Einheit 16 Textureinheiten enthält, beträgt die Gesamtzahl der TMUs für das neue Modell 112 TMUs, was einer Leistung von fast 90 Gigatexeln/Sek. entspricht.

Die Anzahl der ROP-Einheiten und Speichercontroller im HD 7950 hat sich jedoch nicht geändert; man hat beschlossen, sie nicht zu kürzen und sie bei den gleichen 32 bzw. 6 Stück zu belassen. Daher verfügt der Tahiti Pro-Videochip über denselben 384-Bit-Speicherbus, zusammengesetzt aus sechs 64-Bit-Kanälen, wie die Top-Lösung von AMD. Anscheinend sind es die funktionsfähigen Computergeräte, die am meisten unter Produktionsmängeln leiden, und man hat beschlossen, nicht alles andere zu streichen.

Tessellation und Geometrieverarbeitung

Aus architektonischer Sicht hat sich an den geometrischen Blöcken von Tahiti seit dem Cayman nicht viel geändert. Für die Verarbeitung (Festlegen von Eckpunkten und Tessellation) geometrischer Daten und die Rasterung werden immer noch zwei Blöcke verwendet, und das Schema ist dem, was wir zuvor gesehen haben, sehr ähnlich, mit der Ausnahme, dass die Tessellatoren als 9. Generation bezeichnet werden:

Trotz der schematischen Ähnlichkeiten ist die neueste Generation dieser Blöcke in der Lage, eine deutlich höhere Tessellations- und Geometrieverarbeitungsleistung zu erzielen, da die Blöcke erheblichen Modifikationen unterzogen wurden. Obwohl die Spitzenleistung nur auf fast zwei Milliarden Vertices und Grundelemente pro Sekunde stieg (925 MHz und zwei Vertices pro Takt), stieg die tatsächliche Leistung stärker. Dies wurde durch eine Vergrößerung der Caches, eine verbesserte Pufferung von Geometriedaten und die Wiederverwendung von Scheitelpunktdaten erreicht.

Dadurch wird die Tessellationsleistung über alle Dreiecksverhältnisse hinweg im Vergleich zur Radeon HD 6970 der vorherigen Generation um das bis zu Vierfache verbessert. Doch nicht in allen Fällen werden viermal erreicht, auch nicht auf dem Diagramm von AMD selbst:

Das Diagramm vergleicht die Tessellationsleistung der Radeon HD 7970 mit der HD 6970 bei Partitionierungsfaktoren zwischen 1 und 32. Und wie Sie sehen können, beträgt der Leistungsunterschied zwischen dem 1,7- und dem Vierfachen. Aber das ist reines Synthetik. Und um der Realität näher zu kommen, stellen wir noch einige Daten zur Tessellationsgeschwindigkeit in Spieleanwendungen bereit:

Wie Sie sehen, werden die synthetischen Zahlen von AMD von Gaming-Zahlen gut unterstützt – die Leistung in realen Anwendungen mit „starker“ Tessellation ist deutlich gestiegen. Das ist ein sehr gutes Ergebnis, das wir im Praxisteil am Beispiel von Kunststoffen und Gaming-Anwendungen auf jeden Fall überprüfen werden.

Nichtgrafisches Rechnen

Aus Sicht heterogener und nichtgrafischer Rechenaufgaben ist die Entstehung zweier asynchroner Rechenmaschinen (Asynchronous Compute Engines – ACE) sehr wichtig. Sie dienen der Planung und Verteilung der Arbeit zwischen den Ausführungseinheiten für effizientes Multitasking und arbeiten in Verbindung mit dem grafischen Befehlsprozessor (Command Processor).

Radeon HD 7900 verfügt über zwei unabhängige Rechen-Engines und eine Grafik-Engine. Insgesamt ergeben sich dadurch drei programmierbare Blöcke und drei Befehlsströme, völlig getrennt voneinander. Und zusätzlich zur asynchronen Befehlsübermittlung für einen schnellen Kontextwechsel verfügt die neue GPU auch über zwei bidirektionale DMA-Controller (Direct Memory Access), die im Cayman eingeführt wurden. Diese beiden Controller sind erforderlich, um die Vorteile des neuen PCI-Express-3.0-Busses voll auszunutzen.

Wie wir wissen, ist aus Sicht ernsthafter Berechnungen nicht nur die Geschwindigkeit der Ausführung von Gleitkommaoperationen mit einfacher Genauigkeit wichtig, sondern auch Gleitkommaoperationen mit doppelter Genauigkeit. Und die neue AMD-Architektur meistert diese Aufgabe ganz gut. Derzeit wird davon ausgegangen, dass es zwei Versionen von GCN-Recheneinheiten gibt, die unterschiedliche Ausführungsraten von FP64-Befehlen aufweisen. Bei älteren GPUs beträgt die Ausführungsrate 1/4 der FP32-Geschwindigkeit und bei jüngeren Chips beträgt die Ausführungsrate 1/16, was völlig ausreicht, um die Kompatibilität aufrechtzuerhalten, aber kostengünstige Lösungen nicht zu sehr verkompliziert. Dadurch ist die Radeon HD 7970 in der Lage, 947 Milliarden Double-Precision-Operationen pro Sekunde durchzuführen (oh, sie haben gerade einen Teraflop unterschritten!) – das ist eine weitere Höchstleistung des neuen AMD-Chips.

Darüber hinaus handelt es sich nicht um dieselben Gigaflops wie bei früheren Architekturen, sondern um „fettere“. Schließlich soll die Effizienz der neuen GPU bei komplexen Rechenaufgaben deutlich steigen. Erstens wurde das Speicher- und Caching-Subsystem verbessert. Zweitens verfügt jede GCN-Recheneinheit über einen eigenen Scheduler, der die Ausführung des Verzweigungscodes und die Gesamteffizienz verbessern sollte. Nun, drittens bemerken wir die skalare Ausführung, die keine komplexen Optimierungen vom Compiler erfordert, wodurch die Recheneinheiten viel seltener im Leerlauf sind. Dadurch wird es für den neuen Chip bei allen Aufgaben einfacher, hohe Leistung und ALU-Last zu demonstrieren.

Neben anderen Innovationen im Zusammenhang mit den Rechenkapazitäten stellen wir die vollständige ECC-Unterstützung für DRAM und SRAM fest. Auf der Softwareseite ist es wichtig, dass Tahiti die erste GPU ist, die die neuen API-Versionen vollständig unterstützt: OpenCL 1.2, DirectCompute 11.1 und C++ AMP und deren Fähigkeiten. Mit OpenCL 1.2 können Sie beispielsweise die Fähigkeiten mehrerer Computergeräte in einem kombinieren, und AMD hat hierfür bereits Unterstützung in Form von AMD APP SDK 2.6 und dem Catalyst 11.12-Treiber veröffentlicht.

Architekturleistung und Effizienz

Nachdem wir alle architektonischen Neuerungen am Beispiel des Top-End-Chips der Southern Island-Serie besprochen haben, ist es an der Zeit, über die Wirksamkeit all dieser Änderungen zu sprechen. Es ist klar, dass die Leistung der neuen Chips deutlich höher ist als die der Vorgänger; das Gegenteil wäre durchaus überraschend. Die Frage ist, wie viel schneller. Bei verschiedenen Aufgaben liegen die Ergebnisse zwischen 40-50 % (Minimum!) und einer fünffachen Differenz. Verbesserungen in der Architektur ermöglichen es, den theoretischen 1,4-fachen Unterschied in dummen Gigaflops zu überschreiten. Schauen wir uns das anhand von Beispielen an:

Das Diagramm vergleicht die neue Top-Lösung mit der bisherigen Single-Chip-Lösung: Radeon HD 7970 und HD 6970, was durchaus fair ist. Die ausgewählten Leistungstests sind unterschiedlich: SmallptGPU und LuxMark sind Raytracing auf OpenCL, SHA256 ist ein sicherer Hashing-Algorithmus und AES256 ist ein symmetrischer Verschlüsselungsalgorithmus. Nun, Mandelbrot ist ein bekanntes Problem, das mit doppelter Genauigkeit berechnet wird.

Die vertikale gestrichelte Linie im Diagramm markiert den theoretischen Leistungsunterschied, die Geschwindigkeitsdaten zeigen jedoch, dass bei drei von fünf Aufgaben die Geschwindigkeit der neuen GPU deutlich höher war. Dies ist auf alle Änderungen zurückzuführen, die auf eine Steigerung der Effizienz abzielen: Abkehr von VLIW, Einführung eines Schedulers in jeder Recheneinheit, verbessertes Caching usw.

Änderungen an der Rendering-Qualität

Eigentlich hätte dieser Teil auch übersprungen werden können, da es in letzter Zeit keine besonderen Beanstandungen an der Bildqualität gab und es diese aus verschiedenen Gründen auch nicht geben kann. Beispielsweise ist die Qualität des Vollbild-Anti-Aliasings bei Grafikkarten verschiedener Hersteller sehr ähnlich, insbesondere angesichts der weit verbreiteten Verwendung von Software-Anti-Aliasing-Methoden mit Nachbearbeitungsfiltern, die auf allen GPUs genau gleich durchgeführt werden.

Gleiches gilt für die Texturfilterung – ihre Qualität ist mittlerweile so, dass es selbst bei einem Pixel-für-Pixel-Vergleich sehr schwierig ist, zwischen AMD- und NVIDIA-Lösungen zu unterscheiden. Bei der Radeon HD 6900 – der Vorgängergeneration des Unternehmens – hat sich die anisotrope Filterung noch etwas verbessert, und jetzt hilft auch ein „Mikroskop“ nicht weiter, dort wesentliche Mängel zu finden. Der einzige Hinweis ist, dass die Radeon-Grafikkarten in Bewegung aufgrund auffälligerer spezifischer Artefakte wie „Rauschen“ oder „Sand“ der GeForce etwas unterlegen waren.

Mit der Veröffentlichung von Videochips der neuen Generation wurden die Texelgewichte im Texturfilter erneut überprüft und so modifiziert, dass solche Artefakte reduziert werden, die manchmal auf der Radeon HD 6900 bei Vorhandensein bestimmter Texturtypen („hoch“) sichtbar sind -Frequenz“, mit z. B. scharfen Übergängen von dunkel nach hell). Die Qualitätsänderungen lassen sich anhand von Beispielen so schwer darstellen, dass AMD keine Vergleichsbilder der HD 7900 mit der HD 6900 bereitstellt, sondern lediglich die Qualität des „Hardware“-Algorithmus mit einem reinen Software-Algorithmus vergleicht, der auf GPU-Stream-Prozessoren ausgeführt wird, und daher ideal:

In einem so kleinen Screenshot ist der Qualitätsunterschied nicht sichtbar, aber AMD versichert, dass alle vorgenommenen Änderungen zu keinem Leistungsabfall geführt haben und die Bildqualität in keiner Weise beeinträchtigt wurden – es kommt immer noch nicht auf den Winkel und die Ausrichtung an Die Filterqualität ist nahezu ideal. Wir werden dies auf jeden Fall in einem der zukünftigen praktischen Materialien überprüfen.

Teilweise residente Texturen

Die Idee von Partially Resident Textures (PRT) besteht darin, die Hardwarefähigkeiten der vorgestellten GPU – den virtuellen Speicher – zu nutzen. Sicherlich haben viele Benutzer bereits das Spiel RAGE von id Software gesehen, das eine virtuelle Texturierungstechnologie, das sogenannte Megatexturing („MegaTexture“), nutzt, die es ermöglicht, riesige Mengen an Texturdaten zu nutzen und in den Videospeicher zu streamen.

Mithilfe des virtuellen Videospeichers ist es sehr einfach, effektive Hardwareunterstützung für solche Algorithmen zu erhalten, sodass Sie bis zu 32 Terabyte an Texturen in einer Anwendung verwenden können, wodurch einzigartige Orte in Spielen erstellt werden können, ohne dass Texturteile wiederholt werden müssen ohne Probleme beim Laden von Texturdaten. Zwar gibt AMD ein klares, zu seltsames Beispiel, aus dem nichts besonders klar hervorgeht:

Mit PRT können Sie eine hohe Bildqualität erzielen und die Effizienz der Videospeichernutzung verbessern. Ähnliche Algorithmen werden bereits in der id Software-Engine verwendet und werden voraussichtlich auch in vielen Engines der nächsten Generation zum Einsatz kommen. Spiele der Zukunft müssen mit riesigen Datenmengen arbeiten, und der Vorteil der neuen GPU besteht darin, dass der lokale Grafikspeicher in Algorithmen a la PRT als Hardware-Cache-Speicher fungiert und bei Bedarf Texturen in ihn geladen werden. GPUs der Southern Islands-Familie unterstützen „Megatexturen“ mit einem Volumen von bis zu 32 Terabyte (Auflösung bis 16384 × 16384) und vor allem Hardware-Texturfilterung dafür, die bei früheren Videochips nicht verfügbar ist.

Virtuelle Texturen werden in Stücke mit einer Größe von 64 Kilobyte (Kilobyte, nicht Texel) unterteilt und diese Stückgröße ist fest. Und nur diejenigen, die beim Rendern des aktuellen Frames benötigt werden, werden in den lokalen Speicher der Grafikkarte geladen. Die Technologie funktioniert unabhängig vom Texturformat, nur die Größe der Stücke in Texeln ist unterschiedlich. Beispielsweise beträgt die Stückgröße für eine normale unkomprimierte Textur mit 32 Bit pro Farbe 128 x 128 Texel und für eine im DXT3-Format komprimierte Textur 256 x 256 Texel.

Die Technologie beinhaltet auch die Verwendung von Textur-Mip-Levels (reduzierte Kopien, die bei der Texturfilterung verwendet werden). Sie erfordern beim Rendern und Filtern mehrere Zugriffe. Schauen wir uns die Funktionsweise des Algorithmus anhand eines Beispiels an.

Dieses Bild hebt vier verschiedene Blöcke aus verschiedenen Mip-Ebenen hervor, die für das Rendern erforderlich sind. Wenn ein Shader-Programm Daten von ihnen anfordert, befinden sich einige der Blöcke bereits im lokalen Speicher und diese Daten werden sofort zur weiteren Berechnung an den Shader gesendet. Es fehlen jedoch einige Teile in der Tabelle, und die Anwendung muss entscheiden, was bei diesem Fehlen als Nächstes zu tun ist. Sie können beispielsweise Daten von einer MIP-Ebene mit niedrigerer Auflösung anfordern, dann ist das Bild unscharf, sieht aber zumindest wie das Original aus und wird ohne Verzögerung gerendert. Und wenn das nächste Bild gerendert wird, kann es bereits in den Cache geladen werden – den lokalen Videospeicher. Wer RAGE gespielt hat, wird uns verstehen.

Dies ist ein leistungsstarker Algorithmus, der es Ihnen ermöglicht, riesige Texturen zu verwenden, die für jedes Objekt einzigartig sind. Ähnliche Algorithmen werden seit langem beim Offline-Rendering verwendet, mit Ausnahme der Notwendigkeit von Echtzeitberechnungen. AMD hat sogar eine Demo mit der Per-Face Texture Mapping-Technik erstellt, die von den Walt Disney Animation Studios für ihre Animationsfilme entwickelt wurde. Leider ist die Demo noch nicht fertig und wir haben nur Screenshots mit niedriger Auflösung gesehen.

Der Kern dieser Texturabbildungstechnik besteht darin, jedem Polygon ein bestimmtes Stück Textur zuzuweisen, ohne dass eine UV-Transformation erforderlich ist (Finden einer Entsprechung zwischen den Oberflächenkoordinaten eines dreidimensionalen Objekts und den Koordinaten einer zweidimensionalen Textur). . Dieser Ansatz löst einige der Probleme bei der Erstellung tessellierter Inhalte, indem er den Displacement-Mapping-Algorithmus sehr einfach macht. Und PRT wird bei dieser Methode verwendet, um Texturdaten effizient zu speichern und darauf zuzugreifen.

Anweisungen zur Medienverarbeitung

Eine interessante Neuerung auf den Südinseln scheint die Unterstützung spezieller Anweisungen für die statische und dynamische Bildverarbeitung zu sein. Beispielsweise wurde eine weit verbreitete Anweisung namens „Summe absoluter Differenzen“, besser bekannt als SAD (Sum of Absolute Differences), verbessert. Die Geschwindigkeit seiner Ausführung ist ein sehr kritischer Leistungsengpass für viele Bild- und Videoverarbeitungsalgorithmen, wie z. B. Bewegungserkennung, Gestenerkennung, Bildsuche, Computer Vision und viele andere.

Aber in unserem Testbericht zur alten Radeon HD 5870-Grafikkarte haben wir bereits über die SAD-Unterstützung geschrieben. Zusätzlich zum regulären SAD (4x1) verfügt Southern Islands nun über einen neuen Befehl – ​​QSAD (Quad SAD), der SAD mit Schichtoperatoren kombiniert, um Leistung und Energieeffizienz zu steigern, sowie einen „maskierten“ Befehl MQSAD, der ignoriert Hintergrundpixel und wird verwendet, um Objekte, die sich im Bild bewegen, vom Hintergrund zu isolieren.

Die neuen GPUs können bis zu 256 Pixel pro GCN-Recheneinheit pro Takt verarbeiten, was im Fall des AMD Radeon HD 7970-Modells die Fähigkeit bedeutet, bei 8-Bit-Integer-Farbwerten bis zu 7,6 Billionen Pixel pro Sekunde zu verarbeiten. Obwohl es sich hierbei um eine theoretische Zahl handelt, sind die visuellen Verarbeitungsfähigkeiten der neuen GPUs durchaus beeindruckend – viele Videoverarbeitungsaufgaben können in Echtzeit ausgeführt werden.

PCI Express 3.0

Wir konnten die Unterstützung der dritten Version von PCI Express durch die gesamte Reihe neuer Grafiklösungen der Southern Islands nicht ignorieren. Diese Unterstützung war durchaus zu erwarten, da die Spezifikationen der dritten Version von PCI Express bereits im Herbst 2010 endgültig genehmigt wurden, es jedoch noch keine Hardwarelösungen mit ihrer Unterstützung gab, obwohl bereits Motherboards auf den Markt kamen, wurden am Ende Grafikkarten veröffentlicht von 2011, und die entsprechenden Zentralprozessoren Es gibt.

Die aktualisierte Schnittstelle verfügt über eine Übertragungsgeschwindigkeit von 8 Gigatransaktionen pro Sekunde statt 5 GT/s bei Version 2.0 und ihr Durchsatz hat sich im Vergleich zum PCI Express 2.0-Standard noch einmal verdoppelt (auf 32 GB/s). Der neue Bus verwendet ein anderes Codierungsschema für die über den Bus gesendeten Daten, die Kompatibilität mit früheren Versionen von PCI Express wurde jedoch gewahrt.

Die ersten Motherboards, die PCI Express 3.0 unterstützen, wurden im Sommer 2011 vorgestellt, hauptsächlich auf Basis des Intel Z68-Chipsatzes, und waren erst im Herbst desselben Jahres allgemein erhältlich. Jetzt sind die Grafikkarten da, und AMD ist den anderen in Bezug auf die Geschwindigkeit der Veröffentlichung neuer Grafikprozessoren, die die fortschrittlichsten Technologien unterstützen, erneut voraus. Ob PCI-E 3.0 jedoch einen praktischen Sinn ergibt, lässt sich noch nicht beurteilen.

AMD PowerTune-Technologie

Eine der interessantesten Innovationen im Cayman war die fortschrittliche Power-Management-Technologie PowerTune. Flexibles GPU-Energiemanagement wird schon seit langem verwendet, aber vor der Radeon HD 6900 waren alle diese Technologien eher primitiv und größtenteils Softwaremethoden und änderten die Frequenz und Spannung schrittweise, sodass große Teile der Videochips nicht abgeschaltet werden konnten.

Bereits bei der Radeon-HD-5000-Familie kam es ab einem bestimmten Verbrauch zu einem Leistungsbegrenzer, bei der Radeon-HD-6900 bewegte sich das System auf einem qualitativ anderen Niveau. Zu diesem Zweck hat der Chip in allen Blöcken spezielle Sensoren eingebaut, die die Boot-Parameter überwachen. Die GPU misst ständig die Last und den Stromverbrauch und lässt nicht zu, dass dieser einen bestimmten Schwellenwert überschreitet, indem sie Frequenz und Spannung automatisch anpasst, sodass die Parameter innerhalb des angegebenen Wärmepakets bleiben.

Im Gegensatz zu früheren Energieverwaltungstechnologien bietet PowerTune eine direkte Kontrolle über den GPU-Stromverbrauch, im Gegensatz zu einer indirekten Kontrolle durch Änderung von Frequenzen und Spannungen. Mit dieser Technologie können Sie die Taktraten Ihrer GPU auf hohe Geschwindigkeiten einstellen und so eine hohe Spieleleistung erzielen, ohne befürchten zu müssen, dass der Stromverbrauch sichere Grenzen überschreitet. Schließlich haben die meisten Spiele und allgemeinen Anwendungen, die GPU-Computing nutzen, einen deutlich geringeren Strombedarf und nähern sich im Gegensatz zu Stabilitätstests wie Furmark und OCCT nicht gefährlichen Stromverbrauchsgrenzen.

Selbst die schwersten Spiele erfordern keinen maximalen Stromverbrauch, und wenn Sie den Verbrauch nach Häufigkeit begrenzen, indem Sie Grafikkarten mit extremen Tests testen, dann gibt es bei 3D-Spielen ziemlich viel ungenutztes Leistungs- und Leistungspotenzial. Für den Fall, dass die Grafikkarte die sichere Verbrauchsgrenze nicht erreicht hat, arbeitet die GPU mit der werkseitig eingestellten Frequenz, und in den FurMark- und OCCT-Tests wird die GPU-Frequenz verringert, um innerhalb der Verbrauchsgrenzen zu bleiben.

Somit hilft PowerTune dabei, höhere Werksfrequenzen einzustellen und das System so zu konfigurieren, dass die GPU-Ressourcen bei dem eingestellten maximalen Verbrauchsniveau am effizientesten genutzt werden. Im oben gezeigten Beispiel nutzt die HD 5870 PowerTune nicht und nutzt aufgrund der GPU-Frequenzbegrenzung aufgrund des hohen Verbrauchs in den Dauertests nicht alle Möglichkeiten. Während die Radeon HD 7970 auf die maximale TDP eingestellt ist und der Videochip die Frequenzen erst bei Überschreitung zurücksetzt, wird in jeder Anwendung die höchstmögliche Leistung erzielt.

Dies wird im folgenden Diagramm deutlich dargestellt. Bei Gaming-Anwendungen ist das Erreichen der TDP durch eine Erhöhung der GPU-Frequenz möglich und bei Spitzenlasten wird die Frequenz durch Dauertests auf ein sicheres Maß an Leistungsaufnahme reduziert. Ohne PowerTune müsste man sich entscheiden – entweder die Möglichkeit eines Grafikkartenausfalls bei längerer Nutzung von FurMark und OCCT oder eine Reduzierung der potenziellen Leistung in Spielen. Neue Technologien lösen diese Probleme so effizient wie möglich.

AMD PowerTune reagiert schnell (Mikrosekunden) auf sich ändernde Bedingungen, da es sich um eine Hardware-Technologie handelt. Es zeichnet sich außerdem durch flexible Frequenzeinstellungen aus und nicht schrittweise, wie dies bei früheren Chips der Fall war. Alle Messungen erfolgen unabhängig vom Treiber, können jedoch vom Benutzer über die Grafikkarteneinstellungen angepasst werden.

Der Unterschied zwischen PowerTune und dem bisher allgemein akzeptierten Ansatz besteht darin, dass in anderen Fällen thermisches Throttling zum Einsatz kommt, das die GPU in einen deutlich reduzierten Verbrauchsmodus versetzt, während PowerTune einfach sanft seine Frequenz reduziert und den GPU-Verbrauch auf den eingestellten Limiter bringt. Dadurch werden höhere Taktraten und Leistung erreicht.

AMD ZeroCore-Technologie

AMD beschränkte sich nicht darauf, bereits aus früheren Lösungen bekannte Power-Management-Technologie zu nutzen. In den ersten Chips der Southern Islands-Familie wird die AMD ZeroCore-Technologie eingeführt, die dazu beiträgt, eine noch höhere Energieeffizienz im „Deep Idle“- (oder „Sleep“)-Modus mit deaktiviertem Anzeigegerät zu erreichen, der von allen Betriebssystemen unterstützt wird.

Schließlich verbringt fast jedes System, auch ein Gaming-System, die meiste Zeit im Niedriglastmodus des Grafikprozessors. Und die Grafikkarte sollte in diesem Modus nicht viel Energie verbrauchen. Und noch mehr, ganz zu schweigen vom Modus bei ausgeschaltetem Monitor – in diesem Fall empfiehlt es sich, die GPU komplett auszuschalten. Das hat AMD getan. Dank ZeroCore verbraucht die neue GPU im Deep-Idle-Zustand weniger als 5 % der Energie eines Vollmodus und deaktiviert die meisten Funktionsblöcke in diesem Modus.

AMD liefert einen schematischen Vergleich mit der eigenen Radeon HD 5870, die diese Technologie nicht unterstützte. ZeroCore ist eine exklusive Innovation der Southern Islands, die von mobilen GPUs für Laptops auf Desktop-Lösungen übertragen wird. Die Vorteile dieser Technologie liegen übrigens nicht nur im reduzierten Verbrauch. Darüber hinaus schaltet die Grafikkarte im Langzeit-Idle-Modus bei ausgeschaltetem Display auch den Lüfter am Grafikkartenkühler komplett ab!

Genau darauf haben viele Nutzer schon lange gewartet. Das Interessanteste ist, dass unseren Daten zufolge vor mehreren Generationen von Grafikkarten Labortests mit ähnlichen PowerTune- und ZeroCore-Lösungen durchgeführt wurden. Einige der technischen Muster von Grafikkarten der AMD-Serie, die schon lange nicht mehr auf dem Markt sind, funktionierten genau so, indem sie den Kühler im Leerlauf vollständig abschalteten.

Aber nicht nur Single-GPU-Benutzer profitieren von der geringeren Geräuschentwicklung und dem geringeren Stromverbrauch der neuen ZeroCore-fähigen Grafikkarten von AMD. Ähnliche Verbesserungen erwarten die glücklichen Besitzer von CrossFire-Systemen, die auf zwei, drei und sogar vier GPUs basieren. Es ist logisch, dass im Modus zum Rendern einer zweidimensionalen Schnittstelle des Betriebssystems alle Grafikkarten außer der Hauptgrafikkarte überhaupt nicht funktionieren sollten? Aber genau so funktionieren sie jetzt!

Bei CrossFire-Systemen auf Grafikkarten mit ZeroCore-Unterstützung im 2D-Modus werden alle sekundären Grafikkarten bei minimalem Stromverbrauch in den Tiefschlaf versetzt und der Kühler deaktiviert. Dieser Modus funktioniert für mehrere Single-Chip-Grafikkarten und für Dual-Chip-Lösungen. Darüber hinaus wechselt auch die primäre CrossFire-Grafikkarte bei längerer Inaktivität in diesen Modus, konfiguriert in Windows. Der Unterschied in der Bedienung sieht folgendermaßen aus:

Übrigens ist die Technologie nicht so einfach, wie es scheint. AMD-Ingenieure mussten viele Probleme im Zusammenhang mit dem Betrieb des Betriebssystems im Leerlaufmodus lösen. Sie stellten beispielsweise fest, dass Windows versucht, Informationen auf dem Bildschirm zu aktualisieren, selbst wenn der Monitor ausgeschaltet ist. Was es natürlich überhaupt nicht erlaubt, die GPU zu deaktivieren. Daher mussten die Programmierer des Unternehmens einen Workaround ergreifen und alle Bildschirmzeichnungsbefehle ignorieren, wenn der Monitor im Ruhemodus ausgeschaltet ist.

AMD Eyefinity 2.0-Technologie

Natürlich gab es in der neuen Architektur auch Raum für Verbesserungen an der bewährten Technologie zur Darstellung von Bildern auf mehreren Monitoren – AMD Eyefinity, jetzt in der Version 2.0. Es erhielt neue Funktionen, höhere Auflösungen, Unterstützung für mehr Displays und erhöhte Flexibilität.

Diese Technologie ist durchaus interessant, auch wenn die wenigsten Nutzer Platz im Raum finden und den Mut aufbringen, mehr als zwei Monitore in ihrer Familie zu installieren. Aber es ist besser, die Möglichkeit zu haben, sie immer nutzen zu können, als sie gar nicht zu haben. Darüber hinaus sinken die Preise für Monitore mit großer Diagonale fast nicht, Mittelklasse-Lösungen werden jedoch immer günstiger.

Tatsächlich ist es mittlerweile rentabler, drei Monitore mit einer Bildschirmdiagonale von 24 Zoll zu kaufen als einen 30-Zoll. AMD nennt ein solches Beispiel, bei dem ein 30-Zoll-Monitor mit einer Auflösung von 2560 x 1600 mehr als 1000 US-Dollar kostet und drei 24-Zoll-FullHD-Monitore für die Hälfte dieses Preises zu kaufen sind:

Aber wie man sein Geld und den Platz im Raum ausgibt, ist eine persönliche Angelegenheit jedes Benutzers. Die Hauptsache ist, dass eine solche Möglichkeit besteht. Außerdem unterstützt Eyefinity 2.0 jetzt die Bildausgabe im HD3D-Stereomodus – etwas, das in früheren Lösungen fehlte, die in diesem Parameter den Konkurrenzlösungen unterlegen waren. Durch die Kombination von AMD Eyefinity- und HD3D-Technologien ist die Radeon HD 7970-Grafikkarte die erste Single-Chip-Lösung, die drei Monitore im Stereomodus unterstützt.

Für hochauflösendes Stereo-Rendering ist eine sehr schnelle Datenschnittstelle erforderlich. Und bei früheren Versionen der HDMI-Ausgänge waren die Möglichkeiten auf 24 Hz pro Auge beschränkt, was zum Ansehen von Blu-ray-3D-Filmen völlig ausreicht, für Gamer jedoch eindeutig zu niedrig ist.

Für solche Aufgaben begannen sie, das Frame-Packing-Format zu verwenden, bei dem die Frames für das linke und das rechte Auge zu einem zusammengefasst werden, und die AMD Radeon HD 7970 unterstützt das Frame-Packing-Format HDMI 1.4a für die Stereobildausgabe. Dies ist die erste Grafikkarte, die 3 GHz HDMI mit Frame Packing unterstützt, wenn jedes Auge ein FullHD-Bild mit einer Frequenz von 60 Hz (insgesamt 120 Hz) empfängt:

Ein weiteres interessantes neues Produkt scheint uns die Mehrkanal-Audioausgabetechnologie Discrete Digital Multi-Point Audio (DDMA) zu sein, die mit Eyefinity zusammenarbeitet. Alle bisherigen GPUs sind in der Lage, nur einen Audiostream über HDMI und DisplayPort auszugeben. Das heißt, selbst wenn drei Monitore, die sich in verschiedenen Räumen befinden, über HDMI mit dem PC verbunden sind, wird nur ein Audiokanal übertragen. Allerdings erhielt die AMD Radeon HD 7900 Unterstützung für die gleichzeitige Ausgabe mehrerer unabhängiger Audiokanäle, was in manchen Multi-Monitor-Konfigurationen durchaus nützlich sein kann.

Die gleiche Funktion wird für den Einsatz in Videokonferenzen mit der Anzeige mehrerer Gesprächspartner auf separaten Bildschirmen sowie für Multitasking-Anwendungen wie das Spielen auf drei Monitoren mit Spielaudio und das Anzeigen von Nachrichten auf einem separaten Bildschirm mit einem unabhängigen Audiostream sehr nützlich sein. Früher war es für all dies notwendig, mehrere separate Audiosysteme zu verwenden, aber jetzt funktioniert alles so komfortabel wie möglich.

Auch der Software-Support von Eyefinity wurde nicht vergessen; die Technologie wird fast jeden Monat aktualisiert – neue Möglichkeiten ergeben sich. So erschienen bereits im Oktober Unterstützung für Auflösungen bis zu 16384 x 16384 und neue Multi-Monitor-Konfigurationen: horizontal und vertikal 5x1 sowie basierend auf sechs Monitoren im 3x2-Modus.

Das Dezember-Update des AMD Catalyst-Grafiktreibers ermöglichte die Zusammenarbeit zwischen Eyefinity und HD3D und im Februar versprechen sie Unterstützung für benutzerdefinierte Auflösungen, Platzierungseinstellungen in der Taskleiste und eine verbesserte Voreinstellungsverwaltung.

Die Ausgabe auf sechs Monitoren kann über zwei DisplayPort 1.2-Ports und zwei MST-Hubs (über die wir bereits geschrieben haben) erreicht werden, während drei oder sogar vier Monitore nur einen Port und den entsprechenden Hub benötigen. Solche Hubs ermöglichen eine flexible Konfiguration des Bildausgabesystems, unterstützen bis zu vier FullHD-Geräte pro DisplayPort 1.2-Anschluss und sollen ab Sommer 2012 im Handel erhältlich sein.

Apropos Auflösung. Hochauflösend oder sogar ultrahoch – Ultra High Resolution. Aktuelle Geräte mit einer Auflösung von 4000 Pixeln auf der größeren Seite erfordern den Anschluss über mehrere Kabel gleichzeitig: zwei DP 1.1 oder vier DVI. Monitore dieser Auflösung der nächsten Generation werden über nur ein Kabel angeschlossen: DP 1.2 HBR2 oder HDMI 1.4a 3 GHz. Und die neue Grafikkarte von AMD ist bereits bereit für solche Monitore, wiederum war sie die erste der Welt.

Videokodierung und -dekodierung

Es ist ganz natürlich, dass die AMD Radeon HD 7970 über dieselbe UVD-Einheit zur Dekodierung von Videodaten verfügt, die in der vorherigen Generation der Videochips des Unternehmens zum Einsatz kam. Es sind einfach keine Änderungen erforderlich, da es den Multi-Stream-MVC-Codec unterstützt, die Formate MPEG-2/MPEG-4 (DivX), VC-1 und H.264 dekodiert und zwei FullHD-Streams in allen unterstützten Formaten dekodiert.

AMD-Lösungen bieten maximale Qualität bei der Decodierung von Videostreams, nutzen mehrere Dutzend spezielle Algorithmen zur Qualitätsverbesserung und liefern maximale Ergebnisse bei Qualitätstests wie HQV. Zu den unterstützten Funktionen zählen: Farb- und Tonanpassung, Rauschunterdrückung, Schärfung, hochwertige Skalierung, dynamischer Kontrast, erweitertes Deinterlacing und inverse Telecine. Hier ist ein Beispiel für die spontane Verbesserung des Kontrasts:

Aber die Dekodierung auf allen Videochips ist schon seit langem mehr oder weniger in Ordnung. Alle neuen GPUs bieten eine ordentliche Qualität und Leistung beim Anzeigen von Videodaten. Allerdings steckt die Videokodierung auf der GPU noch in den Kinderschuhen und die Hauptbeschwerden der Nutzer richten sich gegen die geringe Qualität des resultierenden komprimierten Bildes.

Vielleicht kann die neue Radeon HD 7000-Serie dabei helfen, denn alle GPUs der Serie verfügen über eine Video-Codec-Engine (VCE)-Videokodierungseinheit. Das Modell Radeon HD 7970 war die erste Grafikkarte, die hardwarebeschleunigte Videokodierung und -komprimierung mithilfe einer speziellen Einheit unterstützte (zuvor waren Stream-Prozessoren an der Kodierung beteiligt).

Qualität und Leistung dürften deutlich besser sein als zuvor, mit Unterstützung für 1080p-Kodierung mit 60 Bildern pro Sekunde und sogar schneller als in Echtzeit. Ohne Tests ist es schwierig, etwas über die Qualität zu sagen, aber uns werden verschiedene Stufen der Encoder-Optimierung für Videodaten und Spiele sowie eine variable Komprimierungsqualität (die Möglichkeit, zwischen zunehmender Qualität oder Leistung zu wählen) versprochen.

Derzeit gibt es keinen Ort, an dem Sie VCE ausprobieren können – es gibt einfach keine Anwendungen, die es unterstützen, aber AMD arbeitet mit Partnern wie ArcSoft zusammen, um VCE in ihren jeweiligen Softwareprodukten zu unterstützen. Für die Zukunft planen wir die Veröffentlichung einer Softwarebibliothek zur Beschleunigung der Videokodierung, die es Entwicklern einfacher machen wird, AMD-Produkte der nächsten Generation zu unterstützen.

Die Kodierung kann in zwei Modi durchgeführt werden: vollständig und hybrid (unter Nutzung der Fähigkeiten von GPU-Stream-Prozessoren). Der Vollmodus ist für Aufgaben konzipiert, die maximale Energieeffizienz und konstante Leistungsniveaus erfordern. Die Vollmodus-Kodierung auf VCE ist schneller als in Echtzeit und bietet eine geringe Latenz. Es gibt aber auch einen Hybridmodus:

In diesem Modus arbeiten GPU-Mathematikblöcke auch mit VCE zusammen. Alle hochgradig parallelisierbaren Stufen, die im Diagramm gelb umrandet sind, können die Leistung der GCN-Recheneinheiten nutzen, während eine dedizierte VCE-Einheit die effiziente Hardware-Entropiekodierung übernimmt. Dieser Modus eignet sich gut für Grafikkarten mit großer Rechenleistung, wie zum Beispiel die Radeon HD 7970. Es bleiben Fragen zur Qualität dieser beiden Modi offen, dies erfordert jedoch eine sorgfältige Analyse in einem separaten Artikel.

AMD Steady-Video

Neben der Kodierung und Dekodierung von Videodaten gibt es noch einen weiteren Bereich, in dem die Leistungsfähigkeit der neuen Grafikkarte von AMD genutzt werden kann – die Verbesserung von Videos mit schlechter Qualität, die handgeführt aufgenommen wurden, ohne den Einsatz eines Stativs oder anderer ähnlicher Bildstabilisierungsmittel. Die Videostabilisierungstechnologie heißt AMD Steady Video und die zweite Version wurde bereits veröffentlicht.

Der Betriebsalgorithmus des Softwarestabilisators ist recht einfach: Basierend auf dem Videostream werden Statistiken über Kamerabewegungen (Verschiebung, Drehung, Zoom) gesammelt und diese Bewegung wird im aktuellen Bild relativ zu den vorherigen kompensiert – das Bild wird verschoben , gedreht und skaliert, damit das Bild nicht stark springt und stabil bleibt.

So einfach es klingt, so schwierig ist es auch umzusetzen. Ganz einfach, weil auf dem Bildschirm zwei Millionen Pixel und bis zu 30 oder sogar 60 Bilder pro Sekunde vorhanden sind. Stellen Sie sich vor, wie viele Berechnungen durchgeführt werden müssen, um alle möglichen Bildverschiebungen zu verfolgen. Über die in der Videoverarbeitung verwendete QSAD-Funktion haben wir oben bereits geschrieben; sie wird auch in Steady Video 2.0 verwendet, um den Bewegungserkennungsalgorithmus zu beschleunigen. Daher muss die GPU zufällige Verschiebungen mit einer Amplitude von bis zu 32 Pixeln in jede Richtung verarbeiten und dies erfordert eine Leistung, die mehr als 500 Milliarden SAD-Operationen pro Sekunde entspricht (für 1920 x 1080 bei 60 FPS).

Durch die Unterstützung neuer QSAD-Anweisungen in der Radeon HD 7970 übersteigt ihr Vorsprung gegenüber leistungsstarken CPUs im Bewegungserkennungsalgorithmus das Zehnfache! Das heißt, wir erhalten jetzt qualitativ hochwertige Videos, und zwar nicht nur bei der Bearbeitung von Heimvideos in Videoeditoren, sondern auch beim Ansehen von Online-Videos anderer Leute, die wer weiß was und wer weiß wie gedreht hat.

Details: Radeon HD 7800-Serie

  • Chip-Codename: „Pitcairn“
  • Fertigungstechnologie: 28 nm
  • 2,8 Milliarden Transistoren (etwas mehr als der Cayman, der die Basis der Radeon HD 6900-Serie bildet)
  • Eine einheitliche Architektur mit einer Reihe gemeinsamer Prozessoren für die Stream-Verarbeitung zahlreicher Datentypen: Eckpunkte, Pixel usw.
  • Hardwareunterstützung für DirectX 11.1, einschließlich Shader Model 5.0
  • 256-Bit-Speicherbus: vier 64-Bit-breite Controller, die GDDR5-Speicher unterstützen
  • Kernfrequenz: bis zu 1000 MHz (für Radeon HD 7870)
  • 20 GCN-Recheneinheiten, darunter 80 SIMD-Kerne, bestehend aus insgesamt 1280 ALUs für Gleitkommaberechnungen (Ganzzahl- und Gleitkommaformate, Unterstützung für FP32- und FP64-Präzision innerhalb des IEEE 754-Standards)
  • 80 Textureinheiten, mit Unterstützung für trilineare und anisotrope Filterung für alle Texturformate
  • 32 ROP-Einheiten mit Unterstützung für Anti-Aliasing-Modi mit programmierbarer Abtastung von mehr als 16 Abtastungen pro Pixel, einschließlich mit FP16- oder FP32-Frame-Buffer-Format. Spitzenleistung bis zu 32 Samples pro Takt und im Nur-Z-Modus – 128 Samples pro Takt

Technische Daten der Radeon HD 7870-Grafikkarte

  • Kernfrequenz: 1000 MHz
  • Anzahl Universalprozessoren: 1280
  • Anzahl der Texturblöcke: 80, Mischblöcke: 32
  • Speichertyp: GDDR5
  • Speicherkapazität: 2 Gigabyte
  • Theoretische maximale Füllrate: 32,0 Gigapixel pro Sekunde.
  • Theoretische Textur-Abtastrate: 80,0 Gigatexel pro Sekunde.
  • Ein CrossFire-Anschluss
  • PCI Express 3.0-Bus
  • Anschlüsse: DVI Dual Link, HDMI 1.4, zwei Mini-DisplayPort 1.2
  • Stromverbrauch: von 3 bis 175 W
  • Zwei 6-polige Stromanschlüsse
  • Dual-Slot-Design
  • Empfohlener Preis für den US-Markt: 349 $

Technische Daten der Radeon HD 7850-Grafikkarte

  • Kernfrequenz: 860 MHz
  • Anzahl Universalprozessoren: 1024
  • Anzahl der Texturblöcke: 64, Mischblöcke: 32
  • Effektive Speicherfrequenz: 4800 MHz (4x1200 MHz)
  • Speichertyp: GDDR5
  • Speicherkapazität: 2 Gigabyte
  • Speicherbandbreite: 153,6 Gigabyte pro Sekunde.
  • Theoretische maximale Füllrate: 27,5 Gigapixel pro Sekunde.
  • Theoretische Textur-Abtastrate: 55,0 Gigatexel pro Sekunde.
  • Ein CrossFire-Anschluss
  • PCI Express 3.0-Bus
  • Anschlüsse: DVI Dual Link, HDMI 1.4, zwei Mini-DisplayPort 1.2
  • Stromverbrauch: von 3 bis 130 W
  • Dual-Slot-Design
  • US-UVP: 249 $

Und dieses Mal wurde das Prinzip der Namensgebung der Produkte des Unternehmens nicht geändert und die Trends der vorherigen Serie fortgeführt. Die Mid-Budget-Grafikkartenserie auf Basis der GCN-Architektur unterscheidet sich von der Top- und Budget-Reihe durch die zweite Ziffer im Index: Anstelle von 7 und 9 steht die Zahl 8, was durchaus logisch ist. Da AMD die psychologische Schwelle von 1000 MHz für die GPU-Frequenz angenommen hat, erhielt die Radeon HD 7870 den Namenszusatz „GHz Edition“, der darauf hinweist, dass diese Frequenz angenommen wurde.

Aus dem Namen geht hervor, dass die Radeon HD 7800 produktiver ist als die HD 7700, aber eine geringere Geschwindigkeit im Vergleich zu den älteren Modellen – der HD 7900 – aufweist. Was den Vergleich mit NVIDIA-Lösungen betrifft, so war das damals ältere Modell HD 7870 auf dem Markt Die Veröffentlichung konkurriert mit der GeForce GTX 570-Grafikkarte, die jüngere zielt auf den Kampf gegen die GTX 560 Ti ab, und NVIDIA hat noch keine neuen 28-nm-Mittelklasse-Chips herausgebracht.

Beide Modelle der AMD-Grafikkarten verfügen über einen GDDR5-Speicher mit der gleichen Kapazität von 2 Gigabyte. Beide verwenden einen 256-Bit-Speicherbus und können daher mit 1, 2 oder 4 GB konfiguriert werden. 1 GB ist zu wenig und 4 GB sind für dieses Preissegment zu teuer. Daher können wir sagen, dass das ideale Volumen von 2 GB Videospeicher gewählt wurde, was für die allermeisten Spiele auch in hohen Auflösungen völlig ausreichend und vom Preis her nicht zu teuer ist.

Ansonsten unterscheiden sich die Modelle HD 7850 und HD 7870 aus Verbrauchersicht noch. Die ältere Radeon HD 7870 hat einen höheren Stromverbrauch und benötigt daher zwei zusätzliche 6-Pin-Stromanschlüsse, während sich die HD 7850 mit nur einem davon begnügt. Beide Platinen verfügen über ein Dual-Slot-Kühlsystemdesign, die meisten Hersteller stellen jedoch Platinen mit eigenem Design für mindestens einen Kühler oder sogar eine Leiterplatte her.

Architektonische Merkmale der Radeon HD 7800-Familie

Oben im Text haben wir alle Funktionen der neuen Graphics Core Next (GCN)-Architektur sorgfältig beschrieben, daher wiederholen wir nur die wichtigsten. Alle neuen GPUs des Unternehmens bieten hervorragende Fähigkeiten und Leistung nicht nur bei der Grafikverarbeitung, sondern auch bei nicht-grafischen Berechnungen, einschließlich einer Mischung verschiedener Berechnungsarten. Darüber hinaus bietet die neue GCN-Architektur eine erhebliche Vereinfachung von Codeoptimierungsaufgaben, vereinfachte Entwicklung und Support sowie stabile und vorhersehbare Leistung und im Allgemeinen eine recht hohe Effizienz.

Der Basisblock der neuen Architektur ist der GCN-Block, aus dem alle GPUs der Southern Islands-Serie zusammengesetzt sind. Betrachten Sie das Blockdiagramm des Pitcairn-Chips:

Das Diagramm zeigt den Grafikprozessor Radeon HD 7870 (der „vereinfachte“ HD 7850 unterscheidet sich von ihm durch mehrere deaktivierte Einheiten); wir sehen 20 Recheneinheiten der GCN-Architektur. Bei der Junior-Lösung der Radeon HD 7800-Serie waren vier davon deaktiviert und die Anzahl der aktiven Blöcke beträgt 16. Dies entspricht 1280 bzw. 1024 Stream-Prozessoren (genau wie bei der HD). 7700-Familie, nur sind es genau doppelt so viele Blöcke). Da jeder GCN-Block vier Textureinheiten enthält, beträgt die endgültige Anzahl an TMUs für das ältere Modell 80 TMUs und für das jüngere Modell 64 TMUs.

Aber auch die Anzahl der ROP-Einheiten und Speichercontroller ist bei der HD 7870 und HD 7850 die gleiche wie bei den Lösungen der jüngsten Linie. Die Anzahl der ROP-Blöcke wurde recht hoch belassen – 32 Stück für beide Modelle. Der Speicherbus von Pitcairn-basierten Boards ist auf 256 Bit reduziert; er setzt sich aus vier 64-Bit-Kanälen zusammen. Das ist für eine Lösung dieses Niveaus nicht schlecht, obwohl es anderthalbmal weniger ist als in der obersten Reihe, da der Speicherbus traditionell als erstes gekappt wird. Gut ist, dass durch den Einsatz des schnellen GDDR5-Speichers eine relativ hohe Bandbreite von 153 GB/s erreicht wurde.

Wie andere Chips mit GCN-Architektur verfügt Pitcairn über eine Tessellator-Einheit der 9. Generation, die über zahlreiche Puffer- und Caching-Optimierungen verfügt, um die Geometrieverarbeitungsleistung deutlich zu verbessern. Hier ist ein Vergleich des neuen AMD-Boards mit der Lösung der vorherigen Generation in einem synthetischen Problem, der eine bis zu vierfache Steigerung der Tessellationsgeschwindigkeit nahelegt:

Ebenso werden viele AMD-Technologien unterstützt, die in den neuen Videochips der Radeon HD 7000-Reihe eingeführt und verbessert wurden. Hier eine unvollständige Liste: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, Verbesserungen in der Qualität der Texturfilterung , usw. All dies ist oben ausführlicher beschrieben. Ergänzen wir die Liste, dass die Radeon HD 7800 sowohl den verbesserten Anti-Aliasing-Algorithmus MLAA 2.0 als auch Super-Sampling-Anti-Aliasing (SSAA) vollständig unterstützt.

Beim Vergleich der Gaming-Leistung ist die Radeon HD 7870 deutlich schneller als ihr direkter Konkurrent, die GeForce GTX 570, insbesondere angesichts des Fehlens von 1,25 GB Videospeicher (im Vergleich zu 2 GB bei den getesteten Lösungen). wird in modernen Spielen bei hohen Rendering-Auflösungen beobachtet. Die jüngere Radeon HD 7850 ist mit der GeForce GTX 560 Ti vergleichbar und kann hier nicht mehr mit Speicherkapazität auftrumpfen. Allerdings ist AMDs neue Lösung laut AMD-Messungen in den meisten Spielen immer noch schneller als der Konkurrent.

Details: Radeon HD 7700-Serie

  • Chip-Codename: „Kap Verde“
  • Fertigungstechnologie: 28 nm
  • 1,5 Milliarden Transistoren (weniger als Barts, der die Basis der Radeon HD 6800-Serie bildet)
  • Eine einheitliche Architektur mit einer Reihe gemeinsamer Prozessoren für die Stream-Verarbeitung zahlreicher Datentypen: Eckpunkte, Pixel usw.
  • Hardwareunterstützung für DirectX 11.1, einschließlich Shader Model 5.0
  • Kernfrequenz: bis zu 1000 MHz (für Radeon HD 7770)
  • 10 GCN-Recheneinheiten, darunter 40 SIMD-Kerne, bestehend aus insgesamt 640 Gleitkomma-ALUs (Ganzzahl- und Gleitkommaformate, Unterstützung für FP32- und FP64-Präzision innerhalb des IEEE 754-Standards)
  • 40 Textureinheiten mit Unterstützung für trilineare und anisotrope Filterung für alle Texturformate
  • Integrierte Unterstützung für bis zu sechs Monitore, einschließlich HDMI 1.4a und DisplayPort 1.2

Technische Daten der Radeon HD 7770-Grafikkarte

  • Kernfrequenz: 1000 MHz
  • Anzahl Universalprozessoren: 640
  • Anzahl der Texturblöcke: 40, Mischblöcke: 16
  • Speichertyp: GDDR5
  • Speicherkapazität: 1 Gigabyte
  • Theoretische Textur-Abtastrate: 40,0 Gigatexel pro Sekunde.
  • Ein CrossFire-Anschluss
  • PCI Express 3.0-Bus
  • Anschlüsse: DVI Dual Link, HDMI 1.4, zwei Mini-DisplayPort 1.2
  • Stromverbrauch: von 3 bis 80 W
  • Ein 6-poliger Stromanschluss
  • Dual-Slot-Design
  • Empfohlener Preis für den US-Markt: 159 $

Technische Daten der Radeon HD 7750-Grafikkarte

  • Kernfrequenz: 800 MHz
  • Anzahl Universalprozessoren: 512
  • Anzahl der Texturblöcke: 32, Mischblöcke: 16
  • Effektive Speicherfrequenz: 4500 MHz (4x1125 MHz)
  • Speichertyp: GDDR5
  • Speicherkapazität: 1 Gigabyte
  • Speicherbandbreite: 72 Gigabyte pro Sekunde.
  • Theoretische maximale Füllrate: 12,8 Gigapixel pro Sekunde.
  • Theoretische Textur-Abtastrate: 25,6 Gigatexel pro Sekunde.
  • PCI Express 3.0-Bus
  • Anschlüsse: DVI Dual Link, HDMI 1.4, ein DisplayPort 1.2
  • Stromverbrauch: von 3 bis 55 W
  • Benötigt keine zusätzliche Stromversorgung
  • Single-Slot-Design
  • Empfohlener Preis für den US-Markt: 109 $

Eine preiswerte Grafikkartenserie auf Basis der GCN-Architektur unterscheidet sich von der Ober- und Mittelklasse durch die zweite Ziffer im Index: Die Zahl 9 wird wie bisher durch die Zahl 7 belegt. Die Radeon HD 7770 ist eine produktivere Lösung, es gibt aber auch ein jüngeres Modell – die HD 7750. Das ältere Board hatte zum Zeitpunkt seiner Veröffentlichung keine direkten Konkurrenten auf dem Markt und lag irgendwo zwischen der GeForce GTX 560 und der GTX 550 Ti , und der jüngere zielt auf den Kampf gegen die GTX 550 Ti ab. Für die HD 7770 wurde später ein Konkurrent in Form der GeForce GTX 560 SE angekündigt (alle NVIDIA-Lösungen basieren auf älteren GPUs).

Beide betrachteten AMD-Grafikkartenmodelle verfügen über GDDR5-Speicher mit der gleichen Kapazität von 1 Gigabyte. Aufgrund der Verwendung eines 128-Bit-Speicherbusses könnten sie mit 2 GB ausgestattet werden, allerdings wäre eine solche Menge an GDDR5-Speicher für ihr Preissegment zu teuer. Daher wurden bisher Modelle mit diesem Volumen veröffentlicht, obwohl es möglich ist, dass in Zukunft Varianten mit 2 GB Videospeicher erscheinen. Diese Kapazität hat man vorerst für die HD 7800 belassen.

Was andere Verbrauchereigenschaften angeht, unterscheiden sich die Modelle HD 7750 und HD 7770 deutlich. Verfügt die ältere Radeon HD 7770 über ein Kühlsystem mit zwei Steckplätzen und ist der Kühler wie bei älteren Lösungen mit einem Kunststoffgehäuse abgedeckt, sieht die jüngere HD 7750 mit einem Steckplatz und einem einfachen Kühler deutlich schlichter aus. Allerdings produzieren die meisten Hersteller immer noch Boards mit eigenen Designs. Auch der Stromverbrauch neuer Modelle dieser Preisklasse ist unterschiedlich, das ältere Modell verfügt über einen zusätzlichen 6-Pin-Stromanschluss und das jüngere Modell nutzt den Strom über PCI Express.

Architektonische Merkmale der Radeon HD 7700

Der Grundblock der neuen Architektur ist der GCN-Block, aus dem alle GPUs der Serie zusammengesetzt sind. Jeder der verfügbaren GCN-Blöcke ist in der Lage, Befehle selbst zu planen und zu verteilen, und ein Rechenblock kann bis zu 32 unabhängige Befehlsthreads ausführen. Schauen wir uns das Blockdiagramm des kapverdischen Chips an:

Das Diagramm zeigt den Grafikprozessor Radeon HD 7770 (die „abgespeckte“ HD 7750 verfügt über mehrere deaktivierte Einheiten); wir sehen 10 Recheneinheiten der GCN-Architektur. Bei der Junior-Lösung der Radeon HD 7700-Serie wurde beschlossen, zwei davon zu deaktivieren, und die Anzahl der Blöcke betrug 8. Dies entspricht 640- und 512-Stream-Prozessoren. Und da jeder GCN-Block 4 Textureinheiten enthält, beträgt die endgültige Anzahl an TMUs für das ältere Modell 40 TMUs und für das jüngere Modell 32 TMUs.

Die Anzahl der ROP-Einheiten und Speichercontroller in der HD 7770 und HD 7750 ist nicht unterschiedlich, und sie haben beschlossen, die ROP nicht zu sehr zu reduzieren, sodass jeweils 16 Stück übrig blieben. Allerdings ist der Speicherbus des Cape Verde auf 128-Bit gekürzt, der aus zwei 64-Bit-Kanälen zusammengesetzt ist. Im Allgemeinen ist das dreimal weniger als in der Top-Serie, und wir haben eine weitere Bestätigung dafür gesehen, dass der Speicherbus traditionell das erste ist, was bei preiswerten Chips gekürzt wird. Allerdings konnte durch den Einsatz von schnellem GDDR5-Speicher eine (für solch günstige Lösungen) relativ hohe Bandbreite von 72 GB/s eingehalten werden.

Alles, was uns noch auffällt, ist die ziemlich große Menge an Second-Level-Cache – bis zu 512 Kilobyte (im Vergleich zu 768 KB beim Top-Chip – der L2-Cache nimmt offenbar nicht allzu viel Platz auf dem Chip ein). sowie Verbesserungen der geometrischen Leistung. Wie der Top-End-Chip verfügt auch der Cape Verde über einen Tessellator der 9. Generation mit zahlreichen Puffer- und Caching-Optimierungen, um die Geometrieverarbeitungsleistung im Vergleich zur Radeon HD 6000-Serie deutlich zu verbessern.

Im Allgemeinen werden wir nicht alle Informationen zu AMD-Technologien wiederholen, die in den neuen Videochips der Radeon HD 7000-Reihe eingeführt und verbessert wurden (hier ist eine unvollständige Liste: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, Verbesserungen in der Qualität der Texturfilterung usw. .p.), all dies ist oben ausführlich beschrieben. Die HD 7700-Serie unterstützt alle dort aufgeführten Features, darunter AMD Eyefinity 2.0 mit sechs Monitoren und Stereo-Rendering, und verfügt außerdem über eine verbesserte Video-Dekodierungs- und Kodierungseinheit.

Aber was ist mit dem Wichtigsten – der Spieleleistung? Erste Abschätzungen zur Rendering-Geschwindigkeit lassen sich immer anhand der Herstellerangaben vornehmen. AMD geht davon aus, dass die Radeon HD 7770 irgendwo in der Mitte zwischen der GeForce GTX 560 bzw. GeForce GTX 550 Ti angesiedelt ist und vergleicht sie hinsichtlich der Materialien mit dem zweiten Modell des Konkurrenten.

Sie vergleichen die Radeon HD 7750 jedoch nicht mit irgendetwas, sondern weisen lediglich darauf hin, dass die meisten modernen Spiele auf diesem Modell bei maximalen Einstellungen in FullHD-Auflösung spielbar sind. Dies ist jedoch nicht verwunderlich, da es in den letzten Jahren praktisch keine PC-Exklusivspiele mehr gab und Multiplattform-Spiele deutlich weniger anspruchsvoll sind. Daher sind die Boards der Radeon HD 7700-Serie perfekt für anspruchslose Benutzer.

Details: Radeon HD 7790-Modell

  • Chip-Codename: „Bonaire“
  • Fertigungstechnologie: 28 nm
  • 2,08 Milliarden Transistoren (mehr als die Kapverden in der Radeon HD 7700, aber weniger als die Pitcairn-Transistoren in der Radeon HD 7800)
  • Eine einheitliche Architektur mit einer Reihe gemeinsamer Prozessoren für die Stream-Verarbeitung zahlreicher Datentypen: Eckpunkte, Pixel usw.
  • Hardwareunterstützung für DirectX 11.1, einschließlich Shader Model 5.0
  • 128-Bit-Speicherbus: zwei 64-Bit-breite Controller, die GDDR5-Speicher unterstützen
  • Kernfrequenz: 1000 MHz
  • 14 GCN-Recheneinheiten, darunter 56 SIMD-Kerne, bestehend aus insgesamt 896 Gleitkomma-ALUs (Ganzzahl- und Gleitkommaformate, Unterstützung für FP32- und FP64-Präzision innerhalb des IEEE 754-Standards)
  • 56 Textureinheiten mit Unterstützung für trilineare und anisotrope Filterung für alle Texturformate
  • 16 ROP-Blöcke mit Unterstützung für Antialiasing-Modi mit der Möglichkeit, programmierbar mehr als 16 Samples pro Pixel abzutasten, einschließlich mit FP16- oder FP32-Framebufferformat. Spitzenleistung bis zu 16 Samples pro Takt und im Nur-Z-Modus – 64 Samples pro Takt

Technische Daten der Radeon HD 7790-Grafikkarte

  • Kernfrequenz: 1000 MHz
  • Anzahl Universalprozessoren: 896
  • Anzahl der Texturblöcke: 56, Mischblöcke: 16
  • Speichertyp: GDDR5
  • Speicherkapazität: 1 Gigabyte
  • Speicherbandbreite: 96 Gigabyte pro Sekunde.
  • Theoretische maximale Füllrate: 16,0 Gigapixel pro Sekunde.
  • Theoretische Textur-Abtastrate: 56,0 Gigatexel pro Sekunde.
  • Ein CrossFire-Anschluss
  • PCI Express 3.0-Bus
  • Anschlüsse: DVI Dual Link, HDMI 1.4, zwei Mini-DisplayPort 1.2
  • Stromverbrauch: von 3 bis 85 W
  • Ein 6-poliger Stromanschluss
  • Dual-Slot-Design
  • US-UVP: 149 $

Das günstige Grafikkartenmodell, das auf einem neuen Mid-Budget-Chip basiert, unterscheidet sich vom bisherigen Topmodell der HD 7700-Unterfamilie durch die dritte Ziffer im Index: Statt 7 setzen sie die Zahl 9, was auf eine Leistungssteigerung hinweist . Gleichzeitig zeigt der Radeon HD 7790-Index deutlich, dass es sich um eine leistungsschwächere Grafikkarte im Vergleich zur einen Schritt höheren Linie - HD 7800 - handelt.

Allerdings ist auch hier nicht alles so einfach – mit der jüngeren HD 7850 kann es durchaus mithalten. Der empfohlene Preis der Radeon HD 7790 liegt jedoch bei 149 US-Dollar, also etwa in der Mitte zwischen den Preisen der HD 7770 und der HD 7850. Was die Lösungen eines Konkurrenten aus dem gleichen Preissegment betrifft, so ist die Veröffentlichung der HD Die 7790 sollte eindeutig etwas gegen die NVIDIA GeForce GTX 650 Ti auf Basis des GK106-Chips haben, die in Preis und Geschwindigkeit genau zwischen der HD 7770 und der HD 7850 angesiedelt ist. Doch NVIDIA reagierte sofort auf die Veröffentlichung des neuen Boards durch AMD und brachte eine übertaktete Version der GeForce GTX 650 Ti Boost auf den Markt, die über eine höhere Leistung verfügt.

Dieses AMD-Grafikkartenmodell verfügt über GDDR5-Speicher mit einer Kapazität von nur 1 Gigabyte. Die GPU verfügt über einen 128-Bit-Speicherbus, theoretisch könnten es 2 GB sein, aber diese Menge an schnellem GDDR5-Speicher ist für dieses Preissegment immer noch zu teuer, und AMD hat ein Modell mit geringerer Kapazität herausgebracht, obwohl dies möglicherweise nicht der Fall ist genug für einige moderne Spiele, selbst wenn nicht die höchsten Einstellungen und Auflösungen vorliegen. Es ist jedoch möglich, Grafikkarten von Partnern mit 2 GB Videospeicher freizugeben.

Wie die benachbarten Modelle der Reihe verfügt auch die Radeon HD 7790 über ein Dual-Slot-Kühlsystem, das mit einem Kunststoffgehäuse abgedeckt ist. Obwohl die meisten Hersteller immer noch Motherboards mit eigenem Kühlerdesign herausbringen, ist das Referenzdesign nicht so wichtig. Interessanterweise ist der Stromverbrauch des neuen Modells im Vergleich zur HD 7770 nicht allzu stark gestiegen, die Verbesserung der Energieeffizienz war jedoch zu erwarten. Aus diesem Grund verfügt das neue Produkt übrigens auch nur über einen 6-poligen zusätzlichen Stromanschluss.

Architektonische Besonderheiten

Der neue Bonaire-Grafikprozessor, auf dem das veröffentlichte Modell Radeon HD 7790 basiert, gehört zur gleichen Graphics Core Next (GCN)-Architektur, die wir seit anderthalb Jahren kennen, AMD nennt ihn jedoch in Anspielung GCN 1.1 Kleine Veränderungen. Tatsächlich unterscheidet sich der Chip architektonisch praktisch nicht von den Vorgängern, obwohl es tatsächlich einige kleinere Änderungen gibt. Die neue Architektur führte beispielsweise nützliche Anweisungen für die heterogene Systemarchitektur (HSA), Unterstützung für eine größere Anzahl gleichzeitig ausgeführter Threads sowie eine neue Version der AMD PowerTune-Technologie ein, über die wir später sprechen werden. Alle diese Änderungen können jedoch nicht als wesentlich bezeichnet werden, da es bei den Grundblöcken und der Verbesserung ihrer Effizienz nichts Neues gibt.

Daher können Sie sicher darauf verweisen, dass alle Funktionen der neuen Graphics Core Next (GCN)-Architektur sorgfältig beschrieben werden. Hier werden wir nur die wichtigsten Merkmale und Funktionen eines bestimmten Produkts wiederholen. Alle neuesten GPUs von AMD bieten hervorragende Fähigkeiten und Leistung sowohl beim Grafik- als auch beim Nicht-Grafik-Computing sowie einer Mischung aus beidem. Die neue GCN-Architektur hat außerdem Optimierungs- und Softwareentwicklungsaufgaben erheblich vereinfacht und gleichzeitig eine hohe Effizienz beibehalten.

Wie Sie wissen, ist der Grundblock der Architektur der GCN-Block, aus dem alle Grafikprozessoren der Southern Islands-Serie zusammengesetzt sind. Der GCN-Rechenblock ist in Unterabschnitte unterteilt, von denen jeder mit seinem eigenen Befehlsfluss arbeitet. GCN-Blöcke verfügen über 64 KB dedizierten lokalen Datenspeicher für den Datenaustausch oder die Erweiterung des lokalen Registerstapels. Der Block verfügt außerdem über einen First-Level-Cache mit Lese-/Schreibfunktionen und eine vollwertige Texturpipeline mit Sampling- und Filtereinheiten. Jeder der vorhandenen GCN-Blöcke ist in der Lage, selbst Befehle zu planen und zu verteilen, und ein Rechenblock kann mehrere unabhängige Befehlsströme ausführen. Schauen wir uns das Blockdiagramm des neuen Chips an:

Das Design von Bonaire bestätigt das Ziel der neuen Lösung, Leistung zwischen Kap Verde mit 10 GCN-Recheneinheiten und Pitcairn mit 20 GCN-Einheiten anzubieten. Diese beiden GPUs, die 2012 auf den Markt kamen, sind fast genau halb so groß wie die anderen und hinterlassen in der Mitte eine ziemlich große Leistungslücke, die Bonaire nun geschlossen hat.

Das Diagramm zeigt einen Grafikprozessor in Form einer Radeon HD 7790, der eine Komplettlösung ohne Abstriche bei den Blöcken darstellt. Der Chip umfasst 14 Recheneinheiten der GCN-Architektur, was 896 Stream-Prozessoren entspricht. Da jeder GCN-Block 4 Textureinheiten enthält, beträgt die endgültige Anzahl an TMUs für das neue Modell 56 TMUs. Das heißt, Bonaire ist in Bezug auf die Geschwindigkeit mathematischer Berechnungen und Texturabrufe unter der Annahme gleicher Frequenzen genau 1,4-mal schneller als der kapverdische Chip.

Aber die Anzahl der ROP-Einheiten und Speichercontroller in Bonaire und Radeon HD 7790 ähnelt der, die wir in Cape Verde und Radeon HD 7770 gesehen haben – sie haben beschlossen, 16 ROP-Einheiten zu belassen, und der Speicherbus des neuen Chips ist 128-Bit. aus zwei 64-Bit-Bit-Kanälen zusammengesetzt. Die geringe Anzahl an ROP-Blöcken stellt möglicherweise die „Achillesferse“ der Lösung dar, da durch den Einsatz von schnellem GDDR5-Speicher ein relativ hoher Durchsatz von 96 GB/s möglich war, an der ROP-Leistung lässt sich jedoch nichts ändern.

Die neue GPU bietet jedoch Verbesserungen bei der geometrischen Leistung und der Tessellationsgeschwindigkeit. Ja, Kap Verde verfügt auch über einen Tessellator der 9. Generation, aber Bonaire hat auch die Anzahl der geometrischen Blöcke, Rasterizer und Befehlsprozessoren (im Diagramm als ACEs angegeben) verdoppelt – jetzt sind es alle zwei. Diese Verbesserung gibt Bonaire die Möglichkeit, bis zu zwei geometrische Grundelemente pro Taktzyklus zu verarbeiten – genau wie die leistungsstärkeren Pitcairn und Tahiti.

Wie Sie sich erinnern, erreichte AMD mit der Radeon HD 7770 erstmals den wichtigen psychologischen Meilenstein der GPU-Taktfrequenz von 1 GHz. Die HD 7790 hat also auch genau die gleiche Referenzfrequenz von 1 GHz, sodass die Leistungssteigerung gegenüber der HD 7770 allein durch architektonische Änderungen und eine Erhöhung der Anzahl der Ausführungseinheiten gerechtfertigt sein wird.

Die Betriebsfrequenz des Videospeichers des neuen Produkts ist jedoch viel höher. Hatte die HD 7770 eine relativ niedrige Speicherfrequenz von 4,5 GHz, so ist die HD 7790 mit schnellem GDDR5-Speicher mit 6 GHz ausgestattet, der ein Drittel mehr Bandbreite bietet. Die im Vergleich zu Modellen der Radeon HD 7700-Unterfamilie um 33 % erhöhte Videospeicherbandbreite führte zu einer deutlichen Steigerung der Spieleleistung. AMD stellt dieses Diagramm zur Verfügung, in dem die Bildraten der HD 7790 mit Speicher mit 4,5 und 6,0 ​​GHz verglichen werden:

Die maximale Beschleunigung durch eine Erhöhung der Speicherbandbreite wurde in Spielen wie StarCraft II und Crysis 2 erreicht. Und im Durchschnitt führt eine Erhöhung der Speicherbandbreite um 33 % zu einer Steigerung der durchschnittlichen Bildrate um etwa 10 % in einer Reihe moderner Spiele . Dies ist ein guter Indikator, der zeigt, dass die Speicherbandbreite heutzutage sehr wichtig ist, obwohl sie nicht der einzige Fokus auf Produktivität ist. Obwohl es durchaus möglich ist, dass Bonaires Geschwindigkeit mit mehr ROP noch höher wäre ...

Es ist deutlich zu erkennen, dass der durchschnittliche Stromverbrauch im Vergleich zur HD 7770 leicht gestiegen ist. Wenn dieser Wert beim alten Modell 80 W beträgt, sind es bei der HD 7790 85 W – das ist ein sehr geringer Preis für eine theoretische Leistungssteigerung von 33-40 %! Architekturverbesserungen (PowerTune), die Entwicklung einer neuen GPU unter Nutzung der Erfahrungen früherer GPUs sowie die kontinuierliche Verbesserung des technischen Prozesses bei TSMC – all dies führte zu einem leichten Anstieg des Verbrauchs bei gleichzeitig deutlicher Verbesserung der Geschwindigkeitseigenschaften.

Was die Chipfläche und die Anzahl der Transistoren in Bonaire betrifft, ist der neue Chip deutlich größer als Kap Verde, aber die Hinzufügung von Rechen-, Textur- und Geometrieeinheiten konnte nicht unbemerkt bleiben. Nach diesen Parametern liegt Bonaire auch ungefähr in der Mitte zwischen Kap Verde und Pitcairn. Bonaire enthält 2,08 Milliarden Transistoren in einem 160 mm 2 großen Chip, für Kap Verde sind es 1,5 Milliarden bzw. 123 mm 2 und für Pitcairn sind es 2,8 Milliarden Transistoren und 212 mm 2 Chipfläche.

Selbstverständlich unterstützt der neue Chip alle AMD-Technologien, die in der neuen Radeon HD 7000-Familie eingeführt und verbessert wurden (eine unvollständige Liste: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, verbesserte Qualität der Texturfilterung usw.), beides ist dabei ausführlich beschrieben im Artikel AMD Radeon HD 7970: The New Single-Processor Leader. Die HD 7790 unterstützt alle dort aufgeführten Features, darunter AMD Eyefinity 2.0 mit sechs Monitoren und Stereo-Rendering, und verfügt außerdem über eine verbesserte Video-Dekodierungs- und Kodierungseinheit.

Verbesserte PowerTune-Technologie

Bereits 2010 führte AMD die PowerTune-Technologie in seinem Cayman-Chip (AMD Radeon HD 6900-Serie) ein. Diese GPU war die erste, die über eine dynamische Energieverwaltung namens PowerTune verfügte. Es ermöglichte höhere maximale Taktraten für typische Anwendungen und vermied gleichzeitig einen zu hohen Stromverbrauch bei speziellen Stabilitätstests wie FurMark. Dann wurde die Technologie auf das Dual-Chip-Modell AMD Radeon HD 6990 angewendet, das sie aus offensichtlichen Gründen noch mehr benötigte.

Mitte 2012 erhielt die Technologie ein ernstes Update, als AMD PowerTune um die automatische Frequenzerhöhung – Boost – erweitert wurde. Bei der AMD Radeon HD 7970 GHz Edition ermöglichte dieser Algorithmus eine weitere Leistungssteigerung im Vergleich zur regulären Version der Grafikkarte. Der PowerTune-Betriebsalgorithmus in Grafikkarten ohne automatische Übertaktung verwendet drei Zustände: Leerlauf, Low-3D und Full-Speed. Die HD 7970 GHz verfügt außerdem über einen Boost-Übertaktungsmodus. PowerTune dient dazu, den erforderlichen Verbrauch einzuhalten und bei Bedarf in einen niedrigeren Lastmodus zu wechseln. In diesem Fall reduziert die Technologie die Taktfrequenz stark. In der Praxis sind solche Sprünge selten – aufgrund der großen Lücke zwischen den beiden aktiven Modi.

Durch die Reduzierung der GPU-Taktrate wird der Stromverbrauch gesenkt, für eine effizientere Steuerung müssen Sie jedoch auch die Spannung reduzieren. Genau das macht die Radeon HD 7790. Der neue Bonaire-Grafikchip verfügt über acht Zustände mit unterschiedlichen Frequenzen und Spannungen, sodass Sie höhere Taktraten als zuvor erreichen können, während die GPU immer mit der optimalen Spannung und Frequenz läuft. Das Umschalten zwischen den Zuständen basiert auf der GPU-Auslastung sowie dem aktuellen Energieverbrauch des Videochips.

Beim neuen Algorithmus muss PowerTune die Frequenz bei Überschreitung des Verbrauchsniveaus nicht abrupt zurücksetzen und mit der Frequenz sinkt auch die Spannung. Übergänge zwischen den Zuständen müssen so schnell wie möglich erfolgen, um die Verbrauchsgrenze nicht einmal für kurze Zeit zu überschreiten. Deshalb wechselt Bonaire alle 10 ms den PowerTune-Zustand, d. h. der Zustand des Chips ändert sich 100 Mal pro Sekunde.

Bei solch einer ständigen Änderung der Frequenzen zeigen Anwendungen von Drittanbietern wie MSI Afterburner und GPU-Z keine momentanen Taktratenwerte an, sondern Durchschnittswerte über einen bestimmten Zeitraum – die sogenannte „effektive“ Frequenz. Eine weitere interessante Entwicklung ist, dass AMD neue PowerTune-Einstellungen für Anwendungen von Drittanbietern öffnet. Partner können auch ihre eigenen PowerTune-Einstellungen festlegen, was bei der Erstellung werkseitig übertakteter Grafikkartenmodelle hilfreich ist und mehr Optionen bietet, die nicht durch AMD-Referenzwerte eingeschränkt sind. Unterschiedliche PowerTune-Einstellungen können zwar dazu führen, dass Grafikkarten desselben Modells von verschiedenen Herstellern nicht nur unterschiedliche Taktfrequenzen haben, sondern auch den Algorithmus, der diese im Laufe der Zeit ändert, was einen Vergleich unter gleichen Bedingungen erschwert.

Der Verkauf von Radeon HD 7790-Grafikkarten auf dem Markt begann Anfang April 2013. AMD organisierte zusammen mit seinen Partnern die Veröffentlichung beider Motherboards mit Referenzfrequenzen und werkseitig übertakteten Lösungen. Und nun bringen beide Hersteller etwa auf die gleiche Weise neue Grafikkarten auf den Markt, wobei verschiedene Optionen schnell bei ihren Partnern verfügbar sind. Tatsächlich haben die Partner fast mehr übertaktete Versionen der HD 7790 herausgebracht als reguläre, und die darin enthaltenen Grafikchips arbeiten mit Frequenzen von etwa 1075 MHz.

Details: Radeon HD 7990-Modell

  • Codename „Malta“
  • Fertigungstechnologie: 28 nm
  • 2 Chips mit jeweils 4,3 Milliarden Transistoren
  • Eine einheitliche Architektur mit einer Reihe gemeinsamer Prozessoren für die Stream-Verarbeitung zahlreicher Datentypen: Eckpunkte, Pixel usw.
  • Hardwareunterstützung für DirectX 11.1, einschließlich Shader Model 5.0
  • Dualer 384-Bit-Speicherbus: zweimal sechs 64-Bit-breite Controller mit Unterstützung für GDDR5-Speicher
  • GPU-Frequenz: 1000 MHz
  • Zweimal 32 GCN-Recheneinheiten mit jeweils 128 SIMD-Kernen, bestehend aus insgesamt 4096 Gleitkomma-ALUs (Ganzzahl- und Gleitkommaformate, Unterstützung für FP32- und FP64-Präzision innerhalb des IEEE 754-Standards)
  • 2x128 Textureinheiten, mit Unterstützung für trilineare und anisotrope Filterung für alle Texturformate
  • 2x32 ROP-Einheiten mit Unterstützung für Antialiasing-Modi und der Möglichkeit, programmierbar mehr als 16 Samples pro Pixel abzutasten, einschließlich mit FP16- oder FP32-Framebufferformat. Spitzenleistung bis zu 64 Samples pro Takt und im Nur-Z-Modus – 256 Samples pro Takt
  • Integrierte Unterstützung für bis zu sechs Monitore über HDMI 1.4a- und DisplayPort 1.2-Schnittstellen

Technische Daten der Radeon HD 7990-Grafikkarte

  • Kernfrequenz: 1000 MHz
  • Anzahl Universalprozessoren: 4096
  • Anzahl der Texturblöcke: 2x128, Mischblöcke: 2x32
  • Effektive Speicherfrequenz: 6000 MHz (4x1500 MHz)
  • Speichertyp: GDDR5
  • Speicherkapazität: 2x3 Gigabyte
  • Speicherbandbreite: 2x288 Gigabyte pro Sekunde.
  • Theoretische maximale Füllrate: 64 Gigapixel pro Sekunde.
  • Theoretische Textur-Abtastrate: 256 Gigatexel pro Sekunde.
  • Ein CrossFire-Anschluss
  • PCI Express 3.0-Bus
  • Anschlüsse: DVI Dual Link, vier Mini-DisplayPort 1.2
  • Stromverbrauch bis zu 375 W
  • Zwei 8-polige Hilfsstromanschlüsse
  • Dual-Slot-Design
  • Empfohlener Preis für Russland - 32.999 Rubel. (für die USA – 999 $).

Bereits in der zweiten Generation der AMD-Grafikkarten bleibt das Namensprinzip für Dual-Chip-Modelle unverändert. Die Top-Lösung auf zwei leistungsstarken Videochips unterscheidet sich vom Modell der Vorgängergeneration entsprechend ihrer Klasse durch die erste Ziffer im Index: Statt 6 erhielt sie die Zahl 7, was auf eine neue Serie hinweist. Die angekündigte Grafikkarte unterscheidet sich von der Single-Chip-Lösung in der dritten Ziffer, was auf maximale Leistung innerhalb der Generation hinweist.

Was den Vergleich mit der Konkurrenz betrifft, so ist der Hauptkonkurrent des heute angekündigten Radeon HD 7990-Modells die vor fast einem Jahr veröffentlichte GeForce GTX 690-Grafikkarte, und es sind diese Dual-Chip-Lösungen, die miteinander kämpfen müssen. Zwar verfügt NVIDIA auch über eine weitere leistungsstarke Lösung, die jedoch auf einer einzigen GPU basiert – die GeForce GTX Titan, die ebenfalls als Konkurrent des betreffenden Boards von AMD angesehen werden kann.

Die neue Dual-Chip-Radeon-Grafikkarte ist mit 3 Gigabyte GDDR5-Speicher für jede GPU ausgestattet, was auf den 384-Bit-Speicherbus der Tahiti-Chips zurückzuführen ist. Diese Menge ist für ein Produkt auf so hohem Niveau durchaus gerechtfertigt, da in manchen modernen Gaming-Anwendungen mit maximalen Einstellungen, aktiviertem Anti-Aliasing und hohen Auflösungen eine geringere Speichermenge (2 Gigabyte pro Chip oder weniger) möglicherweise nicht mehr vorhanden ist genug. Dies gilt umso mehr beim Rendern im Stereomodus oder auf mehreren Monitoren im Eyefinity-Modus.

Es ist klar, dass eine so leistungsstarke Dual-Chip-Grafikkarte über ein massives Dual-Slot-Kühlsystem verfügt, das sich von herkömmlichen Kühlern für AMD-Karten unterscheidet. Es verfügt über einen massiven Kühler, der unter einem Gehäuse verborgen ist, mit drei großen Lüftern, die mit relativ niedrigen Drehzahlen arbeiten. Der Stromverbrauch einer Karte mit zwei GPUs an Bord ist aus offensichtlichen Gründen recht hoch und verfügt über zwei 8-Pin-Stromanschlüsse, aber immerhin sind es nicht drei, wie es bei Nicht-Referenzmustern auf Basis von zwei Tahiti-Chips der Fall war .

Die Architektur

Da die Grafikkarte mit dem Codenamen „Malta“ auf zwei „Tahiti“-GPUs aus der Southern-Islands-Familie basiert, können Sie einfach auf sie verweisen, die alle Funktionen der aktuellen Graphics Core Next (GCN)-Architektur sorgfältig beschreibt. In Grundmaterialien wiederholen wir nur die wichtigsten Eigenschaften und Merkmale bestimmter Produkte.

Der Grundblock der Architektur ist der GCN-Block, aus dem alle GPUs der Serie zusammengesetzt sind. Die Recheneinheit ist in Unterabschnitte unterteilt, von denen jeder mit seinem eigenen Befehlsfluss arbeitet. Sie verfügt über einen dedizierten lokalen Datenspeicher, einen Lese-/Schreib-L1-Cache und eine vollständige Texturpipeline mit Abruf- und Filtereinheiten. Jeder der GCN-Blöcke ist in der Lage, selbst Befehle zu planen und zu verteilen, und ein Rechenblock kann mehrere unabhängige Befehlsströme ausführen. Die Radeon HD 7990 nutzt zwei uns bereits bekannte Tahiti-Chips:

Das Diagramm des Grafikprozessors (bei der Radeon HD 7990 gibt es zwei davon) zeigt 32 Recheneinheiten der GCN-Architektur und alle sind aktiv. Früher ging man davon aus, dass für eine Zwei-Chip-Lösung einige davon deaktiviert und die Frequenz sogar gesenkt werden müssten, um die Leistungsaufnahmegrenzen von 375 W zu erreichen, doch den AMD-Ingenieuren gelang es, dieses schwierige Problem erfolgreich zu lösen. Möglicherweise wurde eine spezielle neue Tahiti-Revision mit reduziertem Stromverbrauch veröffentlicht, oder die Chips durchlaufen einfach einen sehr strengen Auswahlprozess.

Da jede GCN-Einheit 16 Textureinheiten enthält, beträgt die Anzahl der TMUs 128 Einheiten pro Chip, was eine Endleistung von 256 Gigatexeln pro Sekunde ergibt, was für einen Konkurrenten der GeForce GTX 690 sehr gut ist. Anzahl der ROP-Einheiten und Speichercontroller Auch bei der HD 7990 änderte sich im Vergleich zum Single-Chip-Pendant nichts; es wurden jeweils 32 bzw. 6 Stück pro GPU belassen. Die Radeon HD 7990 verfügt über zwei 384-Bit-Speicherbusse, die aus zwölf 64-Bit-Kanälen bestehen, was eine Gesamtspeicherbandbreite von 576 GB/s bietet – ein weiterer rekordverdächtiger Wert.

Ansonsten unterstützt das neue Board alle modernen AMD-Technologien, die in den neuen Videochips der Radeon HD 7000-Reihe eingeführt und verbessert wurden: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, verbesserte Texturfilterqualität usw. All dies ist oben in der Beschreibung der Radeon HD 7970 ausführlich beschrieben, und es hat einfach keinen Sinn, es zu wiederholen.

Kühlsystem und Stromverbrauch

Bei solch anspruchsvollen Dual-Chip-Boards ist ein hocheffizientes Kühlsystem besonders wichtig. Kamen bei Lösungen von Partnern auf Basis von Two Tahiti Drei-Slot-Lösungen zum Einsatz und bei ASUS ARES II eine Wasserkühlung, musste in diesem Fall mit weniger Aufwand, also einem Kühler, ausgekommen werden wurde mit einem sehr massiven Kühler und drei Lüftern mit verbesserten akustischen Eigenschaften entwickelt.

Der Geräuschpegel des Kühlsystems und die für GPUs bereitgestellte Temperatur gehören zu den wichtigsten Verbrauchermerkmalen jeder Grafikkarte, auch einer Top-End-Lösung für Enthusiasten. Ein zu lautes oder ineffektives Kühlsystem wird von Käufern als weniger rentable Anschaffung angesehen, wenn alle anderen Faktoren (ungefähr) gleich sind. Daher hat AMD dieses Thema beim Modell Radeon HD 7990 im Vergleich zu anderen Top-Lösungen auf dem Markt sehr ernst genommen. Schauen wir uns die akustischen Eigenschaften des neuen Systems an:

Das Diagramm zeigt den Geräuschpegel von drei verschiedenen Grafikkarten: der Radeon HD 7990 und zwei Konkurrenten: der Dual-Chip GeForce GTX 690 und der Single-Chip GTX Titan von NVIDIA. Darüber hinaus wurde die Geräuschentwicklung unter verschiedenen Bedingungen gemessen – im Idle-Modus (System Idle) und bei maximaler Last mittels Furmark. Glaubt man den Zahlen von AMD, dann kommt selbst der Single-Chip-Titan in puncto Geräuschpegel des Kühlers nicht an sein neues Produkt heran, ganz zu schweigen von der Dual-Chip-GTX 690, die in diesem Vergleich am lautesten ist.

Aber wurde eine solch beeindruckende akustische Leistung auf Kosten der GPU-Temperatur erreicht? Das folgende Diagramm zeigt die GPU-Temperaturen, die auf der Radeon HD 7990 von AMD und denselben beiden Konkurrenten gemessen wurden. Diesmal nutzten die AMD-Spezialisten beim Test bei Furmark ausschließlich den Hochlastmodus.

Und wieder wird eine „knifflige“ Koordinatenachse verwendet, deren Ursprung nicht bei Null liegt. Der tatsächliche Unterschied zwischen 80 und 82 Grad bei der Radeon HD 7990 und GTX Titan wird praktisch nicht wahrnehmbar sein, obwohl 87 Grad bei der GTX 690 deutlich schlechter ausfallen. Wir weisen erneut darauf hin, dass alle diese Tests von einem Interessenvertreter durchgeführt wurden und einer unabhängigen Überprüfung unterliegen.

Hinsichtlich des Stromverbrauchs gibt es bei der Dual-Chip-Lösung nichts Neues, allerdings gibt es auch Unterstützung für die bereits angekündigte ZeroCore Power-Technologie. Diese Technologie trägt dazu bei, den Stromverbrauch im tiefen Leerlaufmodus (oder Schlafmodus) bei ausgeschaltetem Anzeigegerät deutlich zu senken. In diesem Modus ist die GPU im Leerlauf fast vollständig ausgeschaltet und verbraucht weniger als 5 % der Energie des Vollmodus, wodurch die meisten Funktionseinheiten deaktiviert werden. Und im Falle einer Zwei-Chip-Platine ist es noch wichtiger, dass im CrossFire-System beim Rendern einer zweidimensionalen Schnittstelle des Betriebssystems alle GPUs außer der Haupt-GPU überhaupt nicht funktionieren. Das heißt, im Fall der Radeon HD 7990 wird einer der Chips im 2D-Modus mit minimalem Energieverbrauch in den Tiefschlaf versetzt, und der zweite kann im tiefen PC-Leerlaufmodus „einschlafen“.

Moderne Spiele erfordern jedes Jahr immer leistungsfähigere Grafikkarten für die Grafikverarbeitung. Eine der preisgünstigsten Lösungen für Gamer wird die AMD Radeon HD 7800-Serie sein. Schauen wir uns die technischen Eigenschaften dieser Serie sowie ihre Funktionen und Leistung in Spielen an.

Schauen wir uns die Eigenschaften der AMD Radeon HD 7800-Serie in Form einer Tabelle an:

Technischer Prozess 28 nm
GPU Pitcairn
Frequenz (min. max. bei Modellen) 800-1000 MHz
Rom Typ GDDR5
Volumen 2 GB
Frequenz 800-1200 MHz
Bandbreite 153,6 GB/s
Schnittstellen Speichergröße 256-Bit
Reifentyp PCI Express 3.0
Die Architektur GCN
Stream-Prozessoren pro Block von 64 bis 80
Anzahl der Blöcke von 16 bis 20
Gesamtzahl der Stream-Prozessoren 1024-1280
Kerne zur Geometriebearbeitung 2 Stk.
Kerne für asynchrones Computing 2 Stk.
Anschlüsse HDMI

DisplayPort 1.2

Unterstützte Technologien und Software DirectX 11 Ja
OpenGL 4.2 Ja
Eyefinity (Monitorzusammenführung) bis zu 6 Stk.
ZeroCore Power Schlafmodus
Katalysator Markentreiber und Einrichtung
App-Beschleunigung Verbesserung der Videowiedergabequalität
AMDHD3D 3D-Grafikverarbeitung
Power Tune Dynamische Anpassung des Stromverbrauchs

Die Linie wurde im März 2012 produziert. Darauf aufbauend wurden folgende Modelle veröffentlicht:

  • HD7850;
  • HD7870;
  • HD7890.

Derzeit wird die Modellreihe nicht mehr produziert. Zu Beginn des Verkaufs lag der Durchschnittspreis in den Geschäften bei 249 $ und 349 $.

Rezension

Bei AMD wurde nach dem Einstieg in ein neues technologisches Verfahren beschlossen, die gesamte Produktionsserie in Untergruppen aufzuteilen. Daher wurden insgesamt 4 Linien auf Basis der 28-nm-Prozesstechnologie gebildet, die in der Tabelle dargestellt sind:


Die HD 7800 mit der „Pitcairn“-GPU nutzt die Graphic Core Next-Mikroarchitektur. Die Serie kam im März 2012 auf den Markt und wird heute nicht mehr produziert.

Einst waren Grafikkarten aus Pitcairn sehr beliebt und wiesen ein hervorragendes Preis-Leistungs-Verhältnis auf. Mit Stand 2018 erfreut sich die aktuelle Serie keiner Beliebtheit und es ist äußerst schwierig, ein Gerät im Neuzustand zu finden. Obwohl der Grafikkern bereits veraltet ist, kann ein PC in Kombination mit einem leistungsstarken Prozessor verschiedene Spiele auf mittleren und hohen Einstellungen ausführen.

Welche Spiele laufen auf der AMD Radeon HD 7800-Serie?

Grafikkarten wurden bereits 2012 auf den Markt gebracht, können aber immer noch in modernen Spielzeugen verwendet werden. Tests in Spielen der AMD Radeon HD 7800-Serie wurden mit folgender Hardware durchgeführt:

  • Prozessor: Core I5 ​​​​6500 3,2 GHz.
  • RAM: 16 GB DDR4 2133 Dual.
  • Festplatte: Hitachi 1 TB.
  • Hauptplatine: Asus H170M-Plus.
  • Auflösung: 1920x1080px.

Die Ergebnisse sind wie folgt:

Name des Spiels

Grafikqualität
Assassins Creed Syndicate Höhe 31
WarThunder Kino (Ultra) 55-65
Quantenbruch Durchschnitt 30-42
Assassin's Creed Unity Durchschnitt 30
Schattenkrieger 2 Hoch 35-45
Sterbendes Licht Hoch 40-50
Fallout 4 Ultra 38-43
GTA 5 Überdurchschnittlich 45-50
UNTERGANG Hoch 40
Aufstieg des Tomb Raider Hoch 30-40
Warface Hoch 90-100
The Witcher 3: Blut und Wein Hoch 25-35
Welt der Panzer Hoch 60-80

Die Gesamtleistung hängt weitgehend von der richtigen Kombination aus Prozessor und Grafikkarte ab. Wenn Sie einen leistungsstarken Prozessor der modernen Generation wie Ryzen oder Core I5 ​​nehmen, können diese in den meisten modernen Spielen hohe FPS zeigen, selbst mit einer alten Grafikkarte.

Nach der Analyse der technischen Eigenschaften und Tests in Spielen kommen wir zu folgenden Schlussfolgerungen: Für leistungsstarke Spiele im Jahr 2018 wird der Kauf nicht empfohlen; es ist besser, neuere Modelle zu wählen.

Die Leistung reicht für bequeme Heimarbeit und zum Ausführen von Multiplayer-Spielen wie CS:GO, World Of Tanks.

So übertakten Sie eine Grafikkarte

Um die maximale Leistung zu erreichen, können Sie die AMD Radeon HD 7800 übertakten. Dazu müssen Sie den Treiber installieren und konfigurieren.

Die wichtigsten Änderungen müssen im Abschnitt „Spiele“ vorgenommen werden. Wenn Sie einen modernen Treiber verwenden, können Profile für jedes Videospiel individuell konfiguriert werden.

Gehen Sie zum gewünschten Profil und gehen Sie zur Einstellung „Frame Rate Control“. Standardmäßig holt die Grafikkarte die maximale FPS heraus und gibt alle Ressourcen dafür aus.

Für ein komfortables Shooter-Spiel reichen 60 Bilder pro Sekunde. Für CS:GO, WarFace, WarThunder reicht es, das Limit auf 70 FPS zu setzen.

Durch die Einstellung von OverDrive können Sie Betriebsparameter anpassen: GPU- und Speicherfrequenzen, Lüftereffizienz und Stromverbrauch. Diese Parameter müssen für jeden PC-Build individuell konfiguriert werden.

Laden Sie Treiber für die AMD Radeon HD 7800-Serie herunter

Um Treiber für die Radeon HD 7800-Serie herunterzuladen, verwenden Sie das proprietäre automatische Suchprogramm. Sie können es auf der offiziellen Website des Herstellers herunterladen. Dort finden Sie auch Treiber für jede Betriebssystemversion: Windows 7, Windows 10 usw.

Seite 2 von 5

„Südliche Inseln“

Zunächst ein wenig zur Kennzeichnung seiner neuesten Produkte durch AMD. Der Hersteller hat sie je nach Leistung in drei Stufen eingeteilt. Der Codename „Cape Verde“ bezieht sich auf die Radeon HD 7700. Hinter dem Namen „Pitcairn“ verbergen sich die heutigen Testteilnehmer Radeon HD 7870 und HD 7850. Hochleistungsprodukte heißen „Tahiti“ oder Radeon HD 7900. Dies wird weiter unten deutlicher dargestellt.

  • Einstiegsniveau = Kap Verde = Radeon HD 7700-Serie;
  • Mainstream = Pitcairn = Radeon HD 7800-Serie;
  • Hochleistungsprodukte = Tahiti = Radeon HD 7900-Serie.

Das heißt, AMD deckt mit seinen 28-nm-Grafikchips derzeit alle Marktsegmente ab. Es wird lediglich die Veröffentlichung einer Dual-Core-Grafikkarte auf Basis von Tahiti-Chips erwartet. Vorläufiger Name Radeon HD 7990.

Merkmale der AMD Radeon HD 7800-Serie

Der Radeon HD 7800-Grafikprozessor (Pitcairn) verfügt über etwa 2,8 Milliarden Transistoren und eine Graphic Core Next-Mikroarchitektur. Wie oben erwähnt verfügt der Radeon HD 7850 Chip (Pitcairn Pro) über 16 Recheneinheiten und seine maximale TDP beträgt 130 Watt. Für die Radeon HD 7870 (Pitcairn XT) liegen diese Werte bei 20 bzw. 175.

Die folgende Folie zeigt die wichtigsten Spezifikationen der Radeon HD 7850- und HD 7870-Grafikkarten

2 GB GDDR5-Speicher gehören bei den meisten Mid- und High-End-Modellen bereits zum Standard. Dank 256-Bit. Bus und einer hohen Taktfrequenz von 1200 MHz (4800 MHz effektiv) beträgt die Bandbreite 154 GB/s. Dies wirkt sich positiv auf die Leistung bei Spielen mit hoher Auflösung und Bildqualität aus.

PCI-Express-3-Schnittstelle

Im zweiten Halbjahr 2011 stellten fast alle Mainboard-Hersteller ihre Mainboard-Modelle mit der PCI-Express-Schnittstelle der 3. Generation vor. Mit der Veröffentlichung der Radeon HD 7000-Serie erschienen auch Grafikkarten mit dieser Schnittstelle. PCI Express 3 verfügt über die doppelte Bandbreite (32 Gbit/s) als PCI Express der vorherigen Generation. Im Vergleich zu PCIe 2 wurde die Bandbreite pro Lane von 500 MB/s auf 1 GB/s verdoppelt.

Um die Vorteile des neuen PCIe 3 nutzen zu können, benötigen Sie natürlich nicht nur eine Grafikkarte und ein Motherboard mit dieser Schnittstelle, sondern auch Unterstützung durch den Prozessor (nicht alle Modelle der Ivy Bridge-Familie unterstützen PCIe 3).

Eyefinity 2.0

AMD hat die Entwicklung seiner Eyefinity-Technologie weiterentwickelt, mit der Bilder auf mehreren Monitoren angezeigt werden können. Dank der hohen Rechenleistung der HD 7000-Serie und der Unterstützung von Eyefinity 2.0 ist es nun möglich, Bilder auf mehreren Monitoren mit einer Gesamtauflösung von 16000 x 16000 anzuzeigen. Dies ermöglicht Ihnen die Anzeige von Bildern auf 5 Displays mit einer Auflösung von 2560 x 1600 im Querformat installiert. Um mit solchen Auflösungen arbeiten zu können, sind die älteren Modelle der Familie mit rekordverdächtigen 3 GB GDDR5 (HD 7970 und HD 7950) ausgestattet.

AMD Catalyst-Treiber unterstützen ab den Februar-Versionen benutzerdefinierte Auflösungen. Das heißt, Sie können die erforderliche Auflösung je nach Konfiguration der Displays in Eyefinity einstellen. Ab Catalyst 12.2 besteht die Möglichkeit, das Startmenü auf dem für Sie bequemsten Display zu installieren und nicht wie zuvor ganz links. Darüber hinaus unterstützt Eyefinity 2 die Bildausgabe im HD3D-Stereomodus. Unterstützt wird die Kombination von drei Monitoren, die im 3D-Modus arbeiten.

Verbesserte Tessellation

AMDs Radeon HD 7000-Grafikkartenfamilie verfügt über einen Tessellator der neunten Generation und konnte bei der Verarbeitung von Geometrie in modernen Spielen deutliche Leistungssteigerungen verzeichnen. Der GCN-Kern umfasst immer noch zwei Grafik-Engines, aber wo sie früher Tessellations- und Rasterisierungseinheiten enthielten, bestehen sie jetzt aus einer beliebigen Anzahl von Pipelines, die der Geometrie- und Pixelverarbeitung gewidmet sind.

AMD Radeon HD 7800-Grafikkarten unterstützen die HDMI 1.4a-Schnittstelle, die die Ausgabe eines 120-Hz-Bildes (60 Hz pro Auge) ermöglicht, wodurch Sie 3D-Bilder anzeigen können. Mit früheren HDMI-Versionen war dies nicht möglich. Ab Dezember ermöglichte AMD die Zusammenarbeit von HD3D und Eyefinity in Treibern.

DirectX 11.1

Grafikkarten der Radeon 7000-Familie werden künftig DirectX 11.1 unterstützen. Es ist noch zu früh, um zu sagen, was dies in der Praxis bringen wird, da DX 11.1 zusammen mit Windows 8 veröffentlicht wird. Die Hauptvorteile der neuen API werden wie folgt beschrieben:

  • Unabhängige Rasterung;
  • Flexible Kombination aus Grafikberechnung und Videoverarbeitung;
  • Native Stereo 3D-Unterstützung.

AMD Unified Video Decoder

Es handelt sich um einen Hardwareteil von AMD-GPUs, der für die Dekodierung des Videostreams verantwortlich ist. UVF hat in der Radeon 7000-Serie einige Verbesserungen erhalten. Im Allgemeinen behielt UVD alle Funktionen seiner Vorgänger bei, nämlich Unterstützung für H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV-Profil D, Multi-View Codec (MVC), Video Codec Engine (VCE), AMD Steady Video 2.0. Unterstützung für das Dual Stream HD+HD-Format hinzugefügt.

Hoch