Descrizione del dispositivo AMD Radeon HD 7800 Series. Famiglie di schede video AMD Radeon Informazioni di riferimento. Overclocking e temperature

Serie 7800 con caratteristiche che differiscono l'una dall'altra. Il chip, realizzato sulla microarchitettura Graphic Core Next, occupa uno spazio pari a 2,8 miliardi di transistor. Come la maggior parte delle schede Radeon, è dotata della tecnologia Eyefinity, che consente di collegare fino a sei monitor contemporaneamente. Possono funzionare indipendentemente l'uno dall'altro oppure formare un unico grande monitor. Tutto dipende da quali impostazioni verranno impostate.

Radeon 7850

Questa scheda video AMD serie 7800 ha una frequenza del processore di 800 megahertz. Prestazioni e throughput elevati (153 gigabit al secondo) sono forniti da un bus a 256 bit. Il sistema informatico elabora dati pari a 1,76 teraflop. Ci sono 16 unità computazionali e 64 unità texture. Esistono due core per i processi informatici.

Il formato della memoria corrisponde al marchio GDDR5 e il supporto per DirectX versione 11 contribuirà ad accelerare l'interazione con le applicazioni del sistema operativo. Per ottimizzare al meglio le prestazioni della scheda, è necessario monitorare gli aggiornamenti dei driver, poiché solo loro possono sbloccare completamente tutte le funzionalità della GPU e fornire accesso alle impostazioni necessarie. I driver di base che identificano la scheda video nel sistema sono inclusi con la scheda e la versione aggiornata può essere visualizzata sul sito Web AMD.

Questo processore grafico AMD Radeon HD serie 7800 supporta le più recenti tecnologie integrate che ti consentono di goderti immagini fluide e di alta qualità in 60 fotogrammi e la risoluzione può raggiungere 4096 x 2160 pixel. Lo stesso vale per il flusso audio, che soddisfa tutti i requisiti moderni, producendo un suono di alta qualità.

Radeon 7870

Questa scheda video AMD Radeon HD 7800 Series è un potente successore della scheda precedente. Ha a disposizione un intero gigahertz per lavorare con il processore grafico. Le prestazioni per le operazioni di calcolo sono molto più elevate rispetto alla versione precedente: 2,56 teraflop. Ci sono 20 unità computazionali e 80 unità texture.

Poiché si tratta dell'ammiraglia della serie 7800, è superiore al fratello sotto molti aspetti. Il supporto per la tecnologia tassellatura è stato implementato nelle schede video di questo produttore da molto tempo, ma in questa versione è portato al limite. Ora puoi goderti un'immagine tridimensionale sorprendente per realismo e dettaglio. E un migliore anti-aliasing aiuterà a ottenere un'immagine fluida e piacevole.

In altri parametri, questo rappresentante della serie AMD Radeon HD 7800 ha caratteristiche completamente identiche alla precedente scheda video. Entrambe le schede sono in grado di supportare la tecnologia 3D sia nei video che nei giochi. È anche possibile collegare più schede per migliorare le prestazioni, ma questo parametro può dipendere anche dalle capacità della scheda madre.

  • Nome in codice del chip: "Tahiti"
  • 4,3 miliardi di transistor (oltre il 60% in più del Cayman ed esattamente il doppio del Cypress)
  • Bus di memoria a 384 bit: sei controller a 64 bit che supportano la memoria GDDR5
  • Coreclock: fino a 925 MHz (per Radeon HD 7970)
  • 32 unità di calcolo GCN, inclusi 128 core SIMD, costituiti da un totale di 2048 ALU in virgola mobile (formati interi e in virgola mobile, supporto per la precisione FP32 e FP64 all'interno dello standard IEEE 754)
  • 128 unità texture, con supporto per filtraggio trilineare e anisotropico per tutti i formati texture
  • 32 unità ROP con supporto per modalità anti-aliasing con campionamento programmabile di oltre 16 campioni per pixel, incluso il formato frame buffer FP16 o FP32. Prestazioni di picco fino a 32 campioni per clock e in modalità solo Z: 128 campioni per clock
  • Supporto integrato per sei monitor, inclusi HDMI 1.4a e DisplayPort 1.2

Specifiche della scheda grafica Radeon HD 7970

  • Frequenza principale: 925 MHz
  • Numero di processori universali: 2048
  • Numero di blocchi texture: 128, blocchi di fusione: 32
  • Frequenza di memoria effettiva: 5500 MHz (4x1375 MHz)
  • Tipo di memoria: GDDR5
  • Capacità di memoria: 3 gigabyte
  • Larghezza di banda della memoria: 264 gigabyte al secondo.
  • Tasso di riempimento massimo teorico: 29,6 gigapixel al secondo.
  • Frequenza di campionamento teorica della texture: 118,4 gigatexel al secondo.
  • Due connettori CrossFire
  • Bus PCI Express 3.0
  • Consumo energetico: da 3 a 250 W
  • Un connettore di alimentazione a 8 pin e uno a 6 pin
  • Design a doppio slot
  • Prezzo consigliato per il mercato statunitense: $549

Specifiche della scheda grafica Radeon HD 7950

  • Frequenza centrale: 800 MHz
  • Numero di processori universali: 1792
  • Numero di blocchi texture: 112, blocchi di fusione: 32
  • Frequenza di memoria effettiva: 5000 MHz (4x1250 MHz)
  • Tipo di memoria: GDDR5
  • Capacità di memoria: 3 gigabyte
  • Larghezza di banda della memoria: 240 gigabyte al secondo.
  • Tasso di riempimento massimo teorico: 25,6 gigapixel al secondo.
  • Frequenza di campionamento teorica della texture: 89,6 gigatexel al secondo.
  • Due connettori CrossFire
  • Bus PCI Express 3.0
  • Connettori: DVI Dual Link, HDMI 1.4, due Mini-DisplayPort 1.2
  • Consumo energetico: da 3 a 200 W
  • Design a doppio slot
  • Prezzo consigliato negli Stati Uniti: $ 449

Degna di nota è l'elevata complessità del nuovo chip: 4,3 miliardi di transistor, ovvero più della metà del numero di transistor del precedente processore grafico di fascia alta. La capacità di realizzare un cristallo così complesso è stata resa possibile dall'uso di una moderna tecnologia di processo a 28 nanometri e il nuovo chip aveva un'area persino leggermente più piccola del Cayman. E le sue caratteristiche pratiche che influiscono sulle prestazioni sono state notevolmente migliorate: il numero di ALU, TMU e bus di memoria. Solo il numero di blocchi ROP non è aumentato e la frequenza della memoria video GDDR5 è rimasta allo stesso livello.

Il principio di denominazione delle schede video dell'azienda rimane lo stesso. La Radeon HD 7970 è la soluzione single-chip più produttiva dell'azienda; dopo un po' di tempo è stato rilasciato il modello junior HD 7950, annunciato poco dopo. Inizialmente la HD 7970 non aveva concorrenti sul mercato e non sostituiva nessuna specifica scheda video della linea AMD, ma piuttosto la spostava verso il basso. Per quanto riguarda il confronto con la concorrenza, NVIDIA ha lanciato la sua soluzione a 28 nanometri molto più tardi.

La nuova scheda video AMD è dotata della stessa memoria GDDR5, ma il suo volume, invece dei 2 gigabyte della generazione precedente, è aumentato a 3 gigabyte. Ciò è accaduto a causa dell'espansione del bus di memoria da 256 bit a 384 bit. E ora puoi inserire 1,5 GB o 3 GB sulla nuova scheda. Naturalmente, dal punto di vista del marketing, installare un volume più piccolo sarebbe un chiaro svantaggio, quindi si è deciso di installare 3 GB, anche se oggi questo è un po' eccessivo. Solo con risoluzioni ultra-elevate e con MSAA 16x 1,5-2 GB non sono sufficienti. Tuttavia, AMD ha anche Eyefinity e per i giochi su tre o più monitor il buffer dello schermo occuperà un volume molto grande.

Diamo quindi un'occhiata alla Radeon HD 7970. La nuova scheda video nella fascia di prezzo superiore ha un sistema di raffreddamento a doppio slot, coperto su tutta la lunghezza della scheda da un involucro di plastica familiare a tutte le moderne schede AMD. Solo il design di questo involucro è leggermente cambiato, anche se la parte posteriore si estende ancora oltre il circuito stampato. Ma il design della striscia con perni è stato modificato: per migliorare il raffreddamento della scheda video, uno dei due slot (metà della striscia) è stato occupato esclusivamente da un foro di ventilazione per la rimozione del calore.

Ma gli utenti non dovrebbero soffrire per la riduzione del numero di connettori DVI saldati direttamente sulla scheda. Per la loro comodità, nella confezione sarà incluso uno speciale adattatore HDMI-DVI, che consentirà di collegare due monitor con connettori DVI. A proposito, il consumo energetico della nuova scheda non è inferiore a quello della Radeon HD 6970, quindi è stato necessario dotarla di un set di connettori di alimentazione a 8 pin e uno a 6 pin.

Ma nella nuova Radeon HD 7970 il sistema di raffreddamento è cambiato in meglio. Viene utilizzata una nuova generazione di camera di evaporazione e un nuovo refrigeratore più grande, con pale rimodellate e prestazioni migliorate (viene fornito un flusso d'aria maggiore). Il risultato è un aumento dell’efficienza del refrigeratore riducendo al contempo il rumore.

Dalla scheda non è scomparso nemmeno lo switch firmware Dual BIOS, di cui abbiamo parlato nella descrizione della Radeon HD 6900. In breve: la scheda video ha due versioni BIOS, una con la possibilità di eseguire il flashing personalizzato del firmware, e l'altra secondo con firmware codificato in fabbrica. Sia gli utenti che la stessa AMD hanno apprezzato così tanto questa comoda soluzione che ha deciso di continuare a confezionarli con soluzioni di fascia alta.

Non possiamo che accogliere con favore questa soluzione, che aiuta davvero in vari casi legati a problemi imprevisti durante il flashing (interruzione di corrente durante il processo, ad esempio) e consente di eseguire senza paura vari esperimenti con le immagini del BIOS. Non sorprende che AMD accenni ripetutamente alle eccellenti capacità di overclock della nuova scheda video:

Come puoi vedere, l'overclocking a una frequenza di 1 GHz e superiore è praticamente promesso, se non si tiene conto della piccola iscrizione (che non era inclusa nello screenshot) che la garanzia cessa di essere valida anche se la scheda video si guasta come risultato di un esperimento con l'aumento della frequenza dalle impostazioni dei driver video.

Caratteristiche architettoniche della Radeon HD 7970

Per apprezzare la rilevanza delle modifiche architettoniche nelle Isole del Sud, diamo prima un'occhiata allo sviluppo delle GPU negli ultimi anni rappresentato da AMD. Fino al 2002, i chip grafici erano hardware specifici in grado di eseguire esclusivamente calcoli grafici. I chip video di quel tempo avevano funzionalità limitate; potevano solo applicare e filtrare trame, elaborare geometrie ed eseguire rasterizzazioni primitive e quindi non erano affatto adatti per compiti informatici universali.

Negli anni successivi alla GPU è stata aggiunta la programmabilità di base, ma si è concentrata anche esclusivamente sulle attività grafiche. Questo era il periodo del supporto per DirectX 8 e 9, programmi shader con funzioni limitate con la capacità di calcolare in virgola mobile. I chip video dell'epoca avevano unità ALU specializzate per l'elaborazione dei vertici e dei pixel, nonché cache dedicate per pixel, trame e altri dati. La versatilità non era ancora nemmeno vicina.

Solo nel 2007 AMD ha acquisito l'architettura shader unificata DirectX 10, nonché la possibilità di programmare la GPU utilizzando strumenti speciali: CAL, Brook, ATI Stream. Le GPU dell'epoca disponevano già di caching avanzato e supporto per dati condivisi locali e globali. Dal punto di vista architettonico, i chip erano basati sui blocchi VLIW5 e VLIW4, sufficientemente flessibili per alcuni calcoli non grafici di base, ma comunque focalizzati sugli algoritmi grafici.

Ora è il momento di una nuova architettura che sia ancora più adatta all'elaborazione generica: Core grafico successivo (GCN). Questa è una nuova era architetturale per AMD, motivo per cui è stato scelto il nome. Le nuove GPU offrono eccellenti capacità di elaborazione grafica e prestazioni, ma le modifiche architetturali apportate sono destinate principalmente a migliorare le posizioni nell'elaborazione non grafica, aumentando le prestazioni e l'efficienza in compiti complessi di uso generale. Il nuovo design della GPU è destinato al cosiddetto calcolo eterogeneo, un mix di grafica e calcolo generale in un ambiente multitasking. L’architettura GCN è diventata più flessibile e dovrebbe essere ancora più adatta per l’esecuzione efficiente dal punto di vista energetico di varie attività.

Il blocco base della nuova architettura è il blocco GCN. È su questi "mattoni" che si basano tutti i nuovi processori grafici della serie Southern Islands. L'architettura per la prima volta per i chip grafici AMD utilizza un design non VLIW, utilizza unità vettoriali e scalari e uno dei cambiamenti più importanti è che ciascuna delle unità di calcolo GCN ha il proprio scheduler e può eseguire istruzioni da vari programmi (nucleo).

La nuova architettura informatica è progettata per garantire un'elevata efficienza nel caricamento delle unità di calcolo in un ambiente multitasking. L'unità di calcolo GCN è divisa in quattro sottosezioni, ciascuna delle quali lavora sul proprio flusso di istruzioni ad ogni ciclo di clock. I thread possono anche utilizzare il blocco scalare fornito da GCN per il controllo del flusso o le operazioni del puntatore. La combinazione di blocchi vettoriali e scalari offre un modello di programmazione molto semplice. Ad esempio, i puntatori a funzione e i puntatori allo stack sono molto più facili da programmare e il compito del compilatore è ora notevolmente semplificato, poiché le unità di esecuzione sono scalari.

Ogni blocco GCN dispone di 64 KB di spazio di archiviazione dati locale dedicato per lo scambio di dati o l'espansione dello stack di registri locale. Il blocco include anche una cache di primo livello con funzionalità di lettura e scrittura e una pipeline di texture completa (unità di campionamento e filtro). Pertanto, la nuova unità di calcolo è in grado di funzionare in modo indipendente, senza uno scheduler centrale, che nelle architetture precedenti era responsabile della distribuzione del lavoro tra le unità. Ora ciascuno dei blocchi GCN è in grado di pianificare e distribuire i comandi da solo; un blocco di calcolo può eseguire fino a 32 diversi flussi di comandi, che possono provenire da diversi spazi di indirizzi virtuali in memoria e sono completamente protetti e indipendenti l'uno dall'altro.

Le precedenti architetture GPU AMD utilizzavano i modelli architetturali VLIW4 e VLIW5 e, sebbene siano abbastanza buoni per le attività grafiche, non sono abbastanza efficienti per l'elaborazione generica, poiché è molto difficile caricare di lavoro tutte le unità di esecuzione in tali condizioni. La nuova architettura GCN offre lo stesso ampio numero di unità di esecuzione, ma con un'esecuzione scalare che rimuove le limitazioni e le dipendenze di registri e istruzioni. Il passaggio dall'architettura VLIW all'esecuzione scalare fornisce una notevole semplificazione delle attività di ottimizzazione del codice.

Quando si eseguono istruzioni sulla precedente architettura VLIW4, il compilatore deve gestire conflitti di registro, eseguire una distribuzione complessa di istruzioni alle unità di esecuzione nella fase di compilazione del codice, ecc. Allo stesso tempo, ottenere prestazioni elevate spesso richiede un'ottimizzazione non banale, che è adatto per la maggior parte delle attività grafiche e molto meno flessibile per altri calcoli. La nuova architettura offre una significativa semplificazione dello sviluppo e del supporto, creazione semplificata, analisi e rilevamento degli errori nel codice di basso livello, prestazioni stabili e prevedibili.

Sottosistema di memorizzazione nella cache

Non c'è mai abbastanza larghezza di banda, memoria e cache, e c'è sempre la necessità e i metodi per aumentarli. Le nuove GPU di AMD utilizzano una cache di lettura/scrittura completa a due livelli. Ogni unità di calcolo ha 16 kilobyte di cache di primo livello e il volume totale della cache di secondo livello è di 768 kilobyte (in totale, il chip ha 512 KB L1 e 768 KB L2), ovvero il 50% in più rispetto al chip precedente , che non ha alcuna capacità di scrittura nella cache L2.

In termini di prestazioni, ciascuna unità di calcolo GCN può ricevere o scrivere 64 byte di dati da/nella cache L1 o memoria globale, utilizzata per scambiare dati tra thread di istruzioni, in un ciclo di clock. Ciascuna sezione della cache L2 di secondo livello è in grado di trasmettere e ricevere la stessa quantità di dati. Di conseguenza, la GPU di fascia alta dell'azienda raggiunge 2 terabyte/s per L1 e 700 GB/s per L2, ovvero il 50% in più rispetto alla precedente soluzione di fascia alta di AMD.

GPU di Tahiti

Ora che abbiamo esaminato i cambiamenti architetturali di basso livello nella nuova serie Southern Islands, è tempo di passare ai dettagli della soluzione più potente della linea, la Radeon HD 7900, che include due modelli. Prima di tutto, notiamo l'enorme complessità della nuova GPU, perché comprende più di 4,3 miliardi di transistor, ovvero il doppio del chip su cui si basa la Radeon HD 5870! Naturalmente, un chip così potente è stato possibile solo grazie all'utilizzo della nuova tecnologia di processo a 28 nm. Allora cosa ha dentro?

Il numero di blocchi geometrici non è cambiato, rispetto alla Cayman, ce ne sono ancora due, ma l'efficienza del loro lavoro è stata notevolmente aumentata: su questo ci soffermeremo più in dettaglio più avanti. Nel diagramma della GPU vediamo 32 unità di calcolo con architettura GCN disponibili sulla Radeon HD 7970, e nel caso della soluzione di fascia bassa, alcune di esse saranno disabilitate. Se consideriamo le prestazioni di calcolo di punta della soluzione, ammontano a quasi 3,8 teraflop (operazioni in virgola mobile al secondo), che fino ad oggi rappresentano un record assoluto per una GPU.

Ogni blocco GCN contiene 16 unità texture, che danno una cifra finale di 128 TMU per chip, o più di 118 gigatexel/sec - e questo è un altro record al momento del rilascio, e non sarà l'ultimo. Ma il numero dei blocchi ROP non è cambiato, ce ne sono ancora 32 in 8 blocchi RBE allargati. Un altro cambiamento architetturale interessante è che i blocchi ROP ora sono “collegati” non ai canali di memoria, come avveniva in precedenza, ma ai blocchi GCN.

Sebbene teoricamente la velocità di scrittura nel framebuffer sia rimasta quasi invariata e il massimo possibile siano gli stessi 32 valori di colore e 128 valori di profondità per clock, il tasso di riempimento pratico nelle applicazioni del mondo reale è aumentato significativamente a causa dell'aumento Banda di memoria. Secondo le misurazioni AMD, il Cayman ha registrato solo 23 pixel per clock, mentre il nuovo Tahiti si è avvicinato ai 32 pixel per clock teorici.

Ciò è comprensibile, perché il nuovo chip video di AMD ha un bus di memoria a 384 bit - sei canali a 64 bit, proprio come l'attuale soluzione top di gamma della concorrenza. È questo aumento di una volta e mezza nella larghezza di banda della memoria che rende possibile aumentare la velocità effettiva di recupero e scrittura delle texture nel framebuffer. La larghezza di banda di 264 GB/sec dovrebbe aiutare ad avvicinarsi ai valori teorici di 118 gigapixel/sec e 30 gigapixel/sec, e nella parte pratica lo verificheremo.

Nel caso della GPU "ridotta" Radeon HD 7950, Tahiti include 28 unità di calcolo attive dell'architettura GCN delle 32 fisicamente disponibili sul chip. Nel caso della soluzione junior della serie Radeon HD 7970 si è deciso di disattivarne quattro. Poiché ogni unità GCN contiene 16 unità texture, il numero totale di TMU per il nuovo modello è di 112 TMU, che danno una prestazione di quasi 90 gigatexel/sec.

Ma il numero di unità ROP e controller di memoria nell'HD 7950 non è cambiato; hanno deciso di non tagliarli e di lasciarli rispettivamente agli stessi 32 e 6 pezzi. Pertanto, il chip video Tahiti Pro ha lo stesso bus di memoria a 384 bit, assemblato da sei canali a 64 bit, della soluzione AMD di punta. A quanto pare, sono i dispositivi funzionali informatici a soffrire maggiormente di difetti di produzione e hanno deciso di non tagliare tutto il resto.

Tassellazione ed elaborazione di geometrie

Dal punto di vista architettonico, i blocchi geometrici di Tahiti non sono cambiati molto dai tempi delle Cayman. Due blocchi vengono ancora utilizzati per l'elaborazione (impostazione dei vertici e tassellatura) dei dati geometrici e della rasterizzazione, e lo schema è molto simile a quello che abbiamo visto prima, tranne per il fatto che i tassellatori sono chiamati di 9a generazione:

Nonostante le somiglianze schematiche, l'ultima generazione di questi blocchi è capace di prestazioni di tassellatura ed elaborazione della geometria significativamente maggiori, poiché i blocchi hanno subito modifiche significative. Sebbene le prestazioni di picco siano aumentate solo fino a quasi due miliardi di vertici e primitive al secondo (925 MHz e due vertici per clock), le prestazioni effettive sono aumentate di più. Ciò è stato ottenuto aumentando la dimensione delle cache, migliorando il buffering dei dati geometrici e riutilizzando i dati dei vertici.

Di conseguenza, le prestazioni di tassellatura sono migliorate su tutti i rapporti triangolari fino a quattro volte rispetto alla precedente generazione di Radeon HD 6970. Ma i quattro tempi non vengono raggiunti in tutti i casi, nemmeno nel diagramma stesso di AMD:

Il grafico confronta le prestazioni di tassellatura della Radeon HD 7970 rispetto all'HD 6970 con fattori di partizionamento che vanno da 1 a 32. E come potete vedere, la differenza di prestazioni è tra 1,7 e 4 volte. Ma questo è puramente sintetico. E per avvicinarci alla realtà, forniamo qualche dato in più sulla velocità di tassellatura nelle applicazioni di gioco:

Come puoi vedere, i numeri sintetici di AMD sono ben supportati da quelli di gioco: le prestazioni nelle applicazioni reali con tassellazione "pesante" sono aumentate in modo significativo. Questo è un ottimo risultato, che verificheremo sicuramente nella parte pratica, usando l'esempio dei sintetici e delle applicazioni di gioco.

Calcolo non grafico

Dal punto di vista dei compiti di calcolo eterogenei e non grafici, l'emergere di due motori di calcolo asincroni (Asynchronous Compute Engines - ACE) è molto importante. Sono progettati per pianificare e distribuire il lavoro tra le unità di esecuzione per un multitasking efficiente e funzionano insieme al processore di comandi grafico (Command Processor).

La Radeon HD 7900 ha due motori di calcolo indipendenti e un motore grafico. In totale, si ottengono tre blocchi programmabili e tre flussi di comandi, completamente separati l'uno dall'altro. E oltre all'invio asincrono dei comandi per un rapido cambio di contesto, la nuova GPU presenta anche due controller DMA (direct memory access) bidirezionali introdotti nella Cayman. Questi due controller sono necessari per sfruttare appieno il nuovo bus PCI Express 3.0.

Come sappiamo, dal punto di vista dell'informatica seria, non è importante solo la velocità di esecuzione delle operazioni in virgola mobile a precisione singola, ma anche quella in virgola mobile a doppia precisione. E la nuova architettura AMD affronta abbastanza bene questo compito. Al momento, si presume che esistano due versioni delle unità di calcolo GCN che hanno velocità di esecuzione diverse delle istruzioni FP64. Per le GPU più vecchie, la velocità di esecuzione è 1/4 della velocità FP32 e per i chip più giovani la velocità di esecuzione è 1/16, il che è abbastanza per mantenere la compatibilità, ma non complica troppo le soluzioni economiche. Di conseguenza, la Radeon HD 7970 è capace di 947 miliardi di operazioni a doppia precisione al secondo (oh, non sono appena arrivate a un teraflop!) - questo è un altro risultato più alto del nuovo chip AMD.

Inoltre non si tratta degli stessi gigaflop delle architetture precedenti, ma più “grassi”. Dopotutto, l'efficienza della nuova GPU nei compiti di calcolo complessi dovrebbe aumentare in modo significativo. Innanzitutto è stato migliorato il sottosistema di memoria e caching. In secondo luogo, ciascuna unità di calcolo GCN ha il proprio scheduler, che dovrebbe migliorare l’esecuzione del codice di ramificazione e l’efficienza complessiva. Ebbene, in terzo luogo, notiamo l'esecuzione scalare, che non richiede ottimizzazioni complesse da parte del compilatore, per cui le unità di calcolo rimarranno inattive molto meno spesso. Di conseguenza, in qualsiasi attività sarà più facile per il nuovo chip dimostrare prestazioni elevate e carico ALU.

Tra le altre innovazioni legate alle capacità di calcolo, notiamo il pieno supporto ECC per DRAM e SRAM. Dal punto di vista software, è importante che Tahiti sia la prima GPU con pieno supporto per le nuove versioni API: OpenCL 1.2, DirectCompute 11.1 e C++ AMP e le loro funzionalità. Ad esempio, OpenCL 1.2 consente di combinare le capacità di più dispositivi informatici in uno solo e AMD ha già rilasciato il supporto per questo sotto forma di AMD APP SDK 2.6 e il driver Catalyst 11.12.

Prestazioni ed efficienza dell'architettura

Dopo aver esaminato tutte le innovazioni architetturali utilizzando l'esempio del chip di fascia alta della serie Southern Island, è tempo di parlare dell'efficacia di tutti questi cambiamenti. È chiaro che le prestazioni dei nuovi chip sono molto superiori a quelle dei precedenti; sarebbe abbastanza sorprendente il contrario. La domanda è quanto più veloce. In vari compiti, i risultati vanno dal 40-50% (minimo!) a una differenza quintuplicata. I miglioramenti nell'architettura gli consentono di superare teoricamente 1,4 volte la differenza in stupidi gigaflop. Vediamolo con degli esempi:

Il diagramma mette a confronto la nuova soluzione top e la precedente soluzione single-chip: Radeon HD 7970 e HD 6970, il che è abbastanza corretto. I test prestazionali selezionati sono diversi: SmallptGPU e LuxMark sono ray tracing su OpenCL, SHA256 è un algoritmo di hashing sicuro e AES256 è un algoritmo di crittografia simmetrica. Ebbene, Mandelbrot è un problema ben noto calcolato con doppia precisione.

La linea tratteggiata verticale nel grafico segna la differenza teorica nelle prestazioni, ma i dati sulla velocità mostrano che in tre attività su cinque la velocità della nuova GPU era significativamente più alta. Ciò è causato da tutti i cambiamenti volti ad aumentare l’efficienza: allontanamento da VLIW, avere uno scheduler in ogni unità di calcolo, miglioramento del caching, ecc.

Modifiche alla qualità del rendering

In realtà, questa parte avrebbe potuto essere facilmente saltata, dato che ultimamente non ci sono state lamentele particolari sulla qualità dell'immagine e non possono essercene - per vari motivi. Ad esempio, la qualità dell'anti-aliasing a schermo intero tra le schede video di diversi produttori è molto simile, soprattutto considerando l'uso diffuso di metodi di anti-aliasing software che utilizzano filtri di post-elaborazione, che vengono eseguiti esattamente allo stesso modo su tutte le GPU.

Lo stesso vale per il filtraggio delle texture: ora la sua qualità è tale che è molto difficile distinguere tra le soluzioni AMD e NVIDIA anche se si effettua un confronto pixel per pixel. Nella Radeon HD 6900, la generazione precedente dell'azienda, il filtraggio anisotropico è leggermente migliorato e ora anche un "microscopio" non aiuterà a trovare eventuali carenze significative. L'unico appunto è che in movimento le schede video Radeon erano leggermente inferiori alle GeForce a causa di artefatti specifici più evidenti, come “rumore” o “sabbia”.

Con il rilascio dei chip video di nuova generazione, i pesi texel nel filtro texture sono stati nuovamente rivisti, modificandoli in modo tale da ridurre tali artefatti, talvolta visibili sulla Radeon HD 6900 in presenza di alcuni tipi di texture (“high -frequenza", con transizioni nette dal buio alla luce, per esempio). I cambiamenti di qualità sono così difficili da mostrare con esempi che AMD non fornisce immagini comparative dell'HD 7900 rispetto all'HD 6900, ma confronta semplicemente la qualità dell'algoritmo "hardware" con quello puramente software eseguito sui processori stream GPU, e quindi ideale:

In uno screenshot così piccolo, la differenza di qualità non è visibile, ma AMD assicura che tutte le modifiche apportate non hanno introdotto alcun calo di prestazioni e non hanno peggiorato la qualità dell'immagine in nessun aspetto - non dipende comunque dall'angolazione e dalla prospettiva. la qualità del filtraggio è vicina all'ideale. Lo controlleremo sicuramente in uno dei futuri materiali pratici.

Texture parzialmente residenti

L'idea di Partially Resident Textures (PRT) è quella di utilizzare le capacità hardware della GPU presentata: la memoria virtuale. Sicuramente molti utenti hanno già visto il gioco RAGE di id Software, che utilizza la tecnologia di texturing virtuale, la cosiddetta megatexturing ("MegaTexture"), che rende possibile utilizzare enormi quantità di dati di texture e trasmetterli nella memoria video.

Utilizzando la memoria video virtuale, è molto semplice ottenere un supporto hardware efficace per tali algoritmi, consentendo di utilizzare fino a 32 terabyte di trame in un'applicazione, il che rende possibile creare posizioni uniche nei giochi, senza ripetere pezzi di trame e senza problemi con il caricamento dei dati della texture. È vero, AMD fornisce un chiaro esempio troppo strano, da cui nulla risulta particolarmente chiaro:

PRT consente di ottenere un'elevata qualità delle immagini e aiuta a migliorare l'efficienza dell'utilizzo della memoria video. Algoritmi simili sono già utilizzati nel motore di id Software e si prevede che appariranno in molti motori di prossima generazione. I giochi del futuro devono funzionare con enormi quantità di dati e il vantaggio della nuova GPU è che la memoria grafica locale negli algoritmi alla PRT funziona come memoria cache hardware e le trame vengono caricate al suo interno quando necessario. Le GPU della famiglia Southern Islands supportano "megatetexture" con un volume fino a 32 terabyte (risoluzione fino a 16384 × 16384) e, soprattutto, il filtraggio delle texture hardware per loro, che non è disponibile sui chip video precedenti.

Le texture virtuali sono divise in pezzi di 64 kilobyte di dimensione (kilobyte, non texel) e questa dimensione del pezzo è fissa. E solo quelli necessari durante il rendering del fotogramma corrente vengono caricati nella memoria locale della scheda video. La tecnologia funziona indipendentemente dal formato della texture, solo le dimensioni dei pezzi in texel saranno diverse. Ad esempio, per una texture normale non compressa con 32 bit per colore, la dimensione del pezzo sarà 128x128 texel e per una texture compressa in formato DXT3 - 256x256 texel.

La tecnologia prevede anche l'uso di livelli mip delle texture (copie ridotte utilizzate nel filtraggio delle texture). Richiedono accessi multipli durante il rendering e il filtraggio. Diamo un'occhiata al funzionamento dell'algoritmo utilizzando un esempio.

Questa immagine evidenzia quattro diversi blocchi di diversi livelli mip richiesti per il rendering. Quando un programma shader richiede loro dei dati, alcuni blocchi sono già nella memoria locale e questi dati vengono immediatamente inviati allo shader per ulteriori calcoli. Ma alcuni pezzi mancano dalla tabella e l'applicazione deve scegliere cosa fare dopo in quella mancanza. Ad esempio, puoi richiedere dati da un livello mip di risoluzione inferiore, quindi l'immagine sarà sfocata, ma almeno sembrerà reale e verrà renderizzata senza ritardi. E quando viene eseguito il rendering del fotogramma successivo, può già essere caricato nella cache, la memoria video locale. Coloro che hanno giocato a RAGE ci capiranno.

Questo è un potente algoritmo che ti consente di utilizzare trame enormi che sono uniche per ciascun oggetto. Algoritmi simili sono stati utilizzati a lungo nel rendering offline, fatta eccezione per la necessità di calcoli in tempo reale. AMD ha persino realizzato una demo utilizzando la tecnica Per-Face Texture Mapping sviluppata da Walt Disney Animation Studios per i loro film d'animazione. Sfortunatamente la demo non è ancora pronta e abbiamo visto solo screenshot a bassa risoluzione.

L'essenza di questa tecnica di texture mapping è assegnare un pezzo specifico di texture a ciascun poligono, senza la necessità di utilizzare la trasformazione UV (trovando una corrispondenza tra le coordinate della superficie di un oggetto tridimensionale e le coordinate su una texture bidimensionale) . Questo approccio risolve alcuni dei problemi legati alla creazione di contenuto tassellato rendendo molto semplice l'algoritmo di mappatura dello spostamento. E PRT in questo metodo viene utilizzato per archiviare e accedere in modo efficiente ai dati delle texture.

Istruzioni per l'elaborazione dei contenuti multimediali

Un'innovazione interessante nelle Isole del Sud sembra essere il supporto per istruzioni specializzate utilizzate nell'elaborazione delle immagini, statiche e dinamiche. Ad esempio, è stata migliorata un'istruzione ampiamente utilizzata chiamata “somma delle differenze assolute”, meglio conosciuta come SAD (somma delle differenze assolute). La velocità di esecuzione rappresenta un collo di bottiglia prestazionale molto critico per molti algoritmi di elaborazione di immagini e video, come il rilevamento del movimento, il riconoscimento dei gesti, la ricerca di immagini, la visione artificiale e molti altri.

Ma nella nostra recensione dell'antica scheda video Radeon HD 5870, abbiamo già scritto del supporto SAD. Ora, oltre al normale SAD (4x1), Southern Islands ha una nuova istruzione - QSAD (quad SAD), che combina SAD con operatori di turno per aumentare le prestazioni e l'efficienza energetica, nonché un'istruzione "mascherata" MQSAD, che ignora pixel di sfondo e viene utilizzato per isolare gli oggetti che si muovono nell'inquadratura dallo sfondo.

Le nuove GPU possono elaborare fino a 256 pixel per unità di calcolo GCN per clock, che nel caso del modello AMD Radeon HD 7970 significa la capacità di elaborare fino a 7,6 trilioni di pixel al secondo nel caso di valori di colore interi a 8 bit. Sebbene si tratti di un valore teorico, le capacità di elaborazione visiva delle nuove GPU sono piuttosto impressionanti: molte attività di elaborazione video possono essere eseguite in tempo reale.

PCI Express 3.0

Non potevamo ignorare il supporto della terza versione di PCI Express da parte dell'intera linea di nuove soluzioni grafiche Southern Islands. Questo supporto era del tutto previsto, dal momento che le specifiche della terza versione di PCI Express sono state finalmente approvate nell'autunno del 2010, ma non c'erano ancora soluzioni hardware con il suo supporto, sebbene stiano già apparendo le schede madri, alla fine sono state rilasciate le schede video del 2011, e i corrispondenti processori centrali C'è.

L'interfaccia aggiornata ha una velocità di trasferimento di 8 gigatransazioni al secondo invece di 5 GT/s della versione 2.0, e il suo throughput è nuovamente raddoppiato (a 32 GB/s) rispetto allo standard PCI Express 2.0. Il nuovo bus utilizza uno schema di codifica diverso per i dati inviati sul bus, ma è stata mantenuta la compatibilità con le versioni precedenti di PCI Express.

Le prime schede madri che supportano PCI Express 3.0 sono state introdotte nell'estate del 2011, basate principalmente sul chipset Intel Z68, e sono diventate ampiamente disponibili solo nell'autunno dello stesso anno. Ora sono arrivate le schede video e AMD è diventata ancora una volta in vantaggio rispetto agli altri in termini di velocità di rilascio di nuovi processori grafici che supportano le tecnologie più avanzate. Ma se PCI-E 3.0 avrà un senso pratico è troppo presto per giudicare.

Tecnologia AMD PowerTune

Una delle innovazioni più interessanti della Cayman è stata la tecnologia avanzata di gestione della potenza PowerTune. La gestione flessibile della potenza della GPU è stata utilizzata per molto tempo, ma prima della Radeon HD 6900, tutte queste tecnologie erano piuttosto primitive e per lo più metodi software e modificavano la frequenza e la tensione gradualmente, incapaci di spegnere gran parte dei chip video.

Anche nella famiglia Radeon HD 5000 è apparso un limitatore di prestazioni quando veniva superato un certo livello di consumo, e nella Radeon HD 6900 il sistema è passato ad un livello qualitativamente diverso. Per fare ciò, il chip ha incluso sensori speciali in tutti i blocchi che monitorano i parametri di avvio. La GPU misura costantemente carico e consumo energetico e non consente a quest'ultimo di oltrepassare una certa soglia, regolando automaticamente frequenza e tensione in modo che i parametri rimangano all'interno del pacchetto termico specificato.

A differenza delle precedenti tecnologie di gestione dell'energia, PowerTune fornisce il controllo diretto sul consumo energetico della GPU, invece del controllo indiretto tramite la modifica di frequenze e tensioni. Questa tecnologia ti aiuta a impostare gli orologi della tua GPU su velocità elevate, ottenendo prestazioni di gioco elevate senza preoccuparti che il consumo energetico vada oltre i limiti di sicurezza. Dopotutto, la maggior parte dei giochi e delle applicazioni generali che utilizzano il GPU computing hanno requisiti energetici significativamente inferiori e non si avvicinano a limiti di consumo energetico pericolosi, a differenza dei test di stabilità come Furmark e OCCT.

Anche i giochi più pesanti non richiedono il massimo consumo energetico e se limiti il ​​consumo in base alla frequenza, testando le schede video con test estremi, nel caso dei giochi 3D ci saranno molte prestazioni e potenziale di potenza non sfruttati. Nel caso in cui la scheda video non abbia raggiunto il limite di consumo sicuro, la GPU funzionerà alla frequenza impostata in fabbrica e nei test FurMark e OCCT la frequenza della GPU diminuirà per rimanere entro i limiti di consumo.

Pertanto, PowerTune aiuta a impostare frequenze di fabbrica più elevate e a configurare il sistema per utilizzare nel modo più efficiente le risorse GPU al livello di consumo massimo impostato. Nell'esempio mostrato sopra, l'HD 5870 non utilizza PowerTune e, a causa della limitazione di frequenza della GPU dovuta all'elevato consumo nei test di resistenza, non utilizza tutte le sue capacità. Mentre la Radeon HD 7970 è impostata sul TDP massimo, e il chip video reimposta le frequenze solo quando viene superato, ottenendo le massime prestazioni possibili in qualsiasi applicazione.

Ciò è chiaramente mostrato nel diagramma seguente. Nel caso delle applicazioni di gioco, è possibile raggiungere il TDP aumentando la frequenza della GPU e, per i carichi di picco, i test di resistenza riducono la frequenza a un livello sicuro di consumo energetico. Senza PowerTune dovresti scegliere tra la possibilità di un guasto della scheda video quando usi FurMark e OCCT per un lungo periodo o la riduzione delle potenziali prestazioni nei giochi. La nuova tecnologia risolve questi problemi nel modo più efficiente possibile.

AMD PowerTune risponde rapidamente alle mutevoli condizioni (microsecondi) perché è una tecnologia hardware. Si distingue anche per le impostazioni di frequenza flessibili e non graduali, come nel caso dei chip precedenti. Tutte le misurazioni sono indipendenti dal driver, ma possono essere regolate dall'utente utilizzando le impostazioni della scheda video.

La differenza tra PowerTune e l'approccio precedentemente generalmente accettato è che in altri casi viene utilizzata la limitazione termica, che mette la GPU in una modalità di consumo significativamente ridotta, mentre PowerTune riduce semplicemente dolcemente la sua frequenza, portando il consumo della GPU al limitatore impostato. Ciò consente di ottenere velocità di clock e prestazioni più elevate.

Tecnologia AMD ZeroCore

AMD non si è limitata ad utilizzare la tecnologia di gestione energetica già nota dalle soluzioni precedenti. Nei primi chip della famiglia Southern Islands introduce la tecnologia AMD ZeroCore, che aiuta a raggiungere un'efficienza energetica ancora maggiore nella modalità "deep idle" (o "sleep") con il dispositivo di visualizzazione disabilitato, supportata da tutti i sistemi operativi.

Dopotutto, quasi tutti i sistemi, anche quelli di gioco, trascorrono la maggior parte del tempo in modalità a basso carico sul processore grafico. E la scheda video non dovrebbe consumare molta energia in questa modalità. E ancora di più, per non parlare della modalità con il monitor spento: in questo caso è consigliabile spegnere completamente la GPU. Questo è ciò che ha fatto AMD. Grazie a ZeroCore, in uno stato di idle profondo, la nuova GPU consuma meno del 5% dell'energia di una modalità completa, disabilitando la maggior parte dei blocchi funzionali in questa modalità.

AMD fornisce un confronto schematico con la propria Radeon HD 5870, che non supportava tale tecnologia. ZeroCore è un'innovazione esclusiva delle Isole del Sud portata alle soluzioni desktop da GPU mobili progettate per laptop. A proposito, i vantaggi di questa tecnologia non sono solo associati alla riduzione dei consumi. Inoltre, in modalità di inattività a lungo termine quando il display è spento, la scheda video spegne completamente anche la ventola del dispositivo di raffreddamento della scheda video!

Questo è esattamente ciò che molti utenti stavano aspettando da molto tempo. La cosa più interessante è che, secondo i nostri dati, test di laboratorio su soluzioni simili PowerTune e ZeroCore sono stati effettuati diverse generazioni di schede video fa. Alcuni dei campioni di ingegneria delle schede video della serie AMD che hanno abbandonato da tempo il mercato hanno funzionato esattamente in questo modo, spegnendo completamente il dispositivo di raffreddamento quando inattivo.

Ma non saranno solo gli utenti con GPU singola a beneficiare della riduzione del rumore e del consumo energetico con le nuove schede grafiche AMD abilitate ZeroCore. Miglioramenti simili attendono i felici possessori dei sistemi CrossFire basati su due, tre e persino quattro GPU. È logico che nella modalità di rendering dell'interfaccia bidimensionale del sistema operativo, tutte le schede video tranne quella principale non funzionino affatto? Ma è esattamente così che funzionano adesso!

Nel caso dei sistemi CrossFire su schede video con supporto ZeroCore in modalità 2D, tutte le schede video secondarie vengono messe in modalità di sospensione profonda con un consumo energetico minimo e il dispositivo di raffreddamento disabilitato. Questa modalità funziona con diverse schede video a chip singolo e per soluzioni a doppio chip. Inoltre, anche la scheda video CrossFire primaria entrerà in questa modalità in caso di inattività prolungata, configurata in Windows. La differenza nel funzionamento è simile alla seguente:

A proposito, la tecnologia non è così semplice come potrebbe sembrare. Gli ingegneri AMD hanno dovuto risolvere molti problemi relativi al funzionamento del sistema operativo in modalità inattiva. Ad esempio, hanno scoperto che Windows tenta di aggiornare le informazioni sullo schermo anche quando il monitor è spento. Il che, naturalmente, non ti consente affatto di disabilitare la GPU. Pertanto, i programmatori dell'azienda hanno dovuto adottare una soluzione alternativa, ignorando tutti i comandi di disegno dello schermo quando il monitor era spento in modalità di sospensione.

Tecnologia AMD Eyefinity 2.0

Naturalmente nella nuova architettura c'era spazio anche per miglioramenti alla comprovata tecnologia per la visualizzazione di immagini su più monitor - AMD Eyefinity, ora nella versione 2.0. Ha ricevuto nuove funzionalità, risoluzioni più elevate, supporto per più display e maggiore flessibilità.

Questa tecnologia è piuttosto interessante, anche se pochissimi utenti troveranno spazio nella stanza e troveranno il coraggio di installare più di due monitor nella loro famiglia. Ma è meglio avere la possibilità di poterlo sempre utilizzare piuttosto che non averlo affatto. Inoltre, i prezzi per i monitor con diagonale grande non diminuiscono quasi, ma le soluzioni di livello medio diventano costantemente più economiche.

Infatti oggi è più vantaggioso acquistare tre monitor con una diagonale di 24″ piuttosto che uno da 30 pollici. AMD fornisce proprio un esempio del genere, quando un monitor da 30" con una risoluzione di 2560×1600 costa più di $ 1000 e tre monitor FullHD da 24" possono essere acquistati alla metà di quel prezzo:

Ma come spendere i tuoi soldi e lo spazio nella stanza è una questione personale per ogni utente. La cosa principale è che tale opportunità esiste. Inoltre, Eyefinity 2.0 ora supporta l'output dell'immagine in modalità stereo HD3D, qualcosa che mancava nelle soluzioni precedenti, che erano inferiori a quelle della concorrenza in questo parametro. Combinando le tecnologie AMD Eyefinity e HD3D, la scheda grafica Radeon HD 7970 è la prima soluzione a chip singolo a supportare tre monitor che funzionano in modalità stereo.

Il rendering stereo ad alta risoluzione richiede un'interfaccia dati molto veloce. E con le versioni precedenti delle uscite HDMI, le capacità erano limitate a 24 Hz per occhio, che è abbastanza per guardare film Blu-ray 3D, ma chiaramente troppo basso per i giocatori.

Per tali compiti, hanno iniziato a utilizzare il formato frame packing, quando i fotogrammi per l'occhio sinistro e destro sono combinati in uno solo, e AMD Radeon HD 7970 supporta il formato frame packing HDMI 1.4a per l'output di immagini stereo. Questa è la prima scheda video a supportare HDMI a 3 GHz con frame pack, quando ciascun occhio riceve un'immagine FullHD con una frequenza di 60 Hz (120 Hz in totale):

Un'altra novità interessante ci sembra essere la tecnologia di uscita audio multicanale Discrete Digital Multi-Point Audio (DDMA), che lavora insieme a Eyefinity. Tutte le GPU precedenti sono in grado di emettere un solo flusso audio tramite HDMI e DisplayPort. Cioè, anche se tre monitor situati in stanze diverse sono collegati al PC tramite HDMI, viene trasmesso solo un canale audio. Ma l'AMD Radeon HD 7900 ha ricevuto il supporto per l'uscita simultanea di diversi canali audio indipendenti, che potrebbe essere utile in alcune configurazioni multi-monitor.

La stessa funzionalità sarà molto utile per l'utilizzo in videoconferenze con la visualizzazione di più interlocutori su schermi separati, così come in applicazioni multitasking come giocare su tre monitor con audio di gioco e visualizzare notizie su uno schermo separato con flusso audio indipendente. In precedenza, per tutto ciò era necessario utilizzare diversi sistemi audio separati, ma ora tutto funziona nel modo più conveniente possibile.

Anche il supporto software Eyefinity non è stato dimenticato: la tecnologia viene aggiornata quasi ogni mese e appaiono nuove opportunità. Così, già in ottobre, è apparso il supporto per risoluzioni fino a 16384x16384 e nuove configurazioni multi-monitor: 5x1 orizzontale e verticale, nonché basata su sei monitor in modalità 3x2.

L'aggiornamento di dicembre del driver video AMD Catalyst ha reso possibile la collaborazione tra Eyefinity e HD3D, e a febbraio promettono il supporto per risoluzioni personalizzate, impostazioni di posizionamento della barra delle applicazioni e una migliore gestione delle preimpostazioni.

L'output su sei monitor può essere ottenuto utilizzando due porte DisplayPort 1.2 e due hub MST (di cui abbiamo parlato in precedenza), mentre tre o anche quattro monitor richiederanno solo una porta e l'hub corrispondente. Tali hub consentono una configurazione flessibile del sistema di output delle immagini; supportano fino a quattro dispositivi FullHD per connettore DisplayPort 1.2 e dovrebbero essere disponibili per la vendita entro l'estate del 2012.

A proposito di risoluzione. Alta risoluzione o addirittura ultra alta: risoluzione ultra alta. I dispositivi attuali con una risoluzione di 4000 pixel sul lato più grande richiedono il collegamento tramite più cavi contemporaneamente: due DP 1.1 o quattro DVI. I monitor con questa risoluzione della prossima generazione verranno collegati tramite un solo cavo: DP 1.2 HBR2 o HDMI 1.4a 3 GHz. E la nuova scheda video di AMD è già pronta per tali monitor, ancora una volta è diventata la prima al mondo.

Codifica e decodifica video

È del tutto naturale che l'AMD Radeon HD 7970 includa la stessa unità UVD per la decodifica dei dati video, apparsa nella generazione precedente dei chip video dell'azienda. Semplicemente non necessita di alcuna modifica, supporta il codec MVC multi-stream, decodifica i formati MPEG-2/MPEG-4 (DivX), VC-1 e H.264, nonché decodifica due flussi FullHD in tutti i formati supportati.

Le soluzioni AMD forniscono la massima qualità di decodifica del flusso video, utilizzano diverse dozzine di algoritmi speciali di miglioramento della qualità e forniscono i massimi risultati nei test di qualità come HQV. Tra le funzionalità supportate segnaliamo: regolazione del colore e del tono, riduzione del rumore, nitidezza, ridimensionamento di alta qualità, contrasto dinamico, deinterlacciamento avanzato e telecinema inverso. Ecco un esempio di come migliorare il contrasto al volo:

Ma la decodifica su tutti i chip video è più o meno in ordine da molto tempo. Tutte le nuove GPU forniscono qualità e prestazioni decenti durante la visualizzazione di dati video. Ma la codifica video sulla GPU è ancora agli inizi e le principali lamentele da parte degli utenti riguardano la bassa qualità dell'immagine compressa risultante.

Forse la nuova serie Radeon HD 7000 può aiutare in questo, perché tutte le GPU della serie includono un'unità di codifica video Video Codec Engine (VCE). Il modello Radeon HD 7970 è diventata la prima scheda video a supportare la codifica e la compressione video con accelerazione hardware utilizzando un'unità specializzata (in precedenza, i processori stream prendevano parte alla codifica).

La qualità e le prestazioni dovrebbero essere chiaramente migliori rispetto a prima, con il supporto per la codifica 1080p a 60 fotogrammi al secondo e persino più veloce del tempo reale. È difficile dire qualcosa sulla qualità senza test, ma ci vengono promessi diversi livelli di ottimizzazione del codificatore per dati video e giochi, nonché una qualità di compressione variabile (la possibilità di scegliere tra l'aumento della qualità o delle prestazioni).

Al momento non esiste un posto dove provare VCE: semplicemente non ci sono applicazioni che lo supportino, ma AMD sta lavorando con partner come ArcSoft per fornire supporto per VCE nei rispettivi prodotti software. In futuro, prevediamo di rilasciare una libreria software per accelerare la codifica video, che renderà più semplice per gli sviluppatori supportare i prodotti AMD di prossima generazione.

La codifica può essere eseguita in due modalità: completa e ibrida (utilizzando le funzionalità dei processori stream GPU). La modalità completa è progettata per attività che richiedono la massima efficienza energetica e livelli di prestazioni costanti. La codifica in modalità completa su VCE è più veloce del tempo reale e fornisce una bassa latenza. Ma esiste anche una modalità ibrida:

In questa modalità, i blocchi matematici della GPU funzionano anche insieme a VCE. Tutte le fasi altamente parallelizzabili, delineate in giallo nel diagramma, possono sfruttare la potenza delle unità di calcolo GCN, mentre un'unità VCE dedicata gestisce un'efficiente codifica entropica hardware. Questa modalità è adatta per schede video con grande potenza matematica, come la Radeon HD 7970. Rimangono domande sulla qualità di queste due modalità, ma ciò richiede un'attenta analisi in un articolo separato.

Video stabile AMD

Oltre alla codifica e decodifica dei dati video, esiste un'altra area in cui è possibile sfruttare la potenza della nuova grafica AMD: migliorare i video di scarsa qualità ripresi a mano libera, senza l'uso di un treppiede o altri mezzi simili di stabilizzazione dell'immagine. La tecnologia di stabilizzazione video si chiama AMD Steady Video e la sua seconda versione è già stata rilasciata.

L'algoritmo di funzionamento dello stabilizzatore software è abbastanza semplice: in base al flusso video, vengono raccolte le statistiche sul movimento della telecamera (spostamento, rotazione, zoom) e questo movimento viene compensato nel fotogramma corrente, rispetto a quelli precedenti - l'immagine viene spostata , ruotato e ridimensionato in modo che l'immagine non salti molto e rimanga stabile.

Per quanto semplice possa sembrare, è altrettanto difficile da implementare. Semplicemente perché sullo schermo ci sono due milioni di pixel e fino a 30 o addirittura 60 fotogrammi al secondo: immagina quanti calcoli devono essere fatti per tenere traccia di tutti i possibili spostamenti dei fotogrammi. Abbiamo già scritto sopra della funzione QSAD utilizzata nell'elaborazione video; viene utilizzata anche in Steady Video 2.0 per velocizzare l'algoritmo di rilevamento del movimento. Quindi la GPU deve elaborare spostamenti casuali con un'ampiezza fino a 32 pixel in qualsiasi direzione e questo richiede prestazioni corrispondenti a più di 500 miliardi di operazioni SAD al secondo (per 1920x1080 a 60 FPS).

Grazie al supporto delle nuove istruzioni QSAD nella Radeon HD 7970, il suo vantaggio rispetto alle potenti CPU nell'algoritmo di rilevamento del movimento supera 10 volte! Cioè, ora ci verranno forniti video di alta qualità, e non solo durante l'elaborazione dei video domestici negli editor video, ma anche durante la visione dei video online di altre persone, girati con chissà cosa e chissà come.

Dettagli: serie Radeon HD 7800

  • Nome in codice del chip: "Pitcairn"
  • Tecnologia di produzione: 28 nm
  • 2,8 miliardi di transistor (leggermente più del Cayman, che è la base della serie Radeon HD 6900)
  • Un'architettura unificata con una serie di processori comuni per l'elaborazione del flusso di numerosi tipi di dati: vertici, pixel, ecc.
  • Supporto hardware per DirectX 11.1, incluso Shader Model 5.0
  • Bus di memoria a 256 bit: quattro controller a 64 bit che supportano la memoria GDDR5
  • Frequenza core: fino a 1000 MHz (per Radeon HD 7870)
  • 20 unità di calcolo GCN, inclusi 80 core SIMD, costituiti da un totale di 1280 ALU per calcoli in virgola mobile (formati interi e mobili, supporto per precisione FP32 e FP64 all'interno dello standard IEEE 754)
  • 80 unità texture, con supporto per filtraggio trilineare e anisotropico per tutti i formati texture
  • 32 unità ROP con supporto per modalità anti-aliasing con campionamento programmabile di oltre 16 campioni per pixel, incluso il formato frame buffer FP16 o FP32. Prestazioni di picco fino a 32 campioni per clock e in modalità solo Z: 128 campioni per clock

Specifiche della scheda grafica Radeon HD 7870

  • Frequenza centrale: 1000 MHz
  • Numero di processori universali: 1280
  • Numero di blocchi texture: 80, blocchi di fusione: 32
  • Tipo di memoria: GDDR5
  • Capacità di memoria: 2 gigabyte
  • Tasso di riempimento massimo teorico: 32,0 gigapixel al secondo.
  • Frequenza di campionamento teorica della trama: 80,0 gigatexel al secondo.
  • Un connettore CrossFire
  • Bus PCI Express 3.0
  • Connettori: DVI Dual Link, HDMI 1.4, due Mini-DisplayPort 1.2
  • Consumo energetico: da 3 a 175 W
  • Due connettori di alimentazione a 6 pin
  • Design a doppio slot
  • Prezzo consigliato per il mercato statunitense: $ 349

Specifiche della scheda grafica Radeon HD 7850

  • Orologio principale: 860 MHz
  • Numero di processori universali: 1024
  • Numero di blocchi texture: 64, blocchi di fusione: 32
  • Frequenza di memoria effettiva: 4800 MHz (4x1200 MHz)
  • Tipo di memoria: GDDR5
  • Capacità di memoria: 2 gigabyte
  • Larghezza di banda della memoria: 153,6 gigabyte al secondo.
  • Tasso di riempimento massimo teorico: 27,5 gigapixel al secondo.
  • Frequenza di campionamento teorica della trama: 55,0 gigatexel al secondo.
  • Un connettore CrossFire
  • Bus PCI Express 3.0
  • Connettori: DVI Dual Link, HDMI 1.4, due Mini-DisplayPort 1.2
  • Consumo energetico: da 3 a 130 W
  • Design a doppio slot
  • Prezzo consigliato negli Stati Uniti: $ 249

E questa volta il principio della denominazione dei prodotti dell’azienda non è stato modificato e sono state continuate le tendenze delle serie precedenti. La serie di schede video di fascia media basata sull'architettura GCN differisce dalle linee superiore e di budget per la seconda cifra nell'indice: invece di 7 e 9, viene inserito il numero 8, il che è abbastanza logico. Poiché AMD ha adottato la soglia psicologica di 1000 MHz per la frequenza della GPU, la Radeon HD 7870 ha ricevuto l'aggiunta della dicitura "GHz Edition" al nome, ad indicare che è stata utilizzata questa frequenza.

Dal nome è chiaro che la Radeon HD 7800 è più produttiva della HD 7700, ma ha una velocità inferiore rispetto ai modelli precedenti, la HD 7900. Per quanto riguarda il confronto con le soluzioni NVIDIA, il vecchio modello HD 7870 rilasciato all'epoca di rilascio compete con la scheda video GeForce GTX 570, e quella più giovane ha lo scopo di combattere la GTX 560 Ti, e NVIDIA non ha ancora rilasciato nuovi chip di fascia media da 28 nm.

Entrambi i modelli di schede video AMD hanno memoria GDDR5 della stessa capacità di 2 gigabyte. Entrambi utilizzano un bus di memoria a 256 bit e quindi possono essere configurati con 1, 2 o 4 GB. 1 GB è troppo poco e 4 GB sono troppo costosi per questa fascia di prezzo. Possiamo quindi dire che è stato scelto il volume ideale di 2 GB di memoria video, abbastanza sufficiente per la stragrande maggioranza dei giochi, anche ad alta risoluzione, e non troppo costoso in termini di costo.

Per il resto, dal punto di vista del consumatore, i modelli HD 7850 e HD 7870 sono ancora diversi. La vecchia Radeon HD 7870 ha un consumo energetico maggiore, quindi necessita di due connettori di alimentazione aggiuntivi a 6-pin, mentre l'HD 7850 si accontenta di uno solo di essi. Entrambe le schede hanno un design del sistema di raffreddamento a doppio slot, ma la maggior parte dei produttori produce schede con un proprio design per almeno un dispositivo di raffreddamento o anche un circuito stampato.

Caratteristiche architettoniche della famiglia Radeon HD 7800

Sopra nel testo abbiamo descritto attentamente tutte le funzionalità della nuova architettura Graphics Core Next (GCN), quindi ripeteremo solo quelle più importanti. Tutte le nuove GPU dell'azienda offrono capacità e prestazioni eccellenti non solo nell'elaborazione grafica, ma anche nell'elaborazione non grafica, inclusa una combinazione di diversi tipi di calcoli. Inoltre, la nuova architettura GCN offre una significativa semplificazione delle attività di ottimizzazione del codice, sviluppo e supporto semplificati, nonché prestazioni stabili e prevedibili e, in generale, un'efficienza piuttosto elevata.

Il blocco base della nuova architettura è il blocco GCN e tutte le GPU della serie Southern Islands sono assemblate da esso. Consideriamo lo schema a blocchi del chip Pitcairn:

Il diagramma mostra il processore grafico Radeon HD 7870 (l'HD 7850 "semplificato" differisce da esso in diverse unità disabilitate); vediamo 20 unità di calcolo dell'architettura GCN. Nel caso della soluzione junior della serie Radeon HD 7800, quattro di essi sono stati disabilitati e il numero di blocchi attivi al suo interno è 16. Ciò corrisponde rispettivamente a 1280 e 1024 stream processor (esattamente come nel caso dell'HD 7700, solo che ci sono esattamente il doppio dei blocchi). Poiché ogni blocco GCN contiene quattro unità texture, il numero finale di TMU per il modello precedente è 80 TMU e per quello più giovane - 64 TMU.

Ma anche il numero di unità ROP e controller di memoria nell'HD 7870 e nell'HD 7850 è lo stesso delle soluzioni della linea più giovane. Il numero di blocchi ROP è stato lasciato piuttosto elevato: 32 pezzi per entrambi i modelli. Il bus di memoria delle schede basate su Pitcairn è ridotto a 256 bit ed è assemblato da quattro canali a 64 bit. Questo non è male per una soluzione di questo livello, anche se è una volta e mezza inferiore rispetto alla riga superiore, perché il bus di memoria è tradizionalmente la prima cosa da tagliare. È positivo che l'uso della veloce memoria GDDR5 abbia fornito una larghezza di banda relativamente elevata di 153 GB/s.

Come altri chip dell'architettura GCN, Pitcairn incorpora un'unità tassellatrice di nona generazione, che presenta numerose ottimizzazioni di buffering e caching per migliorare significativamente le prestazioni di elaborazione della geometria. Ecco un confronto tra la nuova scheda AMD e la soluzione della generazione precedente in un problema sintetico, che suggerisce un aumento della velocità di tassellatura fino a quattro volte:

Allo stesso modo, sono supportate molte tecnologie AMD, introdotte e migliorate nei nuovi chip video della linea Radeon HD 7000. Ecco un elenco incompleto: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, miglioramenti nella qualità del filtraggio delle texture , eccetera. Tutto questo è scritto più dettagliatamente sopra. Aggiungiamo alla lista che la Radeon HD 7800 supporta pienamente sia l'algoritmo anti-aliasing migliorato MLAA 2.0 che il super-sampling anti-aliasing (SSAA).

Quando si tratta di confrontare le prestazioni di gioco, la Radeon HD 7870 è significativamente più veloce della sua diretta concorrente, la GeForce GTX 570, soprattutto considerando la mancanza di 1,25 GB di memoria video in quest'ultima (rispetto ai 2 GB delle soluzioni in esame), osservato nei giochi moderni con risoluzioni di rendering elevate. La più giovane Radeon HD 7850 può essere paragonata alla GeForce GTX 560 Ti, e qui non può più vantare capacità di memoria. Tuttavia, secondo le misurazioni di AMD, la loro nuova soluzione è ancora più veloce della concorrenza nella maggior parte dei giochi.

Dettagli: serie Radeon HD 7700

  • Nome in codice del chip: "Capo Verde"
  • Tecnologia di produzione: 28 nm
  • 1,5 miliardi di transistor (meno di Barts, che è la base della serie Radeon HD 6800)
  • Un'architettura unificata con una serie di processori comuni per l'elaborazione del flusso di numerosi tipi di dati: vertici, pixel, ecc.
  • Supporto hardware per DirectX 11.1, incluso Shader Model 5.0
  • Frequenza core: fino a 1000 MHz (per Radeon HD 7770)
  • 10 unità di calcolo GCN, inclusi 40 core SIMD, costituiti da un totale di 640 ALU in virgola mobile (formati interi e in virgola mobile, supporto per la precisione FP32 e FP64 all'interno dello standard IEEE 754)
  • 40 unità texture, con supporto per filtraggio trilineare e anisotropico per tutti i formati texture
  • Supporto integrato per un massimo di sei monitor, inclusi HDMI 1.4a e DisplayPort 1.2

Specifiche della scheda grafica Radeon HD 7770

  • Frequenza centrale: 1000 MHz
  • Numero di processori universali: 640
  • Numero di blocchi texture: 40, blocchi di fusione: 16
  • Tipo di memoria: GDDR5
  • Capacità di memoria: 1 gigabyte
  • Frequenza di campionamento teorica della trama: 40,0 gigatexel al secondo.
  • Un connettore CrossFire
  • Bus PCI Express 3.0
  • Connettori: DVI Dual Link, HDMI 1.4, due Mini-DisplayPort 1.2
  • Consumo energetico: da 3 a 80 W
  • Un connettore di alimentazione a 6 pin
  • Design a doppio slot
  • Prezzo consigliato per il mercato statunitense: $159

Specifiche della scheda grafica Radeon HD 7750

  • Frequenza centrale: 800 MHz
  • Numero di processori universali: 512
  • Numero di blocchi texture: 32, blocchi di fusione: 16
  • Frequenza di memoria effettiva: 4500 MHz (4x1125 MHz)
  • Tipo di memoria: GDDR5
  • Capacità di memoria: 1 gigabyte
  • Larghezza di banda della memoria: 72 gigabyte al secondo.
  • Tasso di riempimento massimo teorico: 12,8 gigapixel al secondo.
  • Frequenza di campionamento teorica della trama: 25,6 gigatexel al secondo.
  • Bus PCI Express 3.0
  • Connettori: DVI Dual Link, HDMI 1.4, una DisplayPort 1.2
  • Consumo energetico: da 3 a 55 W
  • Non richiede potenza aggiuntiva
  • Design a slot singolo
  • Prezzo consigliato per il mercato statunitense: $109

Una serie economica di schede video basate sull'architettura GCN differisce dalle linee di fascia alta e media per la seconda cifra nell'indice: il numero 9 è occupato dal numero 7, come prima. La Radeon HD 7770 è una soluzione più produttiva, ma esiste anche un modello più giovane: la HD 7750. La scheda più vecchia al momento del suo rilascio non aveva concorrenti diretti sul mercato, situata a metà tra la GeForce GTX 560 e la GTX 550 Ti , e il più giovane mira a combattere la GTX 550 Ti. Per l'HD 7770, è stato successivamente annunciato un concorrente sotto forma della GeForce GTX 560 SE (tutte le soluzioni NVIDIA sono basate su GPUs più vecchie).

Entrambi i modelli di schede video AMD in esame hanno una memoria GDDR5 della stessa capacità di 1 gigabyte. Grazie all'utilizzo di un bus di memoria a 128 bit, potrebbero essere dotati di 2 GB, ma una tale quantità di memoria GDDR5 sarebbe troppo costosa per il loro segmento di prezzo. Pertanto, finora sono stati rilasciati modelli con questo volume, anche se in futuro è possibile che vengano rilasciate varianti con 2 GB di memoria video. Per ora hanno deciso di lasciare questa capacità all'HD 7800.

In termini di altre caratteristiche di consumo, i modelli HD 7750 e HD 7770 sono abbastanza diversi. Se la vecchia Radeon HD 7770 ha un design del sistema di raffreddamento a due slot e il suo dispositivo di raffreddamento è coperto da un involucro di plastica come le soluzioni precedenti, la giovane HD 7750 sembra notevolmente più semplice, occupando uno slot e avendo un semplice dispositivo di raffreddamento. Tuttavia, la maggior parte dei produttori produce ancora schede con i propri design. Anche il consumo energetico dei nuovi modelli in questa fascia di prezzo è diverso, il più vecchio ha un connettore di alimentazione aggiuntivo a 6 pin e il più giovane utilizza l'energia ricevuta tramite PCI Express.

Caratteristiche architettoniche della Radeon HD 7700

Il blocco base della nuova architettura è il blocco GCN, da cui vengono assemblate tutte le GPU della serie. Ciascuno dei blocchi GCN disponibili è in grado di pianificare e distribuire autonomamente i comandi e un blocco di calcolo può eseguire fino a 32 thread di comandi indipendenti. Diamo un'occhiata allo schema a blocchi del chip Capo Verde:

Il diagramma mostra il processore grafico Radeon HD 7770 (l'HD 7750 "ridotto" ha diverse unità disabilitate); vediamo 10 unità di calcolo dell'architettura GCN. Nel caso della soluzione junior della serie Radeon HD 7700, si è deciso di disabilitarne due e il numero di blocchi è diventato 8. Ciò corrisponde a 640 e 512 stream processor. E poiché ogni blocco GCN contiene 4 unità texture, il numero finale di TMU per il modello precedente è 40 TMU e per quello più giovane - 32 TMU.

Il numero di unità ROP e controller di memoria nell'HD 7770 e nell'HD 7750 non è diverso e hanno deciso di non ridurre troppo il ROP, lasciandone 16 ciascuno. Ma il bus di memoria del Capo Verde è tagliato a 128 bit, che è assemblato da due canali a 64 bit. In generale, questo è tre volte inferiore rispetto alle serie migliori e abbiamo visto un'altra conferma del fatto che il bus di memoria è tradizionalmente la prima cosa da tagliare in chip economici. Sebbene l'uso della veloce memoria GDDR5 abbia permesso di mantenere una larghezza di banda relativamente elevata (per soluzioni così economiche) di 72 GB/s.

Tutto ciò che resta da notare è la quantità piuttosto elevata di cache di secondo livello - ben 512 kilobyte (rispetto ai 768 KB del chip superiore - apparentemente la cache L2 non occupa troppo spazio sul chip), poiché nonché miglioramenti nelle prestazioni geometriche. Come il chip di fascia alta, Capo Verde è dotato di un tassellatore di nona generazione con numerose ottimizzazioni di buffering e caching per migliorare significativamente le prestazioni di elaborazione della geometria rispetto alla serie Radeon HD 6000.

In generale non ripeteremo tutte le informazioni sulle tecnologie AMD introdotte e migliorate nei nuovi chip video della linea Radeon HD 7000 (ecco un elenco incompleto: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, miglioramenti nella qualità del filtraggio delle texture, ecc. .p.), tutto questo è scritto in dettaglio sopra. La serie HD 7700 supporta tutte le funzionalità elencate, incluso AMD Eyefinity 2.0 con sei monitor e rendering stereo, e ha anche un'unità di decodifica e codifica video migliorata.

Ma per quanto riguarda la cosa più importante: le prestazioni di gioco? Le prime stime sulla velocità di rendering possono sempre essere fatte dalle presentazioni del produttore. AMD ritiene che la Radeon HD 7770 si collochi da qualche parte a metà tra la GeForce GTX 560 e la GeForce GTX 550 Ti, rispettivamente, e la confronta nei materiali con il secondo modello della concorrenza.

Ma non confrontano la Radeon HD 7750 con nulla, semplicemente notando che la maggior parte dei giochi moderni è riproducibile su questo modello con le impostazioni massime in risoluzione FullHD. Tuttavia, ciò non sorprende, poiché negli ultimi anni non ci sono praticamente esclusive per PC e i giochi multipiattaforma sono molto meno impegnativi. Quindi le schede della serie Radeon HD 7700 sono perfette per gli utenti poco esigenti.

Dettagli: modello Radeon HD 7790

  • Nome in codice del chip: "Bonaire"
  • Tecnologia di produzione: 28 nm
  • 2,08 miliardi di transistor (più del Capo Verde nella Radeon HD 7700, ma meno del Pitcairn nella Radeon HD 7800)
  • Un'architettura unificata con una serie di processori comuni per l'elaborazione del flusso di numerosi tipi di dati: vertici, pixel, ecc.
  • Supporto hardware per DirectX 11.1, incluso Shader Model 5.0
  • Bus di memoria a 128 bit: due controller a 64 bit che supportano la memoria GDDR5
  • Frequenza centrale: 1000 MHz
  • 14 unità di calcolo GCN, inclusi 56 core SIMD, costituiti da un totale di 896 ALU in virgola mobile (formati interi e in virgola mobile, supporto per la precisione FP32 e FP64 all'interno dello standard IEEE 754)
  • 56 unità texture, con supporto per filtraggio trilineare e anisotropico per tutti i formati texture
  • 16 blocchi ROP con supporto per modalità antialiasing con la possibilità di campionare in modo programmabile più di 16 campioni per pixel, incluso il formato frame buffer FP16 o FP32. Prestazioni di picco fino a 16 campioni per clock e in modalità solo Z: 64 campioni per clock

Specifiche della scheda grafica Radeon HD 7790

  • Frequenza centrale: 1000 MHz
  • Numero di processori universali: 896
  • Numero di blocchi texture: 56, blocchi di fusione: 16
  • Tipo di memoria: GDDR5
  • Capacità di memoria: 1 gigabyte
  • Larghezza di banda della memoria: 96 gigabyte al secondo.
  • Tasso di riempimento massimo teorico: 16,0 gigapixel al secondo.
  • Frequenza di campionamento teorica della trama: 56,0 gigatexel al secondo.
  • Un connettore CrossFire
  • Bus PCI Express 3.0
  • Connettori: DVI Dual Link, HDMI 1.4, due Mini-DisplayPort 1.2
  • Consumo energetico: da 3 a 85 W
  • Un connettore di alimentazione a 6 pin
  • Design a doppio slot
  • Prezzo consigliato negli Stati Uniti: $ 149

Il modello economico di scheda video, basato su un nuovo chip di fascia media, differisce dal precedente modello di punta della sottofamiglia HD 7700 per la terza cifra nell'indice: invece di 7, hanno inserito il numero 9, che indica un aumento delle prestazioni . Allo stesso tempo, l'indice Radeon HD 7790 indica chiaramente che si tratta di una scheda video meno potente rispetto alla linea un gradino più alta: HD 7800.

Tuttavia, anche qui non tutto è così semplice - può sicuramente competere con la più giovane HD 7850. Ma il prezzo consigliato della Radeon HD 7790 è fissato a 149 dollari, cioè all'incirca a metà tra i prezzi della HD 7770 e della HD 7850. Per quanto riguarda le soluzioni di un concorrente dello stesso segmento di prezzo, l'uscita della HD La 7790 era chiaramente destinata ad avere qualcosa da combattere con la NVIDIA GeForce GTX 650 Ti, basata sul chip GK106, che si trova esattamente tra la HD 7770 e la HD 7850 per prezzo e velocità. Ma NVIDIA ha immediatamente risposto al rilascio della nuova scheda da parte di AMD, rilasciando sul mercato una versione overcloccata della GeForce GTX 650 Ti Boost, che ha prestazioni maggiori.

Questo modello di scheda video AMD ha una memoria GDDR5 con una capacità di solo 1 gigabyte. La GPU ha un bus di memoria a 128 bit e teoricamente potrebbe essere di 2 GB, ma questa quantità di memoria GDDR5 veloce è ancora troppo costosa per questo segmento di prezzo e AMD ha rilasciato un modello con una capacità inferiore, anche se potrebbe non essere abbastanza per alcuni giochi moderni anche con impostazioni e risoluzione non massime. Tuttavia, è possibile rilasciare schede video dai partner con 2 GB di memoria video.

Come i modelli successivi della linea, la Radeon HD 7790 ha un sistema di raffreddamento a doppio slot, coperto da un case di plastica. Sebbene la maggior parte dei produttori continui a rilasciare schede madri con il proprio design più fresco, quindi quella di riferimento non è così importante. È interessante notare che il consumo energetico del nuovo modello non è aumentato di molto rispetto all'HD 7770, ma il miglioramento dell'efficienza energetica era previsto. Questo è il motivo per cui il nuovo prodotto dispone anche di un solo connettore di alimentazione aggiuntivo a 6 pin.

Caratteristiche architettoniche

Il nuovo processore grafico Bonaire, su cui si basa il modello Radeon HD 7790 rilasciato, appartiene alla stessa architettura Graphics Core Next (GCN) che conosciamo da un anno e mezzo, ma AMD la chiama GCN 1.1, suggerendo piccoli cambiamenti. Dal punto di vista architettonico, infatti, il chip non è praticamente diverso dai precedenti, anche se ci sono effettivamente alcune piccole modifiche. Ad esempio, la nuova architettura ha introdotto istruzioni utili per l'architettura di sistema eterogenea (HSA), il supporto per un numero maggiore di thread eseguiti contemporaneamente, nonché una nuova versione della tecnologia AMD PowerTune, di cui parleremo più avanti. Ma tutti questi cambiamenti non possono essere definiti significativi, perché non c’è nulla di nuovo nei blocchi di base e nel miglioramento della loro efficienza.

Pertanto, puoi tranquillamente fare riferimento a, che descrive attentamente tutte le funzionalità della nuova architettura Graphics Core Next (GCN), e qui ripeteremo solo le caratteristiche e le caratteristiche più importanti di un particolare prodotto. Tutte le GPU più recenti di AMD offrono capacità e prestazioni eccellenti sia nell'elaborazione grafica che non grafica e in una combinazione dei due. La nuova architettura GCN ha inoltre notevolmente semplificato le attività di ottimizzazione e sviluppo software mantenendo un'elevata efficienza.

Come sapete, il blocco base dell'architettura è il blocco GCN, da cui sono assemblati tutti i processori grafici della serie Southern Islands. Il blocco computazionale GCN è diviso in sottosezioni, ciascuna delle quali lavora sul proprio flusso di comandi. I blocchi GCN hanno 64 KB di spazio di archiviazione dati locale dedicato per lo scambio di dati o l'espansione dello stack di registri locali. Il blocco dispone anche di una cache di primo livello con funzionalità di lettura-scrittura e di una pipeline di texture completa con unità di campionamento e filtraggio. Ciascuno dei blocchi GCN esistenti è in grado di pianificare e distribuire autonomamente i comandi e un blocco di calcolo può eseguire diversi flussi di comandi indipendenti. Diamo un'occhiata allo schema a blocchi del nuovo chip:

Il design di Bonaire conferma l'obiettivo della nuova soluzione di offrire prestazioni tra Capo Verde, che dispone di 10 unità di calcolo GCN, e Pitcairn, con le sue 20 unità GCN. Queste due GPU, rilasciate nel 2012, sono quasi esattamente la metà l'una dell'altra, lasciando nel mezzo un divario prestazionale abbastanza ampio che Bonaire ha ora colmato.

Il diagramma mostra un processore grafico sotto forma di Radeon HD 7790, che è una soluzione completa senza tagliare alcun blocco. Il chip comprende 14 unità di calcolo dell'architettura GCN, che corrispondono a 896 stream processor. Poiché ogni blocco GCN contiene 4 unità texture, il numero finale di TMU per il nuovo modello è 56 TMU. Cioè, Bonaire è esattamente 1,4 volte più veloce del chip di Capo Verde in termini di velocità dei calcoli matematici e di recupero delle texture, assumendo frequenze uguali.

Ma il numero di unità ROP e controller di memoria in Bonaire e Radeon HD 7790 è simile a quello che abbiamo visto a Capo Verde e nella Radeon HD 7770: hanno deciso di lasciare 16 unità ROP e il bus di memoria del nuovo chip è a 128 bit, assemblato da due canali a 64 bit. Il numero ridotto di blocchi ROP potrebbe essere il “tallone d’Achille” della soluzione, poiché l’uso della veloce memoria GDDR5 ha reso possibile un throughput relativamente elevato di 96 GB/s, ma non si può fare nulla per quanto riguarda le prestazioni ROP.

Ma la nuova GPU presenta miglioramenti nelle prestazioni geometriche e nella velocità di tassellatura. Sì, Capo Verde ha anche un tassellatore di nona generazione, ma Bonaire ha anche raddoppiato il numero di blocchi geometrici, rasterizzatori e processori di comando (indicati come ACE nel diagramma) - ora ce ne sono due. Questo miglioramento dà a Bonaire la capacità di elaborare fino a due primitive geometriche per ciclo di clock, proprio come i più potenti Pitcairn e Tahiti.

Come ricorderete, è stato con la Radeon HD 7770 che AMD ha raggiunto per la prima volta l'importante traguardo psicologico della frequenza di clock della GPU di 1 GHz. Quindi, anche l'HD 7790 ha esattamente la stessa frequenza di riferimento di 1 GHz, quindi l'aumento delle prestazioni rispetto all'HD 7770 sarà giustificato esclusivamente dalle modifiche all'architettura e dall'aumento del numero di unità di esecuzione.

Ma la frequenza operativa della memoria video del nuovo prodotto è molto più alta. Se l'HD 7770 aveva una frequenza di memoria relativamente bassa di 4,5 GHz, allora l'HD 7790 è dotata di una veloce memoria GDDR5 operante a 6 GHz, che fornisce un terzo di larghezza di banda in più. La larghezza di banda della memoria video aumentata del 33% rispetto ai modelli della sottofamiglia Radeon HD 7700 ha portato ad un netto aumento delle prestazioni di gioco. AMD fornisce questo grafico che confronta i frame rate sull'HD 7790 con memoria in esecuzione a 4,5 e 6,0 GHz:

L'accelerazione massima derivante dall'aumento della larghezza di banda della memoria è stata raggiunta in giochi come StarCraft II e Crysis 2. E in media, un aumento del 33% della larghezza di banda della memoria dà un aumento di circa il 10% del frame rate medio in una serie di giochi moderni. . Questo è un buon indicatore, che mostra che la larghezza di banda della memoria è piuttosto importante al giorno d'oggi, sebbene non sia l'unico obiettivo sulla produttività. Anche se è del tutto possibile che con più ROP, la velocità di Bonaire sarebbe ancora più elevata...

È chiaro che il consumo energetico medio è leggermente aumentato rispetto all'HD 7770. Se per il vecchio modello questo valore è 80 W, per l'HD 7790 è 85 W: questo è un prezzo molto basso da pagare per un aumento teorico delle prestazioni del 33-40%! Miglioramenti architettonici (PowerTune), progettazione di una nuova GPU utilizzando l'esperienza di quelle precedenti, nonché miglioramento continuo del processo tecnico presso TSMC: tutto ciò ha portato ad un leggero aumento dei consumi con un significativo miglioramento delle caratteristiche di velocità.

Per quanto riguarda l'area del chip e il numero di transistor di Bonaire, il nuovo chip è chiaramente più grande di Capo Verde, ma l'aggiunta di unità computazionali, di consistenza e di geometria non poteva passare inosservata. Secondo questi parametri, anche Bonaire si trova approssimativamente a metà tra Capo Verde e Pitcairn. Bonaire contiene 2,08 miliardi di transistor in un chip da 160 mm 2, per Capo Verde queste cifre sono rispettivamente 1,5 miliardi e 123 mm 2 e per Pitcairn - 2,8 miliardi di transistor e un'area del chip di 212 mm 2.

Naturalmente, il nuovo chip supporta tutte le tecnologie AMD introdotte e migliorate nella nuova famiglia Radeon HD 7000 (elenco incompleto: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, qualità di filtraggio delle texture migliorata, ecc.), sia tutto questo scritto in dettaglio nell'articolo AMD Radeon HD 7970: The New Single-Processor Leader. L'HD 7790 supporta tutte le caratteristiche elencate, incluso AMD Eyefinity 2.0 con sei monitor e rendering stereo, e ha anche un'unità di decodifica e codifica video migliorata.

Tecnologia PowerTune migliorata

Nel 2010, AMD ha introdotto la tecnologia PowerTune nel suo chip Cayman (serie AMD Radeon HD 6900). Questa GPU è stata la prima a presentare la gestione dinamica della potenza, chiamata PowerTune. Ha consentito velocità di clock massime più elevate per applicazioni tipiche, evitando un consumo energetico eccessivo in test di stabilità specializzati come FurMark. Successivamente la tecnologia è stata applicata al modello dual-chip AMD Radeon HD 6990, che ne aveva ancora più bisogno per ovvie ragioni.

La tecnologia ha ricevuto un serio aggiornamento a metà del 2012, quando l'aumento automatico della frequenza - Boost - è stato aggiunto ad AMD PowerTune. Nell'AMD Radeon HD 7970 GHz Edition, questo algoritmo ha permesso di migliorare ulteriormente le prestazioni rispetto alla versione normale della scheda video. L'algoritmo operativo PowerTune nelle schede video senza overclock automatico utilizza tre stati: inattivo, basso 3D e massima velocità. L'HD 7970 GHz ha aggiunto anche una modalità di overclocking Boost. PowerTune serve a rimanere entro i consumi richiesti, passando a una modalità di carico inferiore quando necessario. In questo caso, la tecnologia riduce drasticamente la frequenza dell'orologio. In pratica, tali salti sono rari, a causa dell'ampio divario tra le due modalità attive.

Ridurre la velocità di clock della GPU riduce il consumo energetico, ma per un controllo più efficiente è necessario ridurre anche la tensione. Questo è esattamente ciò che fa la Radeon HD 7790. Il nuovo chip grafico Bonaire ha otto stati con frequenze e voltaggi diversi, consentendoti di raggiungere velocità di clock più elevate rispetto a prima, mentre la GPU funziona sempre alla tensione e frequenza ottimali. Il passaggio da uno stato all'altro si basa sul carico della GPU, nonché sul consumo energetico attuale del chip video.

Nel nuovo algoritmo, PowerTune non deve reimpostare bruscamente la frequenza quando viene superato il livello di consumo e, insieme alla frequenza, diminuisce anche la tensione. Le transizioni tra gli stati devono essere le più veloci possibile per non superare il limite di consumo anche per un breve periodo, quindi Bonaire commuta gli stati PowerTune ogni 10 ms, ovvero lo stato del chip cambia 100 volte al secondo.

Con un cambiamento così costante delle frequenze, applicazioni di terze parti come MSI Afterburner e GPU-Z non mostreranno valori di velocità di clock istantanei, ma medi per un certo periodo di tempo - la cosiddetta frequenza "effettiva". Un altro sviluppo interessante è che AMD sta aprendo le nuove impostazioni PowerTune alle applicazioni di terze parti. I partner possono anche configurare le proprie impostazioni PowerTune, che aiuteranno durante la creazione di modelli di schede video overcloccate in fabbrica e forniranno più opzioni che non sono limitate dai valori di riferimento AMD. È vero, diverse impostazioni di PowerTune possono portare al fatto che le schede video dello stesso modello di diversi produttori non solo avranno frequenze di clock diverse, ma anche un algoritmo per modificarle nel tempo, il che renderà difficile il confronto nelle stesse condizioni.

Le vendite delle schede video Radeon HD 7790 sul mercato sono iniziate all'inizio di aprile 2013. AMD, insieme ai suoi partner, ha organizzato il rilascio di entrambe le schede madri con frequenze di riferimento e soluzioni overcloccate di fabbrica. E ora entrambi i produttori lanciano nuove schede video sul mercato più o meno allo stesso modo, con varie opzioni rapidamente disponibili presso i loro partner. In effetti, i partner hanno rilasciato versioni quasi più overcloccate dell'HD 7790 rispetto a quelle normali e i chip grafici in esse contenuti funzionano a frequenze di circa 1075 MHz.

Dettagli: modello Radeon HD 7990

  • Nome in codice "Malta"
  • Tecnologia di produzione: 28 nm
  • 2 chip con 4,3 miliardi di transistor ciascuno
  • Un'architettura unificata con una serie di processori comuni per l'elaborazione del flusso di numerosi tipi di dati: vertici, pixel, ecc.
  • Supporto hardware per DirectX 11.1, incluso Shader Model 5.0
  • Doppio bus di memoria a 384 bit: due volte sei controller a 64 bit con supporto per la memoria GDDR5
  • Frequenza GPU: 1000 MHz
  • Due volte 32 unità di calcolo GCN, ciascuna con 128 core SIMD, costituite da un totale di 4096 ALU in virgola mobile (formati interi e in virgola mobile, supporto per la precisione FP32 e FP64 all'interno dello standard IEEE 754)
  • Unità texture 2x128, con supporto per filtraggio trilineare e anisotropico per tutti i formati texture
  • Unità ROP 2x32 con supporto per modalità antialiasing con la possibilità di campionare in modo programmabile più di 16 campioni per pixel, incluso il formato frame buffer FP16 o FP32. Prestazioni di picco fino a 64 campioni per clock e in modalità solo Z: 256 campioni per clock
  • Supporto integrato per un massimo di sei monitor tramite interfacce HDMI 1.4a e DisplayPort 1.2

Specifiche della scheda grafica Radeon HD 7990

  • Frequenza centrale: 1000 MHz
  • Numero di processori universali: 4096
  • Numero di blocchi texture: 2x128, blocchi di fusione: 2x32
  • Frequenza di memoria effettiva: 6000 MHz (4x1500 MHz)
  • Tipo di memoria: GDDR5
  • Capacità di memoria: 2x3 gigabyte
  • Larghezza di banda della memoria: 2x288 gigabyte al secondo.
  • Tasso di riempimento massimo teorico: 64 gigapixel al secondo.
  • Frequenza di campionamento teorica della texture: 256 gigatexel al secondo.
  • Un connettore CrossFire
  • Bus PCI Express 3.0
  • Connettori: DVI Dual Link, quattro Mini-DisplayPort 1.2
  • Consumo energetico fino a 375 W
  • Due connettori di alimentazione ausiliaria a 8 pin
  • Design a doppio slot
  • Prezzo consigliato per la Russia: 32.999 rubli. (per gli Stati Uniti - $ 999).

Già nella seconda generazione di schede video AMD il principio di denominazione dei modelli dual-chip rimane invariato. La soluzione migliore su due potenti chip video differisce dal modello della generazione precedente corrispondente alla sua classe nella prima cifra dell'indice: invece di 6, ha ricevuto il numero 7, che indica una nuova serie. La scheda video annunciata differisce dalla soluzione a chip singolo per la terza cifra, indicando le massime prestazioni all'interno della generazione.

Per quanto riguarda il confronto con la concorrenza, la principale rivale del modello Radeon HD 7990 annunciato oggi è la scheda video GeForce GTX 690, rilasciata quasi un anno fa, e sono queste soluzioni dual-chip che dovranno combattere tra loro. È vero, NVIDIA ha anche un'altra soluzione potente, ma basata su un'unica GPU: GeForce GTX Titan, che può anche essere considerata un concorrente della scheda in questione di AMD.

La nuova scheda video Radeon dual-chip è dotata di 3 gigabyte di memoria GDDR5 per ogni GPU, grazie al bus di memoria a 384 bit dei chip Tahiti. Questo volume è abbastanza giustificato per un prodotto di così alto livello, poiché in alcune moderne applicazioni di gioco, con impostazioni massime, anti-aliasing abilitato e risoluzioni elevate, una quantità inferiore di memoria (2 gigabyte per chip o meno) potrebbe non essere più disponibile. Abbastanza. E ancora di più durante il rendering in modalità stereo o su più monitor in modalità Eyefinity.

È chiaro che una scheda video a doppio chip così potente ha un enorme sistema di raffreddamento a doppio slot, che differisce dai tradizionali dispositivi di raffreddamento per le schede AMD. È dotato di un enorme radiatore nascosto sotto un involucro con tre grandi ventole che funzionano a velocità relativamente basse. Il consumo energetico di una scheda con due GPU a bordo è piuttosto elevato per ovvi motivi e ha due connettori di alimentazione a 8 pin, ma almeno non sono tre, come nel caso dei campioni non di riferimento basati su due chip Tahiti.

Architettura

Poiché la scheda video, nome in codice "Malta", si basa su due GPU "Tahiti" della famiglia Southern Islands, potete semplicemente fare riferimento a, che descrive attentamente tutte le caratteristiche dell'attuale architettura Graphics Core Next (GCN). Nei materiali di base ripetiamo solo le caratteristiche e le caratteristiche più importanti di prodotti specifici.

Il blocco base dell'architettura è il blocco GCN, da cui sono assemblate tutte le GPU della serie. L'unità di calcolo è divisa in sottosezioni, ognuna delle quali funziona sul proprio flusso di istruzioni, ha un archivio dati locale dedicato, una cache L1 di lettura-scrittura e una pipeline di texture completa con unità di recupero e filtro. Ciascuno dei blocchi GCN è in grado di pianificare e distribuire autonomamente i comandi e un blocco di calcolo può eseguire diversi flussi di comandi indipendenti. La Radeon HD 7990 utilizza due chip Tahiti a noi già noti:

Lo schema del processore grafico (ce ne sono due nella Radeon HD 7990) mostra 32 unità di calcolo dell'architettura GCN e tutte sono attive. In precedenza, si presumeva che per una soluzione a due chip sarebbe stato necessario disabilitarne alcuni e persino abbassare la frequenza per entrare nei limiti di consumo energetico di 375 W, ma gli ingegneri AMD sono riusciti a risolvere con successo questo difficile problema. Forse è stata rilasciata una nuova revisione speciale di Tahiti con un consumo energetico ridotto, oppure i chip sono semplicemente sottoposti a un processo di selezione molto rigido.

Dato che ogni unità GCN contiene 16 unità texture, il numero di TMU è di 128 unità per chip, il che dà una prestazione finale di 256 gigatexel al secondo, che è molto buona per un concorrente della GeForce GTX 690. Numero di unità ROP e controller di memoria anche l'HD 7990 non è cambiato rispetto alla sua controparte single-chip; sono rimasti rispettivamente a 32 e 6 pezzi per GPU. La Radeon HD 7990 dispone di doppi bus di memoria a 384 bit composti da dodici canali a 64 bit, che forniscono una larghezza di banda di memoria totale di 576 GB/s - un altro dato da record.

Per il resto, la nuova scheda supporta tutte le moderne tecnologie AMD introdotte e migliorate nei nuovi chip video della linea Radeon HD 7000: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, migliore qualità del filtraggio delle texture, ecc. Tutto questo è scritto in dettaglio sopra nella descrizione della Radeon HD 7970, e semplicemente non ha senso ripeterlo.

Sistema di raffreddamento e consumo energetico

Nel caso di schede a doppio chip così serie, un sistema di raffreddamento altamente efficiente diventa particolarmente importante. Se nel caso delle soluzioni dei partner basate su due Tahiti sono state utilizzate soluzioni a tre slot e nel caso di ASUS ARES II è stato utilizzato il raffreddamento ad acqua, in questo caso è stato necessario arrangiarsi con meno sforzo, quindi un dispositivo di raffreddamento è stato progettato con un radiatore molto massiccio e tre ventole con caratteristiche acustiche migliorate.

Il livello di rumore del sistema di raffreddamento e la temperatura prevista per le GPU sono tra le caratteristiche di consumo più importanti per qualsiasi scheda video, compresa una soluzione di fascia alta destinata agli appassionati. Un sistema di raffreddamento troppo rumoroso o inefficace sarà considerato dagli acquirenti come un acquisto meno redditizio, a parità di tutti gli altri fattori. Quindi AMD ha preso molto sul serio questo problema nel caso del modello Radeon HD 7990, se confrontato con altre soluzioni top sul mercato. Vediamo le caratteristiche acustiche del nuovo sistema:

Il diagramma mostra il livello di rumore di tre diverse schede video: la Radeon HD 7990 e due concorrenti: la GeForce GTX 690 dual-chip e la GTX Titan single-chip di NVIDIA. Inoltre, il rumore è stato misurato in diverse condizioni - in modalità idle (System Idle) e al massimo carico utilizzando Furmark. Se credi ai dati forniti da AMD, anche il Titan a chip singolo non raggiunge il loro nuovo prodotto in termini di rumore dal dispositivo di raffreddamento, per non parlare della GTX 690 a doppio chip, che è la più rumorosa in questo confronto.

Ma prestazioni acustiche così impressionanti sono state ottenute a scapito della temperatura della GPU? Il grafico seguente mostra le temperature della GPU misurate sulla Radeon HD 7990 di AMD e sugli stessi due concorrenti. Questa volta, gli specialisti AMD hanno utilizzato solo la modalità di carico elevato durante i test a Furmark.

E ancora, viene utilizzato un asse di coordinate “complicato” con l’origine non a zero. La differenza reale tra 80 e 82 gradi per la Radeon HD 7990 e la GTX Titan sarà praticamente impercettibile, anche se 87 gradi per la GTX 690 sono chiaramente in peggio. Ancora una volta, notiamo che tutti questi test sono stati condotti da una delle parti interessate e sono soggetti a verifica indipendente.

In termini di consumo energetico, non c'è nulla di nuovo nella soluzione dual-chip, ma c'è anche il supporto per la tecnologia ZeroCore Power precedentemente annunciata. Questa tecnologia aiuta a ridurre significativamente il consumo energetico durante la modalità di inattività profonda (o sospensione) con il dispositivo di visualizzazione spento. In questa modalità, la GPU in idle è quasi completamente spenta e consuma meno del 5% dell'energia della modalità completa, disabilitando la maggior parte delle unità funzionali. E nel caso di una scheda a due chip, è ancora più importante che nel sistema CrossFire, durante il rendering dell'interfaccia bidimensionale del sistema operativo, tutte le GPU tranne quella principale non funzionino affatto. Cioè, nel caso della Radeon HD 7990, uno dei chip in modalità 2D sarà immerso in un sonno profondo con un consumo energetico minimo, e il secondo potrà “addormentarsi” in modalità di inattività profonda del PC.

I giochi moderni ogni anno richiedono schede video sempre più potenti per l'elaborazione grafica. Una delle soluzioni economiche per i giocatori sarà la serie AMD Radeon HD 7800. Diamo un'occhiata alle caratteristiche tecniche di questa serie, nonché alle sue caratteristiche e prestazioni nei giochi.

Diamo un'occhiata alle caratteristiche della serie AMD Radeon HD 7800 sotto forma di tabella:

Processo tecnico 28 miglia nautiche
GPU Pitcairn
Frequenza (min. max. sui modelli) 800-1000 MHz
RAM Tipo GDDR5
Volume 2GB
Frequenza 800-1200 MHz
Larghezza di banda 153,6 GB/sec
Interfacce Dimensione della memoria 256 bit
Tipo di pneumatico PCI Express 3.0
Architettura GCN
Processori di flusso per blocco da 64 a 80
Numero di blocchi dalle 16 alle 20
Processori di flusso totali 1024-1280
Nuclei per l'elaborazione della geometria 2 pezzi.
Core per il calcolo asincrono 2 pezzi.
Connettori HDMI

DisplayPort 1.2

Tecnologie e software supportati DirectX11
OpenGL 4.2
Eyefinity (unione dei monitor) fino a 6 pz.
Potenza ZeroCore Modalità sonno
Catalizzatore Driver con marchio e configurazione
Accelerazione dell'app Miglioramento della qualità della riproduzione video
AMDHD3D Elaborazione grafica 3D
Sintonia di potenza Regolazione dinamica del consumo energetico

La linea è stata prodotta nel marzo 2012. Sulla base di esso, sono stati rilasciati i seguenti modelli:

  • HD7850;
  • HD7870;
  • HD7890.

Al momento la gamma di modelli non viene più prodotta. All'inizio dei saldi, il prezzo medio nei negozi era di 249 e 349 dollari.

Revisione

In AMD, dopo l'inserimento in un nuovo processo tecnologico, si è deciso di dividere l'intera serie di produzione in sottogruppi. Pertanto, sono state realizzate complessivamente 4 linee basate sulla tecnologia di processo a 28 nm, presentate nella tabella:


L'HD 7800 con la GPU "Pitcairn" utilizza la microarchitettura Graphic Core Next. La serie è stata lanciata nel marzo 2012 e oggi non è più in produzione.

Un tempo le schede video Pitcairn erano piuttosto popolari e mostravano un eccellente rapporto qualità/prezzo. Nel 2018, la serie attuale non è popolare ed è estremamente difficile trovare un dispositivo in condizioni nuove. Nonostante il core grafico sia già obsoleto, se combinato con un potente processore, un PC può eseguire vari giochi con impostazioni medie e alte.

Quali giochi verranno eseguiti sulla serie AMD Radeon HD 7800

Le schede video sono state rilasciate nel 2012, ma possono ancora essere utilizzate sui giocattoli moderni. I test sui giochi AMD Radeon HD 7800 Series sono stati eseguiti con il seguente hardware:

  • Processore: Core I5 ​​6500 3,2 GHz.
  • RAM: 16 GB DDR4 2133 doppia.
  • Disco rigido: Hitachi da 1 TB.
  • Scheda madre: Asus H170M-Plus.
  • Risoluzione: 1920x1080px.

I risultati sono i seguenti:

Nome del gioco

Qualità grafica
Sindacato di Assassin's Creed Alto 31
Tuoni di guerra Cinema (Ultra) 55-65
Rottura quantistica Media 30-42
Assassin's Creed Unità Media 30
Guerriero Ombra 2 Alto 35-45
Luce morente Alto 40-50
Fallout 4 Ultra 38-43
GTA5 Sopra la media 45-50
DESTINO Alto 40
L'ascesa di Tomb Raider Alto 30-40
Warface Alto 90-100
The Witcher 3: Sangue e vino Alto 25-35
Mondo dei carri armati Alto 60-80

Le prestazioni complessive dipendono in gran parte dalla corretta combinazione di processore e scheda video. Se prendi un potente processore di generazione moderna come Ryzen o Core I5, saranno in grado di mostrare FPS elevati nella maggior parte dei giochi moderni, anche con una vecchia scheda video.

Dopo aver analizzato le caratteristiche tecniche e i test nei giochi, arriviamo alle seguenti conclusioni: non è consigliabile acquistare giochi potenti nel 2018, è meglio scegliere modelli più recenti.

Le prestazioni saranno sufficienti per lavorare comodamente a casa e per eseguire giochi multiplayer come CS:GO, World Of Tanks.

Come overclockare una scheda video

Per ottenere le massime prestazioni, puoi overcloccare la AMD Radeon HD 7800. Per fare ciò, dovrai installare il driver e configurarlo.

Le principali modifiche dovranno essere apportate nella sezione “Giochi”. Se utilizzi un driver moderno, i profili possono essere configurati individualmente per ciascun videogioco.

Vai al profilo desiderato e vai all'impostazione "Frame Rate Control". Per impostazione predefinita, la scheda video spreme il massimo FPS e spende tutte le risorse su di essa.

Per un comodo gioco di sparatutto, sono sufficienti 60 fotogrammi al secondo. Per CS:GO, WarFace, WarThunder è sufficiente impostare il limite a 70 FPS.

L'impostazione di OverDrive consente di regolare i parametri operativi: frequenze della GPU e della memoria, efficienza della ventola e livelli di consumo energetico. Questi parametri devono essere configurati individualmente per ogni build di PC.

Scarica i driver per la serie AMD Radeon HD 7800

Per scaricare i driver per la serie Radeon HD 7800, utilizzare il programma di ricerca automatica proprietario. Puoi scaricarlo dal sito ufficiale del produttore. Lì puoi anche trovare i driver per ciascuna versione del sistema operativo: Windows 7, Windows 10, ecc.

Pagina 2 di 5

"Isole del Sud"

Innanzitutto, qualche informazione sull'etichettatura dei suoi ultimi prodotti AMD. Il produttore li ha suddivisi in tre livelli in base alle prestazioni. Il nome in codice "Cape Verde" si riferisce alla Radeon HD 7700. Il nome "Pitcairn" nasconde le attuali Radeon HD 7870 e HD 7850 partecipanti al test. I prodotti ad alte prestazioni si chiamano "Tahiti" o Radeon HD 7900. Questo è mostrato più chiaramente sotto.

  • Livello base = Capo Verde = serie Radeon HD 7700;
  • Principale = Pitcairn = serie Radeon HD 7800;
  • Prodotti ad alte prestazioni = Tahiti = serie Radeon HD 7900.

Cioè, al momento AMD copre tutti i segmenti di mercato con i suoi chip grafici da 28 nm. È previsto solo il rilascio di una scheda video dual-core basata su chip Tahiti. Nome preliminare Radeon HD 7990.

Caratteristiche della serie AMD Radeon HD 7800

Il processore grafico Radeon HD 7800 (Pitcairn) ha circa 2,8 miliardi di transistor e una microarchitettura Graphic Core Next. Come accennato in precedenza, il chip Radeon HD 7850 (Pitcairn Pro) ha 16 unità di calcolo e il suo TDP massimo è di 130 watt. Per la Radeon HD 7870 (Pitcairn XT), questi valori sono rispettivamente 20 e 175.

Nella slide sottostante sono riportate le principali specifiche delle schede video Radeon HD 7850 e HD 7870

2 GB di memoria GDDR5 stanno già diventando lo standard per la maggior parte dei modelli di fascia media e alta. Grazie a 256 bit. bus e un'elevata frequenza di clock di 1200 MHz (4800 MHz effettivi), la larghezza di banda è di 154 GB/s. Ciò avrà un effetto positivo sulle prestazioni nei giochi con alta risoluzione e qualità delle immagini.

Interfaccia PCI Express 3

Nella seconda metà del 2011, quasi tutti i produttori di schede madri hanno introdotto i loro modelli di schede madri con l'interfaccia PCI Express di terza generazione. Con l'uscita della serie Radeon HD 7000 sono apparse anche le schede video con questa interfaccia. PCI Express 3 ha il doppio della larghezza di banda (32 Gb/s) della generazione precedente PCI Express. Rispetto a PCIe 2, la larghezza di banda per corsia è stata raddoppiata da 500 MB/s a 1 GB/s.

Naturalmente, per sfruttare il nuovo PCIe 3, non è necessaria solo una scheda video e una scheda madre con questa interfaccia, ma anche il supporto del processore (non tutti i modelli della famiglia Ivy Bridge supporteranno PCIe 3).

Eyefinity 2.0

AMD è andata oltre nello sviluppo della sua tecnologia Eyefinity, progettata per visualizzare immagini su più monitor. Grazie all'elevata potenza di elaborazione della serie HD 7000 e al supporto per Eyefinity 2.0, è ora possibile visualizzare le immagini su più monitor con una risoluzione totale di 16000 x 16000. Ciò consente di visualizzare le immagini su 5 display con una risoluzione di 2560x1600 installato in orientamento orizzontale. Per lavorare con tali risoluzioni, i modelli più vecchi della famiglia sono dotati di un record di 3 GB di GDDR5 (HD 7970 e HD 7950).

I driver AMD Catalyst supporteranno la risoluzione personalizzata a partire dalle versioni di febbraio. Cioè, puoi impostare la risoluzione richiesta in base alla configurazione dei display in Eyefinity. A partire da Catalyst 12.2, c'è un'opzione per installare il menu Start sul display più conveniente per te e non all'estrema sinistra, come avveniva prima. Inoltre, Eyefinity 2 supporta l'output delle immagini in modalità stereo HD3D. È supportata la combinazione di tre monitor che funzionano in modalità 3D.

Tassellatura migliorata

La famiglia di schede grafiche Radeon HD 7000 di AMD è dotata di un tassellatore di nona generazione e ha riscontrato miglioramenti significativi delle prestazioni durante l'elaborazione della geometria nei giochi moderni. Il core GCN include ancora due motori grafici, ma dove una volta contenevano unità di tassellatura e rasterizzazione, ora sono costituiti da un numero arbitrario di pipeline dedicate alla geometria e all'elaborazione dei pixel.

Le schede video AMD Radeon HD 7800 supportano l'interfaccia HDMI 1.4a, che consente di riprodurre un'immagine a 120 Hz (60 Hz per occhio), che consente di visualizzare immagini 3D. Con le versioni precedenti di HDMI ciò non era possibile. A partire da dicembre, AMD ha consentito a HD3D e Eyefinity di lavorare insieme nei driver.

DirectX11.1

Le schede video della famiglia Radeon 7000 supporteranno il futuro DirectX 11.1. È troppo presto per dire cosa porterà in pratica, dato che DX 11.1 verrà rilasciato insieme a Windows 8. I principali vantaggi della nuova API sono descritti come segue:

  • Rasterizzazione indipendente;
  • Combinazione flessibile di elaborazione grafica ed elaborazione video;
  • Supporto 3D stereo nativo.

Decodificatore video unificato AMD

È una parte hardware delle GPU AMD responsabile della decodifica del flusso video. UVF ha ricevuto alcuni miglioramenti nella serie Radeon 7000. In generale, UVD ha mantenuto tutte le funzioni dei suoi predecessori, vale a dire il supporto per H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV profilo D, Multi-View Codec (MVC), Video Codec Engine (VCE), AMD Steady Video 2.0. Aggiunto il supporto per il formato Dual Stream HD+HD.

Su