Spotreba 7970. Video karty

Prejdime k výsledkom merania:

Spotreba energie celého systému v režime nečinnosti, W.

Vďaka optimalizácii procesov a zníženiu napätia pri nečinnosti sa spotreba znížila o takmer tri watty v porovnaní s prvou verziou Radeonu HD 7970. Tu sme však žiadne prevratné zmeny nečakali. Grafické karty AMD sú dlhodobo úspešné s technológiou ZeroCore Power.

Spotreba energie celého systému pri zaťažení, W.

Pri záťaži Radeon HD 7970 GHz Edition spotrebuje o niečo viac energie ako jeho predchodca. Ako si viete predstaviť, môže za to vyššie takty, keďže AMD chcelo z nových optimalizácií čipov jednoznačne vyžmýkať maximálny výkon. Zvýšenie spotreby energie o šesť wattov však pravdepodobne neovplyvní celkový účet za elektrinu.

Teplota pri nečinnosti, stupne Celzia.

S napätím sme očakávali výsledky teplotného testu. Vzhľadom na nižšie napätie sa dal očakávať pokles teplôt naprázdno. Zmeny sme však, žiaľ, neopravili.

Teplota pri zaťažení, stupne Celzia.

Zaujímavé je, že sme dostali rozdiel medzi dvoma grafickými kartami pri zaťažení. Model Radeon HD 7970 dosahoval 74°C, ale GHz Edition za rovnakých podmienok 72°C. Možno tento potenciál umožnili optimalizácie vykonané počas výroby GPU.

Hladina hluku v kľudovom režime, dB(A).

V kľudovom režime nezískame takmer žiadny rozdiel v hladine hluku. Pretože sú teploty rovnaké, nie je potrebné, aby sa ventilátor točil rýchlejšie alebo pomalšie.

Hladina hluku pri zaťažení, dB(A).

Pri záťaži sa rozdiel v hladine hluku stal výraznejší. „Starý“ Radeon HD 7970 je o viac ako jeden decibel hlasnejší ako edícia GHz. Možno je to spôsobené nižšou teplotou GPU, vďaka čomu sa ventilátor otáča o niečo pomalšie.

Metodika testovania
Nastavenia ovládača AMD Catalyst – predvolené
antialiasing Nastavenia aplikácie
Anizotropné filtrovanie Nastavenia aplikácie
Teselácia Optimalizované AMD
Katalyzátor A.I. Kvalita filtra textúr Kvalita, povoľte optimalizáciu formátu povrchu
Počkajte na V-Sync Zakázať, pokiaľ aplikácia nešpecifikuje
Režim AA Viacvzorkový
Triple buffernig Zakázať
Nastavenia ovládača NVIDIA
GPU CUDA Všetky
Anizotropné filtrovanie Správa aplikácií
Vertikálna synchronizácia Použite nastavenie 3D aplikácie
Tienenie osvetlenia pozadia Vypnuté
Maximálny počet predtrénovaných rámov 3
Optimalizácia streamovania Automat
Režim správy napájania Adaptívny
Vyhladzovanie - gama korekcia Vypnuté
Vyhladzovanie - Režim Ovládanie pomocou aplikácie
Trojité ukladanie do vyrovnávacej pamäte Vypnuté
Zrýchlenie viacerých displejov Výkonný režim s viacerými displejmi
Filtrovanie textúr – anizotropná optimalizácia Vypnuté
Filtrovanie textúr – kvalita kvalita
Filtrovanie textúr – negatívna odchýlka UD Povoliť
Filtrovanie textúr – Trilineárna optimalizácia zapnuté
ProgramAPInastavenieTestovacie režimyPovolenie
3D Mark Vantage DirectX 10 Profily Výkon, vysoký, extrémny
3D značka 11 DirectX 11 Výkonnosť profilov, extrémna
Unigine Heaven 2 DirectX 11 Maximálne detaily, DirectX 11, teselácia v režime Extreme Bez AA a AF / AA 4x, AF 16x 1920x1080 / 2560x1440
Crysis 2 + Adrenaline Crysis 2 Benchmark Tool DirectX 11 Downtown/Adrenalínová mapa. Max. detaily, textúry vo vysokom rozlíšení, DirectX 11 Hrana AA 1920x1080 / 2560x1440
Nástroj na porovnávanie Far Cry 2 + Far Cry 2 DirectX 10 Malá mapa ranča. Max. detailovanie Bez AA / AA 4x 1920x1080 / 2560x1440
Metro 2033 + Metro 2033 Benchmark DirectX 11 Maximálne detaily, DirectX 11, DOF, teselácia, vypnutá NVIDIA PhysX Analytické AA, AF 4x / MSAA 4x, AF 16x 1920x1080 / 2560x1440
Mimozemšťania verzus Predátor + Alien vs Predator Benchmark Tool DirectX 11 Maximálne detaily, DirectX 11 Bez AA a AF / AA 4x, AF 16x 1920x1080 / 2560x1440
DiRT 3 DirectX 11 Maximálny detail Bez AA a AF / AA 4x, AF 16x 1920x1080 / 2560x1440
mafia 2 DirectX 11 Maximálne detaily, vypnutá NVIDIA PhysX. Bez AA, AF 1x / AA zapnuté, AF 16x 1920x1080 / 2560x1440
Just Cause 2 DirectX 10 Maximálny detail, Bokeh Filter vypnutý, Enhanced Water Detail vypnutý Bez AA, AF 2x / AA 4x, AF 16x 1920x1080 / 2560x1440

Nasledujúce grafické karty sa zúčastnili testovania ako rivali Radeonu HD 7970:

  • AMD Radeon HD 6970 (880/5500)
  • Radeon HD 6990 (880/5000)
  • NVIDIA GeForce GTX 580
  • NVIDIA GeForce GTX 590

Pretaktovanie, teplota, spotreba

AMD sľúbilo, že procesor HD 7970 sa bez problémov pretaktuje na 1 GHz a vyššie, čomu sa dá ľahko uveriť, keďže 75 MHz s novou procesnou technológiou nie je až taký veľký úspech. Naša testovacia vzorka však ľahko pridala 200 MHz (!) nad nominálnu frekvenciu GPU a pamäť sa pretaktovala z 5 500 na 6 300 efektívnych MHz, a to všetko bez zvýšenia napätia. Ďalšie pretaktovanie narážalo na obmedzenia funkcie Overdrive a nepodarilo sa ich prekonať pomocou známych trikov s kľúčmi registrov a utilitami na pretaktovanie tretích strán. HD 7970 nedokáže čítať ani BIOS s existujúcim softvérom, takže skutočné rekordy ešte len prídu.

Vyzerá to tak, že Radeon HD 7970 sa skutočne nelíši od HD 6970 z hľadiska TDP. Spotreba energie systému pri záťaži je úplne rovnaká a v 2D režime je HD 6970 ešte žravejší. Pretaktovanie mierne pridalo na spotrebe energie, no výsledok je stále oveľa menší ako u ostatných konkurentov – „dvojhlavých“ HD 6990 a akcelerátorov GeForce.

Navyše sa HD 7970 ukázala ako najchladnejšia karta spomedzi všetkých účastníkov testu. Aj pri maximálnom pretaktovaní sa zahrieva menej ako HD 6970. A keďže spotreba kariet je rovnaká, treba povedať, že vďaka novému systému chladenia. Efekt sa prejaví najmä vtedy, ak znížite frekvenciu procesora HD 7970 na úroveň HD 6970.

Výkon, syntetické benchmarky

  • Radeon HD 7970 prekonáva HD 6970 aj GeForce GTX 580 s obrovským náskokom vo všetkých režimoch. Rýchlejšie fungujú iba „dvojhlavé“ grafické karty.
  • Pretaktovaná HD 7970 je výkonovo porovnateľná s GeForce GTX 590, aj keď HD 6990 je stále vpredu. Ten má vo všeobecnosti extrémne vysoké výsledky, čo opäť vyvoláva otázku správnosti algoritmov, pomocou ktorých 3DMark Vantage počíta body. Nie je to prvýkrát, čo sa v tomto teste stretávame s nevysvetliteľnými artefaktmi.

  • HD 7970 prekonáva všetkých konkurentov okrem HD 6990 aj bez pretaktovania.
  • Pri pretaktovaní sa rozdiel medzi HD 7970 a starou dvojčipovou vlajkovou loďou nebezpečne zmenšuje.

Výkon, herné štandardy

Unigine Heaven 2

  • HD 7970 má kolosálnu, takmer dvojnásobnú výhodu oproti HD 6970. Je vidieť, že AMD odviedlo skvelú prácu na teselácii.
  • Porovnateľný výkon má GeForce GTX 580.
  • Pretaktovaný HD 7970 je na rovnakej úrovni ako HD 6990, ale zaostáva za GTX 590.

Crysis 2

  • Rozdiel medzi výsledkami HD 7970 a HD 6970 je takmer dvojnásobný.
  • HD 7970 je tiež výrazne pred GeForce GTX 580.
  • Bez pretaktovania je HD 7970 výkonovo porovnateľná s HD 6990 a s pretaktovaním sa doťahuje na GeForce GTX 590.

Mimozemšťania vs Predátori

  • HD 7970 má 25% výhodu oproti HD 6970.
  • GeForce GTX 580 v režimoch AA a AF mierne zaostáva za Radeonom HD 6970.
  • Dvojčipové grafické karty sú oproti novinke citeľne rýchlejšie a ani pretaktovanie im to nedovoľuje dobehnúť.

  • HD 6970 si v tomto benchmarku vedie dobre, a preto je výhoda HD 7970 oproti nemu veľká, ale nie drvivá.
  • GeForce GTX 580 môže ľahko konkurovať HD 7970 v rozlíšení 1920 x 1080, ale zaostáva pri rozlíšení 2560 x 1440.
  • Dvojprocesorové grafické karty sú pre HD 7970 mimo dosahu, aj keď sú pretaktované.

Metro 2033

  • HD 7970 je minimálne o tretinu rýchlejší ako HD 6970.
  • GeForce GTX 580 stále vykazuje dobré výsledky a za novinkami nezaostáva.
  • SLI a CrossFire fungujú výborne, takže ani s pretaktovaním ich HD 7970 neprekoná, aj keď sa HD 6990 približuje.

Far Cry 2

  • HD 7970 je o 20-25% rýchlejší ako HD 6970.
  • HD 7970 je tiež výrazne pred GeForce GTX 580.
  • GTX 590 a HD 6990 sú v nedosiahnuteľnej výške pre HD 7970 aj po pretaktovaní.

VLIW4 vs GCN

Nakoniec sme Radeon HD 7970 previedli hernými testami na rovnakých frekvenciách ako Radeon HD 6970. Diagram jasne ukazuje, akú výhodu poskytuje nová architektúra GCN sama o sebe v porovnaní s VLIW4.

zistenia

AMD vytvorilo GPU od nuly, ktoré sa radikálne líši od všetkého, čo bolo vydané pod značkou Radeon za posledných pár rokov. Rozsahom zmien je udalosť porovnateľná s predstavením unifikovanej shader architektúry VLIW5 v čipe R600 (Radeon HD 2900). Ale ak si spomeniete, akou náročnou cestou musel VLIW5 prejsť, kým sa odhalili možnosti, ktoré sú s ním spojené, je zrejmé, že tentoraz je všetko úplne inak.

Architektúra GCN reprezentovaná čipom Tahiti je už vyspelým a mimoriadne efektívnym produktom. Radeon HD 7970 je o 20 – 50 % rýchlejší ako predchádzajúca generácia jednočipovej vlajkovej lode AMD a ľahko prekonáva svojho hlavného konkurenta GeForce GTX 580. Aj keď je Tahiti obrovský GPU s nebývalou zložitosťou, karta nespotrebováva viac energie ako GeForce GTX 580. ako HD 6970 a má vysoký strop pretaktovania. A pri pretaktovaní sa výkon už blíži úrovni dvojprocesorových adaptérov Radeon HD 6990 a GeForce GTX 590.

Všimnite si, že pozície architektúry Fermi sú stále silné v úlohách s aktívnym využívaním možností DirectX 11. V niektorých hrách je GTX 580 len o niečo nižšia ako novinka od AMD, takže NVIDIA má stále všetky šance na odplatu najbližšie rok. Rovnako zaujímavé bude sledovať, ako AMD postupne približuje GPU k procesorom na všeobecné použitie. CUDA od NVIDIA má v priebehu rokov veľký náskok, no teraz má AMD rovnako výkonnú grafickú architektúru a procesory Fusion, ktoré skôr či neskôr dostanú aj vstavané jadrá GCN.

Metodika testovania

Nastavenia AMD Catalyst Control Center
antialiasing Použite nastavenia aplikácie
Anizotropné filtrovanie Použite nastavenia aplikácie
Teselácia Použite nastavenia aplikácie
Catalyst A.I., Kvalita filtrovania textúr Kvalita, povoľte optimalizáciu formátu povrchu
Úroveň podrobností mipmapy kvalita
Počkajte na V-Sync vypnuté, pokiaľ aplikácia nešpecifikuje
Režim vyhladzovania Viacnásobná vzorka AA
Nastavenia Direct3D, Povoliť meranie geometrie zapnuté
Triple buffernig Vypnuté
Nastavenia ovládacieho panela NVIDIA
okolitá oklúzia Vypnuté
Anizotropné filtrovanie Riadené aplikáciou
Antialiasing - Gamma korekcia zapnuté
Režim antialiasingu Riadené aplikáciou
Antialiasing - Nastavenia Riadené aplikáciou
Antialiasing – transparentnosť Vypnuté
CUDA-GPU Všetky
Maximálny počet vopred vykreslených snímok 3
Zrýchlenie viacerých displejov/zmiešaných GPU Výkonný režim viacerých zobrazení
režim správy napájania Adaptívny
Filtrovanie textúr — Anizitropická optimalizácia vzoriek Vypnuté
Filtrovanie textúr — záporná odchýlka LOD dovoliť
Filtrovanie textúr – kvalita kvalita
Filtrovanie textúr – Trilineárna optimalizácia zapnuté
Vláknová optimalizácia Automat
Trojité ukladanie do vyrovnávacej pamäte Vypnuté
vertikálna synchronizácia Použite nastavenia 3D aplikácie
Súbor benchmarkov
Program API nastavenie Testovací mód Povolenie
3D Mark 2011 DirectX 11 Výkonnosť profilov, extrémna

Unigine Heaven 2 DirectX 11 Max. kvalita, DirectX 11, teselácia v režime Extreme AF 16x, MSAA 4x 1920x1080 / 2560x1440
Crysis Warhead + Framebuffer Crysis Warhead Benchmarking Tool DirectX 10 Mrazový prelet. Max. nastavenia, DirectX 10. AF 16x, MSAA 4x 1920x1080 / 2560x1440
Metro 2033 + Metro 2033 Benchmark DirectX 11 Max. nastavenia, DirectX 11, DOF, tessellation, NVIDIA PhysX off AF 16x, MSAA 4x 1920x1080 / 2560x1440
DiRT 3 + Adrenaline Racing Benchmark Tool DirectX 11 Aspen, 8 áut. Max. kvalita, DirectX 11 AF, AA 4x 1920x1080 / 2560x1440
Crysis 2 + Adrenaline Crysis 2 Benchmark Tool DirectX 11 centrálny park. Max. kvalita, DirectX 11, textúry s vysokým rozlíšením AF 16x, Post MSAA + Edge AA 1920x1080 / 2560x1440
Battlefield 3 + FRAPS DirectX 11 Začiatok misie Going Hunting. Max. kvalitu AF 16x, MSAA 4x 1920x1080 / 2560x1440
Batman: Arkham City. Vstavaný benchmark DirectX 11 Max. kvalitu AF, MSAA 4x 1920x1080 / 2560x1440
The Elder Scrolls 5: Skyrim + FRAPS DirectX 9 Mesto Whiterun. Max. kvalitu AF 16x, MSAA 4x 1920x1080 / 2560x1440
Call of Duty: Modern Warfare 3 + FRAPS DirectX 9 Mission Return to Sender. Max. kvalitu AF, MSAA 4x 1920x1080 / 2560x1440

Nasledujúce grafické karty sa zúčastnili testovania ako konkurenti Radeon HD 7970 GHz Editon:

  • AMD Radeon HD 7970 (925/5500 MHz, 3 GB)
  • NVIDIA GeForce GTX 680 (1006/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 670 (915/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 590 (607/3414 MHz, 3 GB)
  • AMD Radeon HD 6990 (880/5000 MHz, 4 GB)

Aby boli obaja účastníci dnešnej intrigy, Radeon HD 7970 GHz Edition a GeForce GTX 680, plne vyzbrojení, boli pri testovaní použité najnovšie beta ovládače od NVIDIA (304.48 Beta) a AMD (Catalyst 12.7 Beta). Okrem toho bol pre GTX 680 aktivovaný režim PCI-E 3.0, ktorý platforma Intel X79 oficiálne nepodporuje.

⇡ Pretaktovanie, teplota, spotreba energie

Keďže sa PowerTune na pozorovaných taktovacích frekvenciách neprejavuje, východiskovým bodom pre pretaktovanie sa stala frekvencia Boost Clock 1050 MHz. S napätím GPU veci nie sú také jednoduché. Faktom je, že nastavenie napätia v MSI Afterburner (je možné, že sa to isté deje aj s inými utilitami, neskúšali sme) už nemá žiadny vplyv na pozorované napätie. Ak ju chcete zvýšiť, musíte sa pokúsiť nastaviť vyššiu trvalé napätie pomocou príslušnej možnosti. Ale bez ohľadu na to, aké zvláštne to môže vyzerať, nezastaví to kolísanie napätia, iba posunie pozorované hodnoty nahor. Napätie teda nemôžeme opraviť, ale môžeme posunúť rozsah, v ktorom sa mení. Výsledkom je, že ak manuálne nastavíte napätie na 1,3 V, rozsah oscilácií bude približne 1,227 - 1,252 V.

Treba poznamenať, že v niektorých prípadoch, pri hraní s rôznymi nástrojmi na pretaktovanie a monitorovanie, bolo napätie stále fixované na 1,3 V, ale potom sa Power Tune zjavne zbláznil a na obrazovke sa objavili silné artefakty v 3D bez ohľadu na GPU. frekvencia. Nezdá sa, že by stálo za to pokúšať sa poraziť Power Tune, najmä keď svoju prácu robí tak dobre.

Ak považujeme Boost Clock nového adaptéra za štandardnú frekvenciu GPU v iných Radeonoch (a z hľadiska princípov Power Tune aj je), HD 7970 GHz Edition sa pretaktovala ešte lepšie ako bežný HD 7970: až 1240 MHz pre procesor a 7320 (1830) MHz z pamäte. Ak od 1240 MHz odpočítame rozsah 50 MHz Power Tune Boost, dostaneme frekvenciu, ktorú dosahujú mnohé inštancie štandardného HD 7970. Zdá sa, že dlhšia tabuľka frekvencií umožňuje pretaktovanému GPU dosiahnuť vyššie špičkové hodnoty, pričom sa vrátime k predchádzajúcemu nižší prah pri ťažkých úlohách. Nie je však pravdou, že karta skutočne niekedy dosahuje týchto 1240 MHz a nie je neustále v škrtení. Kým monitorovacie nástroje nezískajú prístup k vnútornostiam Power Tune, zostane to záhadou.

Fantastické pretaktovanie pamäte je však jednoducho zásluhou vynikajúcich ovládačov čipu Tahiti a pamäťových čipov, zjavne o niečo lepších ako tie, ktoré sú vybavené štandardným HD 7970.

HD 7970 GHz Edition sa zahrieva o niečo viac ako štandardná verzia - približne rovnako ako GeForce GTX 680. Chladiaci systém zapnutý na plné obrátky umožňuje udržiavať rovnaké teploty pri silnom pretaktovaní ako v bežnom režime, ale len za cenu kolosálneho hluku. Priznávame, že aj s automatickým ovládaním ventilátora vydáva HD 7970 GHz Edition oveľa viac hluku ako GeForce GTX 680.

Maximálna zaznamenaná spotreba karty sa podľa očakávania stále mierne zvýšila v porovnaní s bežnou HD 7970. Nemyslíme si, že AMD klame, keď tvrdí, že TDP oboch verzií HD 7970 je rovnaké. Zdá sa, že HD 7970 GHz Edition to jednoducho zvláda aktívnejšie. Pri pretaktovaní samozrejme spotreba vystrelí k stropu. Výkonný zdroj nebude rušiť.

⇡ Radeon HD 7970 GHz Edition vs GeForce GTX 680

Toto sú výsledky, pre ktoré sa všetko začalo. Podarilo sa teda AMD opäť získať stratené vedenie?

GeForce GTX 680 bez pretaktovania si stále vedie lepšie ako HD 7970, no spomedzi pretaktovaných kariet Radeon je rýchlejšia.

Hranietesty+ Unigine Heaven

S rozlíšením 1920 x 1080 v troch z deviatich herných benchmarkov (Crysis Warhead, DiRT 3, Metro 2033) je Radeon HD 7970 GHz Edition popredu. V ďalších troch vyhráva GeForce GTX 680 (Unigine Heaven 2, Battlefield 3, Skyrim). V ostatných hrách nie sú medzi súpermi výrazné rozdiely. Perfektná kresba. V režime 2560x1440 situácia prevažuje v prospech HD 7970. Iba v CoD 3 a Unigine Heaven si GTX 680 zachováva svoju prevahu.

Pretaktovanie je lepšie pre kartu AMD ako pre GTX 680: nárast výkonu je citeľne vyšší a výsledkom je, že HD 7970 GHz Edition sa vypomstí aj pri rozlíšení 1920 x 1080.

⇡ Radeon HD 7970 GHz Edition proti všetkým

  • Pre AMD je to nešťastné, ale v 3DMark 2011 je Radeon HD 7970 GHz Edition horšia nielen ako GeForce GTX 680, ale aj ako GTX 670.
  • Výhoda GHz Edition oproti štandardnej verzii je citeľná.

Unigine Heaven 2

  • Vydanie GHz pridalo niekoľko snímok za sekundu oproti bežnému HD 7970.
  • Pri 2560x1440 majú GeForce GTX 670 a GTX 680 minimálnu výhodu, no pri 1920x1080 HD 7970 GHz Edition citeľne zaostáva.
  • Pretaktovaná edícia GHz poráža Radeon HD 6990 a porovnáva sa s GTX 670 a GTZ 680.

Crysis Warhead (DirectX 10)

  • V tomto teste dokonca bežná HD 7970 ľahko porazí GeForce GTX 680 vďaka vyššej šírke pásma pamäte.
  • Edícia HD 7970 GHz je ešte o niečo horšia ako GeForce GTX 590 a pretaktovaná edícia GHz je na rovnakej úrovni ako Radeon HD 6990.

Metro 2033 (DirectX 11)

  • Výhoda HD 7970 GHz Edition oproti bežnej verzii je malá.
  • Edícia HD 7970 GHz je výrazne rýchlejšia ako GeForce GTX 680.
  • Po pretaktovaní sa GHz Edition dostáva na úroveň GeForce GTX 590 a Radeon HD 6990.

DiRT 3 (DirectX 11)

  • Edícia HD 7970 GHz je oveľa lepšia ako štandardná verzia.
  • GHz Edition je tiež výrazne rýchlejšia ako GTX 680, výkonovo porovnateľná s Radeonom HD 6990 a GeForce GTX 590.

Crysis 2 (DirectX 11)

  • V režime 2560x1440 je oproti bežnému HD 7970 citeľný nárast výkonu.
  • S rozlíšením 2560 x 1440 má HD 7970 GHz Edition náskok aj pred GeForce GTX 680 a pretaktovaná karta nechala GTX 590 za sebou a dotiahla Radeon HD 6990.
  • V režime 1920 x 1080 účastníci testu dosiahli limit 100 FPS stanovený v Crysis 2.

Battlefield 3 (DirectX 11)

  • Opäť platí, že edícia HD 7970 GHz má v porovnaní so štandardným HD 7970 výrazné zvýšenie FPS.
  • Novinka je približne na úrovni GTX 670 a GTX 680.
  • Pretaktovaná edícia HD 7970 GHz je príliš náročná aj na GTX 590.

Batman: Arkham City (DirectX 11)

  • Magická fráza GHz Edition opäť dáva HD 7970 pekný nárast FPS.
  • V rozlíšení 1920x1080 sa karta vyrovná GTX 680 a pri rozlíšení 2560x1440 ju prekonáva.

The Elder Scrolls 5: Skyrim (DirectX 9)

  • Medzi HD 7970, HD 7970 GHz Edition a GeForce GTX 680 v tejto hre nie je podstatný rozdiel: po určitom limite už Skyrim engine nedokáže využívať ďalší výpočtový výkon.

Call of Duty: Modern Warfare 3 (DirectX 9)

  • V porovnaní so sériovou verziou HD 7970 má edícia GHz veľký nárast snímkovej frekvencie.
  • Napriek tomu je pre novinku rovnocenným súperom iba GeForce GTX 670, nie GTX 680.

⇡ Závery

Pre AMD po prvýkrát od minulých čias Radeon X1950 XTX nastal moment, kedy je špičková grafická karta minimálne taká dobrá ako vlajková loď NVIDIA rovnakej generácie. Edícia HD 7970 GHz je dokonca o niečo rýchlejšia ako GeForce GTX 680 v náročných grafických režimoch (napríklad 2560 x 1440) celkovo vďaka 384-bitovej pamäťovej zbernici. Navyše po továrenskom pretaktovaní má stále značnú rezervu frekvencií. Aktualizovaná technológia Power Tune má priaznivý vplyv na potenciál pretaktovania GPU a pamäť sa začala pretaktovať oveľa lepšie. V budúcich kartách od NVIDIA aj AMD určite uvidíme prekvitajúce technológie riadenia dynamickej frekvencie a napätia, ako sa to už stalo v prípade CPU.

V skutočnosti je HD 7970 v originálnej verzii veľmi výkonná karta a väčšina kópií bez problémov dosiahne také frekvencie, na ktorých dobehnete a predbehnete GeForce GTX 680. GHz Edition je väčšinou módny produkt pre majiteľa aj výrobcu. AMD pretaktovalo HD 7970 len toľko, aby sa vyrovnalo GTX 680 a stále zostalo na rovnakom TDP. Naše testy spotreby energie jasne ukazujú, čo by sa stalo, keby si vývojári stanovili za cieľ bezpodmienečné víťazstvo nad vlajkovou loďou NVIDIA.

Bohužiaľ, AMD už stratilo špeciálnu výhodu oproti NVIDIA kartám v segmente High-End, ktorej sa v posledných rokoch tešilo – spotrebu energie. Ak predchádzajúce špičkové Radeony nedokázali poraziť GeForce GTX 480 a GTX 580 z hľadiska výkonu, ale spotrebovali a zahrievali oveľa menej, teraz je v benchmarkoch remíza, ale TDP Radeon HD 7970 GHz Edition je toľko o 55 W vyšší ako má GTX 680.

A ešte jedna otázka. Existencia dvoch fyzicky identických kariet s rôznym softvérom v rade Radeon už vyzerá škaredo. Za čo platia kupujúci edície HD 7970 GHz, ak takmer to isté možno dosiahnuť jednoduchým pretaktovaním štandardnej HD 7970 a prečo majitelia tej druhej nedostali nový firmvér? Keďže BIOS grafickej karty nie je možné aktualizovať tak ľahko ako ovládače, bolo by lepšie, keby edícia HD 7970 GHz úplne nahradila svojho predchodcu. No čisto z pohľadu harmónie sveta.

  • 2. časť - Praktické zoznámenie
  • Časť 3 – Výsledky herných testov (výkon)

V tejto časti, ako obvykle, budeme študovať samotnú grafickú kartu a oboznámime sa s výsledkami syntetických testov.

zaplatiť

  • GPU: Radeon HD 7970 (Tahiti)
  • Rozhranie: PCI Express x16
  • Prevádzková frekvencia GPU (ROPs): 925 MHz (nominálny 925 MHz)
  • Frekvencia pamäte (fyzická (efektívna)): 1375 (5500) MHz (nominálna - 1375 (5500) MHz)
  • Šírka zbernice výmeny pamäte: 384 bit
  • Počet výpočtových jednotiek v GPU / frekvencia blokov: 32/925 MHz (32/925 MHz nominálne)
  • Počet operácií (ALU) v bloku: 64
  • Celkový počet operácií (ALU): 2048
  • Počet jednotiek textúry: 128 (BLF/TLF/ANIS)
  • Počet rasterizačných blokov (ROP): 32
  • Rozmery: 285×100×33 mm (posledná hodnota je maximálna hrúbka grafickej karty)
  • Farba textolitu:červená
  • Spotreba energie (špičkový 3D/2D/spánok): 215/70/3 W
  • Výstupné konektory: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
  • Podpora pre multiprocessing: CrossFire X (hardvér)

AMD Radeon HD 7970 3072 MB 384-bit GDDR5 PCI-E

Karta má 3072 MB GDDR5 SDRAM umiestnenú v 12 čipoch na prednej strane PCB.

Pri absencii vlastných syntetických testov DirectX 11 sme opäť použili príklady zo súprav Microsoft a AMD SDK a ukážku Nvidia. Prvým je HDRToneMappingCS11.exe a NBodyGravityCS11.exe z DirectX SDK (február 2010) .

Vzali sme aj aplikácie od oboch výrobcov: Nvidia a AMD. PodrobnostiTessellation11 a PNTriangles11 boli prevzaté z ATI Radeon SDK (sú tiež v DirectX SDK). Dodatočne bol použitý demo program Nvidie - Realistic Water Terrain, tiež známy ako Island11 (autor - Timofey Cheblokov, známy špecialista na 3D grafiku).

Syntetické testy boli vykonané na nasledujúcich grafických kartách:

  • Radeon HD 7970 HD 7970)
  • Radeon HD 6990 so štandardnými parametrami (ďalej). HD 6990)
  • Radeon HD 6970 so štandardnými parametrami (ďalej). HD 6970)
  • Radeon HD 5870 so štandardnými parametrami (ďalej). HD 5870)
  • Geforce GTX 590 so štandardnými parametrami (ďalej). GTX 590)
  • Geforce GTX 580 so štandardnými parametrami (ďalej). GTX 580)

Pre porovnanie výsledkov najnovšej grafickej karty Radeon HD 7970 boli tieto modely zvolené z rôznych dôvodov. Radeon HD 6970 bol braný ako priamy predchodca top segmentu, HD 6990 bol braný ako najsilnejšie (aj keď dvojčipové) riešenie na GPU predchádzajúcej architektúry, pridali sme HD 5870 na vyhodnotenie zisku medzi dvoma rôznymi aktualizácie architektúry a ako GPU presne o polovicu zložitejšie ako Tahiti.

Vybrané riešenia Nvidia sú prevzaté, pretože Geforce GTX 580 je najrýchlejší jednočipový model spoločnosti založený na najnovšej generácii GPU. Cenovo síce nejde o konkurenta prezentovanej grafickej karty AMD, no jej výsledky sú zaujímavé ako maximum pre súčasné jednočipové riešenia od Nvidie. A dvojčipová GTX 590 je extrémny variant spoločnosti s vyššou cenou. V testoch DirectX 11 sme použili aj Geforce GTX 560 Ti, ktorý je potrebný na vyhodnotenie zvýšeného geometrického výkonu nového AMD GPU.

Direct3D 9: Testy plnenia pixelov

Tento test určuje maximálny výkon vzorkovania textúry (texel rate) v režime FFP pre rôzny počet textúr aplikovaných na pixel:

V našom zastaranom teste 32-bitového filtrovania textúr od RightMark väčšina grafických kariet zobrazuje čísla, ktoré nie sú ani zďaleka teoreticky možné. Výsledky syntetiky textúr v prípade grafickej karty Radeon HD 7970 teda nedosiahli špičkovú hodnotu, preto sa ešte raz pozrieme na rýchlosť textúrovania podľa čísel z testu 3DMark Vantage, v ktorom sa vždy získajú reálnejšie čísla.

V našom prípade sa ukázalo, že HD 7970 vyberá z 32-bitových textúr s bilineárnym filtrovaním len do 80 texelov na takt, čo je oveľa menej ako teoretický údaj 128 filtrovaných texelov. V opačnom prípade sa všetko ukázalo predvídateľne - všetky dosky AMD vykazovali vyšší výkon a sú pred grafickými kartami Nvidia. Veď aj špičková jednočipová Geforce GTX 580 má len 64 TMU a je teda oveľa nižšia ako model založený na čipe Tahiti, ktorý má 128 TMU pracujúcich na vyššej frekvencii. Preto je rozdiel viac ako dvojnásobný. No a dvojčipová GTX 590 v tomto teste ukazuje jednoznačne neadekvátny výsledok.

Dual-GPU verzia od AMD tiež evidentne v našom teste nefunguje korektne, pretože HD 7970 takmer vždy prekoná aj tú. No a nový model predbehol svojho predchodcu asi o 30%, čo je o niečo horšie ako teoreticky možné hodnoty. V prípadoch s malým počtom textúr, kedy je najviac ovplyvnená šírka pásma pamäte, je však výsledok ešte nižší – asi 25 %.

Zvážte rovnaké výsledky v teste naplnenia:

Čísla ukazujú mieru plnenia a v nich vidíme všetko rovnaké, až na to, že berieme do úvahy počet pixelov zapísaných do vyrovnávacej pamäte snímok. Maximálny výsledok takmer vždy dosiahne nová špičková grafická karta z rodiny Radeon HD 7900. Má rekordný počet TMU bežiacich na vyššej frekvencii a efektívnejších v našom syntetickom teste. Prejdime k textom jednoduchých pixel shaderov.

Direct3D 9: benchmarky Pixel Shaders

Prvá skupina pixel shaderov, o ktorých uvažujeme, je veľmi jednoduchá pre moderné video čipy, zahŕňa rôzne verzie pixelových programov relatívne nízkej zložitosti: 1.1, 1.4 a 2.0, ktoré sa nachádzajú v starých hrách.

Tieto testy sú príliš jednoduché pre moderné GPU a sú väčšinou obmedzené výkonom textúrovania a niekedy aj rýchlosťou plnenia. Neukazujú teda všetky schopnosti moderných videočipov, no sú zaujímavé z pohľadu zastaraných herných aplikácií. V dvoch najjednoduchších testoch nový Radeon HD 7970 takmer predbehol aj dvojčipový HD 6990, no v ťažších testoch zaujal pozíciu medzi HD 6990 a HD 6970. Je zaujímavé, ako sa líšia testy na GPU rôznych architektúr. A tu má Tahiti o niečo bližšie k GF110 ako k predchodcovi. Prirodzene, nie v absolútnom vyjadrení, rozdiel v nich je veľmi veľký - od jeden a pol až po dva krát.

Výkon v iných testoch je väčšinou limitovaný rýchlosťou textúrovej jednotky a mierou plnenia, takže nový Radeon HD 7970 je približne o 30-40% rýchlejší ako predchádzajúci HD 6970, čo je v súlade s teóriou. Všetky dosky AMD sú pred oboma špičkovými modelmi Geforce, až na to, že v porovnaní HD 5870 a GTX 590 nie je všetko také jasné. Za neúspechy Nvidie v týchto testoch jednoznačne môže nedostatočná rýchlosť textúrovania. Ale aj Phong trojsvetlý pixel shader, ktorý je viac závislý na matematickom výkone GPU, keď je uvedený na trh na GF110, je oveľa horší ako Cayman a ešte viac ako Tahiti.

Pozrime sa na výsledky zložitejších pixelových programov stredných verzií:

A tentoraz to dopadlo približne rovnako, HD 7970 sa nachádza približne medzi jednočipovým a dvojčipovým modelom na báze Cayman zo série HD 6900. Cook-Torrance test je výpočtovo náročnejší a rozdiel v ňom približne zodpovedá rozdielu v počte ALU a ich frekvencii. Preto je tento test vhodnejší pre architektúru AMD, ktorej čipy majú väčší počet matematických jednotiek a výnimkou nie je ani Tahiti.

Zaujímavosťou je, že HD 5870 v tomto teste prekonáva HD 6970 a zdá sa, že sa tak stalo pre slabší výkon tohto shadera na novšom čipe s architektúrou VLIW4. Takže aj keď nový Radeon HD 7970 prekonal HD 6970, v tomto teste bol iba o 20 % rýchlejší ako HD 5870.

Druhý test procedurálneho vykresľovania vody „Water“, ktorý je viac závislý na rýchlosti textúrovania, využíva závislé vzorkovanie z textúr veľkých úrovní vnorenia a grafické karty sú zoradené podľa rýchlosti textúrovania upravenej pre rôznu efektivitu využitia TMU. V tomto teste si AMD riešenia vždy počínajú dobre a HD 7970 poskytuje veľmi dobrý výsledok, síce horší ako dvojčipový HD 6990, ale oveľa lepší ako jeho predchodca na Caymane. Špičková jednočipová doska Nvidia je viac ako 2,5-krát pozadu!

Direct3D 9: Testy Pixel Shaders 2.0

Tieto testy DirectX 9 pixel shaderov sú komplexnejšie ako tie predchádzajúce, blížia sa tomu, čo momentálne vidíme v multiplatformových hrách, a spadajú do dvoch kategórií. Začnime s jednoduchšou verziou shaderov 2.0:

  • Mapovanie paralaxy- metóda mapovania textúr známa z väčšiny moderných hier, podrobne popísaná v článku.
  • Zamrznuté sklo— komplexná procesná štruktúra mrazeného skla s kontrolovanými parametrami.

Existujú dva varianty týchto shaderov: jeden so zameraním na matematické výpočty a druhý s preferenciou načítania hodnôt z textúr. Zvážte matematicky náročné možnosti, ktoré sú sľubnejšie z hľadiska budúcich aplikácií:

Ide o univerzálne testy, ktoré závisia tak od rýchlosti ALU, ako aj od rýchlosti textúrovania, zameriavajú sa na celkovú vyváženosť čipu, ako aj efektivitu vykonávania zložitých programov. A výkon novej grafickej karty AMD v teste Frozen Glass bol nielen dobrý, ale aj vynikajúci! To znamená zvýšená účinnosť nového GPU. V prvom teste sa Radeon HD 7970 ukázal byť citeľne rýchlejší dokonca ako dvojčipový HD 6990. A dokonca aj dvojčipová doska Nvidia bola ďaleko pozadu, nehovoriac o Geforce GTX 580.

Tu, v druhom teste Parallax Mapping, sa riešenia Nvidia cítia o niečo lepšie a GTX 580 takmer dosahuje HD 6970. Dnes predstavený HD 7970 je však veľmi ďaleko - nové AMD predbehlo najlepšiu dosku Nvidia o 80 % , čo jasne naznačuje vplyv a matematické výpočty a rýchlosť textúrovania. Zaujímavé je, že veľmi starý HD 5870 je opäť rýchlejší ako HD 6970. A nový HD 7970 je o 60 % rýchlejší ako jeho predchodca, čo zjavne nie je ospravedlniteľné suchými teoretickými údajmi. Tu sa prejavila výrazne vyššia účinnosť skalárnej architektúry v porovnaní s VLIW.

V prípade grafických kariet AMD je však všetko veľmi ťažké kvôli PowerTune. Koniec koncov, syntetické testy silne „zaťažujú“ GPU výpočtami a spotreba energie dosiek s podporou PowerTune v syntetike môže výrazne prekročiť stanovený limit. V dôsledku toho sa môže znížiť aj rýchlosť GPU a spolu s tým sa výsledky zobrazia nižšie, ako sa očakávalo. Zoberme si rovnaké testy v modifikácii s preferenciou vzoriek z textúr na matematické výpočty:

Pre obe grafické karty Nvidia je situácia ešte smutnejšia, pretože všetky moderné čipy AMD sú oveľa lepšie s rýchlosťou textúrovania a v týchto testoch len zvyšujú svoju nespornú výhodu. Dokonca ani dvojčipová GTX 590 nemôže konkurovať jednočipovej HD 6970 v oboch testoch zameraných na textúrovanie, nehovoriac o GTX 580. Dnešná Radeon HD 7900 je najrýchlejšia jednočipová karta na svete, len pozadu HD 6990. Rozdiel medzi HD 7970 a HD 6970 sa ukázal byť rovných 26-28%, čo je teoreticky dobre vysvetlené, keďže rozdiel v rýchlosti textúrovania novinky je o niečo vyšší.

Boli to však zastarané úlohy, väčšinou s dôrazom na textúrovanie a niekedy na fillrate. Ďalej sa pozrieme na výsledky dvoch ďalších testov pixel shader – ale teraz je to verzia 3.0, najťažší z našich testov pixel shader Direct3D 9 API. Sú najodhaľujúce z hľadiska moderných počítačových hier, z ktorých mnohé sú multiplatformové. Testy sa líšia v tom, že silne zaťažujú ALU aj textúrne jednotky, oba shader programy sú zložité a dlhé a zahŕňajú veľké množstvo vetiev:

  • Strmé mapovanie paralaxy— oveľa „ťažší“ druh techniky mapovania paralaxy, opísaný aj v článku Moderná terminológia 3D grafiky.
  • Kožušina- procedurálny shader, ktorý vykresľuje kožušinu.

V najťažších testoch DX9 od RightMark si grafické karty Nvidia vždy vedú veľmi dobre, na rozdiel od všetkých predchádzajúcich testov v našej recenzii. Tieto testy nie sú obmedzené výkonom načítania textúr, ale závisia skôr od efektívnosti vykonávania shader kódu. A skôr Radeon HD 6970 jasne zlepšil pozíciu AMD v tomto teste a zvýšil efektivitu pri prechode z architektúry VLIW5 na VLIW4.

No a dnes sme videli ďalší skok vo výkone firemných riešení, Radeon HD 7970 ich zdvihol na nedosiahnuteľnú úroveň - nová jednočipová grafická karta prekonala dokonca aj dvojčipovú HD 6990 v oboch testoch! Tieto úlohy sú skvelým príkladom toho, ako sa reálny výkon komplexných výpočtov zlepšuje pri prechode z VLIW na skalárne vykonávanie.

V testoch komplexných pixel shaderov verzie 3.0 teda nová špičková grafická karta AMD dokázala nielen dobehnúť svojich konkurentov, ale aj výrazne prekonať, čo sa veľmi dlho nedialo. Rýchlosť v oboch testoch PS 3.0 je slabo závislá od šírky pásma pamäte a textúrovania, no kód je zložitý, s čím si architektúra Nvidia aj najnovšia skalárna architektúra AMD veľmi dobre poradia. Tieto testy patria medzi prvé, kde zaznamenávame jasné zlepšenie efektivity a najväčší pozitívny rozdiel medzi predchádzajúcou a najnovšou architektúrou AMD z hľadiska rýchlosti.

Ale dajme čísla, aby sme neboli neopodstatnené. Predstavený nový Radeon HD 7970 je viac ako dvakrát rýchlejší ako jeho predchodca a o 60-70% rýchlejší ako Geforce GTX 580, na čo by sme sa ešte nedávno ani neodvážili pomyslieť. Napokon, riešenia Nvidia boli vždy nepopierateľnými lídrami v tejto dvojici testovacích úloh, ale grafické karty založené na Cayman sa k nim dokázali priblížiť a najrýchlejšie Tahiti napokon prekonalo svojho konkurenta.

Direct3D 10: PS 4.0 testy shaderov pixelov (textúrovanie, slučkovanie)

Druhá verzia RightMark3D obsahovala dva známe testy PS 3.0 pod Direct3D 9, ktoré boli prepísané pre DirectX 10, ako aj ďalšie dva nové testy. Prvý pár pridal možnosť povoliť self-shadowing a shader supersampling, čo dodatočne zvyšuje zaťaženie video čipov.

Tieto testy merajú výkon cyklických pixel shaderov s veľkým počtom vzoriek textúr (až niekoľko stoviek vzoriek na pixel v najťažšom režime) a relatívne malým zaťažením ALU. Inými slovami, merajú rýchlosť načítania textúr a efektivitu vetvenia v pixel shaderi.

Prvým testom pixel shaderov bude Fur. Pri najnižšom nastavení používa 15 až 30 vzoriek textúr z výškovej mapy a dve vzorky z hlavnej textúry. Detail efektu - režim "High" zvyšuje počet vzoriek na 40-80, zahrnutie supersamplingu "shader" - až 60-120 vzoriek a režim "High" spolu s SSAA sa vyznačuje maximálnou "závažnosťou" - od 160 do 320 vzoriek z výškovej mapy.

Najprv si skontrolujme režimy bez zapnutého supervzorkovania, sú pomerne jednoduché a pomer výsledkov v režime „Nízka“ a „Vysoká“ by mala byť približne rovnaká.

Výkon v tomto teste závisí od počtu a účinnosti TMU a od účinnosti vykonávania zložitých programov. Vo variante bez supervzorkovania má efektívna rýchlosť plnenia (výkon ROP) a šírka pásma pamäte dodatočný vplyv na výkon. Výsledky s úrovňou detailov „Vysoká“ sú asi jedenapolkrát nižšie ako s „Nízkou“, ako by to teoreticky malo byť, ale pri najrýchlejších riešeniach je rozdiel o niečo nižší.

Predtým pri testoch procedurálneho vykresľovania kožušiny s veľkým počtom načítaní textúr boli riešenia Nvidie výrazne silnejšie, ale počnúc predchádzajúcou generáciou AMD sa rozdiel začal zmenšovať. Čo sa stalo s Radeonom HD 7970? Vynikajúci výsledok – nové AMD je opäť rýchlejšie ako dvojčipová doska predchádzajúcej generácie a jednočipová HD 6970 je dvojnásobne pozadu, čo jasne naznačuje zvýšenie efektivity novej architektúry Južných ostrovov. Áno, a riešenia Nvidie sú pozadu, dokonca aj dvojčipová GTX 590 je nižšia ako dnes predstavený špičkový model Radeon HD 7970.

Pozrime sa na výsledok toho istého testu, ale so zapnutým „shaderovým“ supervzorkovaním, ktoré zoštvornásobí prácu: možno sa v takejto situácii niečo zmení a šírka pásma pamäte s fillrate bude mať menší vplyv:

Povolenie supervzorkovania štvornásobne zvyšuje teoretickú záťaž a riešenia od Nvidie sú vždy podpriemerné v porovnaní s grafickými kartami AMD. Teraz je rozdiel v efektivite tejto úlohy ešte zreteľnejší a nový HD 7970 je 2,5-krát rýchlejší ako HD 6970! Približne o rovnakú sumu prišla novinka aj Geforce GTX 580. Je celkom prirodzené, že aj HD 6990 zostala ďaleko pozadu a nová doska si upevnila prvenstvo, ale čo ...

Druhý test shadera DX10 meria výkon pri vykonávaní komplexných cyklických pixel shaderov s veľkým počtom načítaní textúr a nazýva sa Steep Parallax Mapping. Pri nízkych nastaveniach používa 10 až 50 vzoriek textúr z výškovej mapy a tri vzorky z hlavných textúr. Keď zapnete ťažký režim s vlastným tieňovaním, počet vzoriek sa zdvojnásobí a supervzorkovanie toto číslo zoštvornásobí. Najkomplexnejší testovací režim so supervzorkovaním a vlastným tieňovaním vyberá od 80 do 400 hodnôt textúr, teda osemkrát viac ako jednoduchý režim. Najprv skontrolujeme jednoduché možnosti bez supervzorkovania:

Druhý test Direct3D 10 pixel shader je z praktického hľadiska o niečo zaujímavejší, pretože rôzne druhy mapovania paralaxy sú široko používané v hrách a ťažké varianty, ako je naše strmé mapovanie paralaxy, sa používajú v mnohých projektoch, napríklad v Crysis a Lost Planet hry. V našom teste si navyše môžete okrem supersamplingu zapnúť aj self-shadowing, ktorý približne zdvojnásobí záťaž videočipu, tento režim sa nazýva „High“.

Tento graf je podobný predchádzajúcemu bez zahrnutia SSAA, no pozícia Nvidie sa oslabila o niečo viac a Radeon HD 6990 takmer dobehol dnes predstavený model. V aktualizovanej verzii testu D3D10 bez supervzorkovania vykazuje HD 7970 výborný výsledok, výrazne prekonáva HD 6970 aj GTX 580 a dokonca aj GTX 590. viac než krát pomalšie ako nový model) zaostávajú. Uvidíme, čo zmení zaradenie supersamplingu, môže spôsobiť veľký prepad výkonu na doskách Nvidie.

Keď je povolené supersampling a self-shadowing, úloha sa stáva ešte zložitejšou, kombinované zahrnutie dvoch možností naraz zvyšuje zaťaženie kariet takmer osemkrát, čo spôsobuje veľký pokles výkonu. Rozdiel medzi ukazovateľmi rýchlosti testovaných grafických kariet sa zmenil, zahrnutie supervzorkovania má vplyv ako v predchádzajúcom prípade - karty AMD zlepšili svoj výkon v porovnaní s riešeniami Nvidia.

A teraz je Radeon HD 7970 opäť jediným lídrom v porovnaní, ktorý vykazuje vyššie výsledky ako HD 6990. Staršie jednočipové základné dosky tejto spoločnosti sú ďaleko pozadu spolu s Geforce GTX 580. A len drahšie možnosti s dvomi čipmi od AMD a Nvidia sú schopné aspoň niektorých potom pristupovať k čerstvej grafickej karte. Vo všeobecnosti môžeme podľa dvoch testov shaderov D3D10 skonštatovať, že nová architektúra AMD a jej zástupca na čipe Tahiti dokonale zvláda „shaderové“ úlohy, dokonca lepšie ako tradične silní konkurenti od Nvidie.

Direct3D 10: PS 4.0 Pixel Shader Benchmarks (výpočet)

Ďalších pár testov pixel shader obsahuje minimálny počet načítaní textúr, aby sa znížil vplyv výkonu TMU. Používajú veľké množstvo aritmetických operácií a merajú presne matematický výkon video čipov, rýchlosť vykonávania aritmetických pokynov v pixel shaderi.

Prvý test z matematiky je Minerál. Ide o komplexný procedurálny test textúrovania, ktorý používa iba dve vzorky údajov o textúre a 65 inštrukcií sin a cos.

Výsledky extrémnych matematických testov zvyčajne zodpovedajú rozdielom vo frekvenciách a počtoch vykonávacích jednotiek, avšak s určitým vplyvom rôznej účinnosti ich využitia. Všetky najnovšie architektúry AMD majú v takýchto prípadoch drvivú výhodu oproti konkurenčným grafickým kartám Nvidia, čo vysvetľuje výsledky testov, v ktorých sa riešenia AMD opäť ukazujú ako výrazne produktívnejšie.

Riešenia sú umiestnené približne podľa teórie, ale až na výnimky. V praxi boli objavené niektoré nuansy spojené s rôznou účinnosťou. Teoreticky by mala byť GeForce GTX 580 viac ako dvakrát (2,4-krát) pomalšia ako nový model Radeon HD 7970, no v praxi je rozdiel len 80 %, čo je oveľa menej. Áno, a v porovnaní s HD 6970 existujú otázky týkajúce sa optimalizácie novej architektúry a ovládačov pre tento test. S teoretickou výpočtovou výhodou 40% je nová doska AMD iba o 28% rýchlejšia ako predchádzajúca HD 6970 a ešte menšia vzdialenosť medzi ňou a veľmi starou HD 5870 založenou na architektúre VLIW5. Buď je test naozaj vhodnejší pre VLIW (najmä pre VLIW5), alebo za to môžu surové ovládače.

Existuje aj iné vysvetlenie – možno boli výsledky dosiek HD 7970 HD 6970 v tomto teste ovplyvnené technológiou PowerTune, ktorá znížila frekvencie pri dosiahnutí limitu spotreby energie. To všetko sa však pri porovnaní s konkurenciou príliš nemení, pretože aj drahá dvojčipová Geforce GTX 590 sa dostala len na úroveň HD 6970 a HD 5870. A jednočipová GTX 580 je ďaleko pozadu.

Zoberme si druhý test výpočtov shaderov, ktorý sa nazýva Fire. Pre ALU je ťažší a je v ňom len jeden fetch textúry a počet inštrukcií sin a cos sa zdvojnásobil, až na 130. Pozrime sa, čo sa zmenilo so zvyšujúcou sa záťažou:

Vidíme takmer totožné s predchádzajúcim grafom, až na absolútne čísla. Tentoraz zostali všetky GPU približne na rovnakých pozíciách, okrem toho, že grafické karty založené na Cayman a Cypress zmenili miesto - teraz je novší model o niečo rýchlejší, ale nie oveľa. Hoci stále neexistuje striktná zhoda s teoretickými údajmi o špičkovom výkone, ich výsledky sú stále blízke suchej teórii. Rozdiel medzi HD 7990 a HD 6970 sa mierne zväčšil.

Inak sme na grafe nič nové nenašli. Rýchlosť vykresľovania je v tomto teste limitovaná výlučne výkonom shaderových jednotiek a ich efektivitou, a tak sa dvojčipový HD 6990 opäť stal jasným lídrom a dnešná novinka od AMD ho nasleduje so slušným odstupom. Obidve dosky Geforce sú na tom horšie aj so zastaraným modelom z rodiny Radeon HD 5800, tentoraz však výhoda AMD riešení zostáva o niečo menšia ako pri porovnaní teoretických čísel, čo opäť naznačuje horšiu optimalizáciu či vplyv PowerTune.

Direct3D 10: Testy geometrie Shader

V RightMark3D 2.0 sú dva testy rýchlosti shadera geometrie, prvá možnosť sa nazýva "Galaxy", technika je podobná "point sprite" z predchádzajúcich verzií Direct3D. Animuje časticový systém na GPU, geometria shader z každého bodu vytvorí štyri vrcholy, ktoré tvoria časticu. Podobné algoritmy by sa mali široko používať v budúcich hrách DirectX 10.

Zmena vyváženia v testoch geometry shader nemá vplyv na konečný výsledok vykresľovania, výsledný obrázok je vždy úplne rovnaký, menia sa len spôsoby spracovania scény. Parameter „GS load“ určuje, v akom shaderi sa výpočty vykonávajú – vo vrchole alebo geometrii. Počet výpočtov je vždy rovnaký.

Uvažujme o prvej verzii testu „Galaxy“ s výpočtami vo vrcholovom shaderi pre tri úrovne geometrickej zložitosti:

Pomer rýchlostí s rôznou geometrickou zložitosťou scén je pri všetkých riešeniach približne rovnaký, výkon zodpovedá počtu bodov, každým krokom je pokles FPS približne dvojnásobný. Úloha pre moderné grafické karty nie je príliš náročná a výkon je limitovaný najmä rýchlosťou spracovania geometrie, ale aj šírkou pásma / fillrate pamäte (v rámci riešení od jedného výrobcu).

V tomto teste sa mali prejaviť zlepšené schopnosti ovládania geometrie južných ostrovov, a tak sa aj ukázali. Nová grafická karta AMD je skutočne oveľa rýchlejšia v geometrických výpočtoch v porovnaní so všetkými predchádzajúcimi riešeniami od spoločnosti. Hoci AMD uviedlo až 4-násobok rastových čísel, v tomto teste sa geometrický výkon zvýšil približne 1,5 až 2-krát. Výsledkom bolo, že jednočipová grafická karta bola približne na rovnakej úrovni ako dvojčipový model Radeon HD 6990 na GPU predchádzajúcej generácie.

Takéto výrazné zlepšenie viedlo k tomu, že Tahiti takmer dohnalo špičkovú grafickú kartu Nvidia, hoci by mala byť v niektorých podmienkach ešte efektívnejšia pri vykonávaní geometrie shaderov. Predtým boli grafické karty Nvidia približne dvakrát rýchlejšie ako porovnateľné konkurenčné karty, ale teraz v tom nie je žiadny rozdiel. Pozrime sa, ako sa situácia zmení pri prenose časti výpočtov do geometrie shader:

Keď sa v tomto teste zmenila záťaž, čísla sa pri riešeniach Nvidia a väčšine dosiek AMD príliš nezmenili. Len nová grafická karta z rodiny HD 7900 v tomto teste zle reagovala na zmenu parametra záťaže GS, ktorá je zodpovedná za prenos časti výpočtov do geometry shaderu. Preto doska vykázala o niečo vyšší výsledok ako v predchádzajúcom diagrame. Uvidíme, čo sa zmení v ďalšom teste, ktorý sa týka veľkej záťaže geometrie shaderov.

„Hyperlight“ je druhý test geometrie shaderov, ktorý demonštruje použitie niekoľkých techník naraz: inštancia, výstup prúdu, zaťaženie vyrovnávacej pamäte. Využíva dynamickú tvorbu geometrie kreslením do dvoch buffrov, ako aj novinku v Direct3D 10 – stream výstup. Prvý shader generuje smer lúčov, rýchlosť a smer ich rastu, tieto údaje sa umiestňujú do vyrovnávacej pamäte, ktorú využíva druhý shader na vykresľovanie. Pre každý bod lúča je postavených 14 vrcholov v kruhu, celkovo až milión výstupných bodov.

Nový typ shader programu sa používa na generovanie „lúčov“ a s parametrom „GS load“ nastaveným na „Heavy“ – aj na ich kreslenie. To znamená, že v režime „Balanced“ sa geometrické shadery používajú iba na vytváranie a „rast“ lúčov, výstup sa vykonáva pomocou „inštancie“ a v režime „Heavy“ je do výstupu zapojený aj geometrický shader. . Najprv sa pozrime na jednoduchý režim:

Relatívne výsledky v rôznych režimoch opäť zhruba zodpovedajú zmenám zaťaženia: vo všetkých prípadoch sa výkon dobre škáluje a blíži sa k teoretickým parametrom, podľa ktorých by každá ďalšia úroveň počtu polygónov mala byť menej ako dvakrát pomalšia.

V tomto teste by rýchlosť vykresľovania mala byť obmedzená geometrickým výkonom a nová architektúra od AMD si vedie dobre, dokonca mierne prevyšuje svojho konkurenta zoči-voči Geforce GTX 580! Obe dvojčipové dosky tu vykazovali nesprávne výsledky, takže ich s nimi nebudeme môcť porovnávať. Ale HD 7970 je o 40-50% rýchlejší ako jeho predchodca HD 6970, čo je jednoznačne spôsobené architektonickými zmenami v GPU. Vynikajúce výsledky mapy na Tahiti jasne svedčia o optimalizáciách vykonaných v jednotkách na spracovanie geometrických údajov v novom čipe.

Čísla by sa mali v nasledujúcom diagrame veľmi zmeniť, v teste s aktívnejším využitím geometrie shaderov. Zaujímavé bude aj vzájomné porovnanie výsledkov získaných v režimoch „Vyvážený“ a „Ťažký“.

Tu sa ale Radeonu HD 7970 rekord nepodarilo dosiahnuť, napokon, rozdiel medzi čipmi AMD s tradičným grafickým potrubím (vrátane Cayman s Tahiti s dvoma rasterizátormi) a čipmi s architektúrou Fermi, ktorá má paralelné spracovanie geometrie, je jasne viditeľný. . A výsledky Geforce GTX 580, ktorá je založená na čipe GF110, sú také dobré, že prekonáva to najlepšie z riešení AMD (a to je dnes ohlásený model) o 35 – 40 %.

Hoci schopnosti nového špičkového čipu AMD z hľadiska spracovania geometrie a rýchlosti vykonávania geometrických shaderov v porovnaní s predchádzajúcimi grafickými kartami spoločnosti jasne vzrástli, prvé riešenie založené na čipe Tahiti vykazuje o 22 až 28 % vyššie výsledky v tieto testy ako riešenia založené na Caymane. Pravdepodobne sa inžinieri AMD rozhodli, že takáto optimalizácia trojuholníkov a jednotiek na spracovanie geometrie bude stačiť.

Direct3D 10: rýchlosť načítania textúr z vertex shaderov

Testy "Vertex Texture Fetch" merajú rýchlosť veľkého počtu načítaní textúr z vertex shaderu. Testy sú vo svojej podstate podobné, takže pomer medzi výsledkami kariet v teste „Zem“ a „Vlny“ by mal byť približne rovnaký. Oba testy využívajú mapovanie posunu založené na vzorkovacích dátach textúr, jediným podstatným rozdielom je, že test „Waves“ využíva podmienené skoky, zatiaľ čo test „Earth“ nie.

Zvážte prvý test „Zem“, najskôr v režime „Nízke detaily efektu“:

Predchádzajúce štúdie ukázali, že výsledky tohto testu ovplyvňuje veľa vecí naraz: rýchlosť textúrovania aj šírka pásma pamäte. A výsledky grafických kariet sú často obmedzené nejakou bariérou - stačí sa pozrieť na porovnanie dvojčipovej GTX 590 a jednočipovej analógovej - medzi nimi nie je takmer žiadny rozdiel. Hoci HD 6990 je dvakrát rýchlejší ako HD 6970.

A veľmi dobré výsledky predviedla nová karta AMD z rodiny Radeon HD 7970, ktorá takmer dohnala poprednú HD 6990. Čo sa týka jednočipových konkurentov, je najlepšia vo všetkých troch režimoch. Výhoda oproti HD 6970 sa pohybovala od 25 % do 75 % v závislosti od režimu. Pozrime sa na výkon v rovnakom teste so zvýšeným počtom načítaní textúr:

Tentokrát sa však relatívna poloha kariet na diagrame výrazne zmenila, a to platí najmä pre tvrdý režim. Pri malom počte polygónov závisí rýchlosť vykresľovania v tomto teste na šírke pásma pamäte, a preto boli dosky AMD v predchádzajúcom diagrame také silné.

No v ťažkých režimoch sa rozdiel medzi jednočipovou kartou od Nvidie a novou kartou AMD zmenšil a medzi sebou súperia v dosť tesnom boji. Staršia dvojčipová grafická karta rodiny Radeon HD 6900 prekonáva všetky ostatné riešenia a v porovnaní je najlepšia, hoci sa jej v ťažkom režime blíži Geforce GTX 590. Nová jednočipová HD 7970 prekonáva svojho predchodcu opäť až o 70 %, čo môže naznačovať silný vplyv šírky pásma pamäte.

Pozrime sa na výsledky druhého testu načítania textúr z vertex shaderov. Test Waves má menej vzoriek, ale používa podmienené skoky. Počet vzoriek bilineárnej textúry je v tomto prípade až 14 ("Nízke detaily efektu") alebo až 24 ("Vysoké detaily efektu") na vertex. Zložitosť geometrie sa mení podobne ako v predchádzajúcom teste.

Výsledky v druhom teste textúrovania vrcholov „Waves“ sú úplne odlišné od toho, čo sme videli v predchádzajúcich diagramoch. V tomto teste grafické karty AMD a Nvidia, s výnimkou HD 6990 a HD 7970, vykazujú veľmi tesné výsledky, čo možno opäť pripísať obmedzeniu šírky pásma videopamäte, pretože tento indikátor je blízko pre všetky prezentované grafické karty.

Nový model z rodiny južných ostrovov však dokázal vyniknúť, v ťažkých porovnávacích podmienkach takmer dobehol dvojčipový HD 6990, ktorý sa stal najlepším spomedzi všetkých grafických kariet. Rozdiel medzi kartami založenými na GPU Cayman a Tahiti bol opäť 25-70% v prospech novšieho riešenia. Zvážte druhú verziu toho istého testu:

A potom došlo k zmenám podobným tým, ktoré sme videli predtým - grafické karty Nvidia sa "prehýbali" iba v ľahkom režime a väčšina riešení AMD - naraz. To však neumožnilo doskám kalifornskej spoločnosti dobehnúť novinku z rodiny Radeon 7900. Ktorá mimochodom v stredných a ťažkých režimoch predčila všetkých, ustúpila dvojčipovej HD 6990 len raz.

V režime nízkeho polygónu nie je rozdiel medzi riešeniami až taký veľký, no v strednom a ťažkom režime sú staré riešenia AMD podradné, nasledujú dosky Nvidia (tá dvojčipová je len o niečo rýchlejšia ako jednočipová čip GTX 580), HD 6990 a HD 7970. Doska rodiny HD 7900 dnes ohlásená v testoch vertexových výberov sa ukázala ako vynikajúca, s veľkým náskokom pred konkurenčnými grafickými kartami od Nvidie a jej predchodcov od rovnakého výrobcu.

3DMark Vantage: Testy funkcií

Ako vždy, syntetické testy z balíka 3DMark Vantage nám môžu ukázať niečo, čo sme predtým vynechali. Testy funkcií v tomto testovacom balíku podporujú DirectX 10 a sú zaujímavé tým, že sa líšia od našich. Pri analýze výsledkov novej grafickej karty Radeon HD 7970 v tomto balíku budeme môcť vyvodiť niektoré nové a užitočné závery, ktoré nám v testoch rodiny RightMark unikli.

Test funkcie 1: Výplň textúry

Prvým testom je test rýchlosti načítania textúry. Používa sa na vyplnenie obdĺžnika hodnotami načítanými z malej textúry pomocou viacerých súradníc textúr, ktoré menia každý snímok.

Aj keď test Futuremark stále neukazuje teoreticky možnú úroveň rýchlosti načítania textúr, účinnosť grafických kariet AMD aj Nvidia je v ňom stále výrazne vyššia ako v našej od RightMark. Preto sa v tomto teste textúry získa trochu iný pomer výsledkov, ktorý je bližšie k pravde.

Prvá grafická karta z novej rodiny AMD vykazuje výsledok blízky zodpovedajúcim teoretickým parametrom a zvláda prácu efektívnejšie ako predchádzajúca generácia. Radeon HD 7970 prekonáva HD 6970 o viac ako 50 %, hoci teoretický rozdiel je len 40 %. S najväčšou pravdepodobnosťou sa textúrové jednotky Tahiti používajú efektívnejšie vďaka vylepšeniam v systéme pamäte a vyrovnávacej pamäte, čo spôsobilo zvýšený výsledok.

Samozrejme, nový jednočipový model zaostával za lídrom - dvojčipovým HD 6990, ale to sa neočakávalo. A predsa je jasne vidieť, že textúrový výkon grafického čipu Tahiti sa v porovnaní s Caymanom výrazne zvýšil. No a GTX 580 stráca na novinku v rýchlosti textúrovania až 2,3-násobne. Dokonca aj dual-GPU Nvidia karta dobieha len HD 6970.

Test funkcie 2: Farebná výplň

Toto je test miery plnenia. Využíva veľmi jednoduchý pixel shader, ktorý neobmedzuje výkon. Interpolovaná hodnota farby sa zapíše do vyrovnávacej pamäte mimo obrazovky (cieľ vykreslenia) pomocou alfa miešania. Používa 16-bitovú vyrovnávaciu pamäť mimo obrazovky FP16, ktorá sa najčastejšie používa v hrách, ktoré používajú vykresľovanie HDR, takže tento test je celkom aktuálny.

Situácia v teste výkonu jednotky ROP je veľmi odlišná od testu textúrovania. Čísla pre tento subtest z 3DMark Vantage ukazujú výkon jednotiek ROP, ale s vplyvom veľkosti šírky pásma videopamäte (takzvaná "efektívna miera plnenia"). A tu ukazuje nový model HD 7970 vynikajúci výsledok, ktorý zaostáva iba za dvoma špičkovými grafickými kartami AMD a Nvidia z predchádzajúcich generácií, ktoré majú na palube dve GPU.

Ako je to však s efektivitou využitia ROP blokov, ktorou sa AMD pochválilo? Len 32 ROP v novom čipe Tahiti totiž vôbec neobmedzuje rýchlosť vykresľovania, a to ani v špecializovanom teste. A zaznamenali sme mierne vyššiu efektivitu ROP a rýchlejšiu mieru plnenia v novej grafickej karte AMD v porovnaní so staršími modelmi. Rozdiel medzi HD 7970 a HD 6970 je viac ako 50%, čo jasne naznačuje väčší vplyv šírky pásma, než čistý výkon jednotiek ROP.

Čo sa týka porovnania s Nvidiou, aj tu rozdiel v rýchlosti (35 %) zodpovedá teoretickému rozdielu v šírke pásma pamäte (36 %), a nie čistej rýchlosti ROP blokov. Ukazuje sa, že 32 takýchto blokov na Kajmane bolo jednoducho nadbytočných a ich schopnosti neboli nikdy plne využité.

Test funkcie 3: Mapovanie paralaxnej oklúzie

Jeden z najzaujímavejších testov funkcií, keďže táto technika sa už používa v hrách. Špeciálnou technikou Parallax Occlusion Mapping, ktorá napodobňuje zložitú geometriu, kreslí jeden štvoruholník (presnejšie dva trojuholníky). Používajú sa pomerne náročné operácie sledovania lúčov a hĺbková mapa s vysokým rozlíšením. Tento povrch je tiež zatienený pomocou ťažkého Straussovho algoritmu. Toto je test veľmi zložitého a ťažkého pixel shaderu pre video čip, ktorý obsahuje množstvo načítaní textúr počas sledovania lúčov, dynamického vetvenia a zložitých výpočtov Straussovho osvetlenia.

Tento test sa od ostatných podobných líši tým, že výsledky v ňom nezávisia len od rýchlosti matematických výpočtov, efektivity vykonávania vetiev, či rýchlosti načítania textúr, ale od všetkého trochu. Pre dosiahnutie vysokej rýchlosti je tu dôležité vyváženie GPU blokov, veľmi citeľný vplyv má aj na rýchlosť a efektivitu vetvenia v shaderoch.

Porovnávacie výsledky grafických kariet AMD v diagrame sú vo všeobecnosti podobné tým, ktoré sme videli v teste textúrového výkonu od 3DMark Vantage, až na to, že nový Radeon HD 7970 je jednoznačne efektívnejší aj v tejto úlohe, pretože opäť takmer dobehol dual-GPU HD 6990 - vynikajúci výsledok! Dosky Nvidia dostali v tomto prípade určité zvýšenie výkonu, čo potvrdzuje záver, že nielen výkon textúr ovplyvňuje výsledky tohto testu.

Takže nový model AMD funguje dobre a dáva dosť na dvojčipovú dosku založenú na dvoch Caymanoch. Svojho jednočipového predchodcu predbehol o 66 %. Tento údaj nezodpovedá zrýchleniu z Kajmanu na Tahiti v žiadnom z teoretických parametrov a môže naznačovať zlepšenie efektívnosti vykonávania zložitých výpočtov vetvenia. Dokonca aj predtým považovaný dobrý výsledok Geforce GTX 580 je dvakrát horší ako nový AMD. V skutočnosti sa všetky grafické karty od tohto výrobcu ukázali byť rýchlejšie ako špičkový model radu Geforce GTX 500 založený na jednom čipe.

Test funkcií 4: GPU Cloth

Test je zaujímavý tým, že počíta fyzikálne interakcie (imitácia látky) pomocou video čipu. Používa sa simulácia vrcholov s použitím kombinovanej operácie shaderov vrcholov a geometrie s niekoľkými prechodmi. Použite stream out na prenos vrcholov z jedného simulačného prechodu do druhého. Testuje sa teda výkon vykonávania vertexových a geometrických shaderov a rýchlosť prúdenia.

Rýchlosť vykresľovania v tomto teste závisí aj od mnohých ďalších parametrov. Hlavnými faktormi sú tu výkon spracovania geometrie a efektivita geometrie shaderov. Je teda celkom logické, že grafické karty Nvidia sa v tejto aplikácii cítia skvele, výrazne pred svojimi konkurentmi.

A ani dnes predstavený Radeon HD 7970, napriek jasnému výkonnostnému zlepšeniu oproti HD 6970, tu nedokázal konkurovať jednočipovej Geforce GTX 580 a bol jej o niečo nižší. Toto je jeden z testov geometrie, ktorý ukazuje výhodu nedávnych grafických kariet HD 6900 oproti predchádzajúcim riadkom, v ktorých zvýšili rýchlosť spracovania geometrie a geometrie shaderov. Radeon HD 7970 zlepšil výsledok o ďalších 35 %, no nestačilo to – riešenia Nvidia v tomto teste naďalej vedú. Hoci poznamenávame, že nový model stále výrazne zlepšil pozíciu AMD v geometrických testoch.

Test funkcie 5: Častice GPU

Test fyzickej simulácie efektov založených na časticových systémoch vypočítaných pomocou video čipu. Používa sa aj simulácia vrcholov, každý vrchol predstavuje jednu časticu. Stream out sa používa na rovnaký účel ako v predchádzajúcom teste. Počíta sa niekoľko stoviek tisíc častíc, všetky sú animované samostatne, počítajú sa aj ich kolízie s výškovou mapou.

Podobne ako pri jednom z našich testov RightMark3D 2.0 sa častice kreslia pomocou geometrie shader, ktorý vytvára štyri vrcholy z každého bodu, aby vytvoril časticu. Ale test načítava shader bloky predovšetkým s výpočtami vrcholov, testuje sa aj stream out.

Výsledky ďalšieho testu z balíka 3DMark Vantage sú podobné tým, ktoré sme videli v predchádzajúcom diagrame, ale rýchlosť spracovania geometrie v ňom nadobudla ešte väčší význam. A tak sa grafické karty Nvidia posunuli ešte ďalej a nechali za sebou aj dvojčipové monštrum – Radeon HD 6990. Bohužiaľ, je to fakt – aj GTX 580 predbehla všetky dosky AMD, vrátane úplne nového modelu založeného na GPU Tahiti.

Bohužiaľ, hoci doska založená na novom čipe vykázala silnejší výsledok v porovnaní s riešeniami založenými na Cayman a Cypress, Geforce zaostávala. Rozdiel medzi HD 7970 a HD 6970 v tomto porovnaní bol niečo cez 30 %, čo naznačuje jasný vplyv rýchlosti ALU. V syntetických testoch simulácie látok a častíc 3DMark Vantage, ktoré aktívne využívajú shadery geometrie, riešenia AMD naďalej zaostávajú za konkurenčnými grafickými kartami s veľmi vysokou rýchlosťou spracovania geometrie.

Test funkcie 6: Perlin Noise

Posledný test funkcií balíka Vantage je matematicky náročný test video čipu, počíta niekoľko oktáv šumového algoritmu Perlin v pixel shaderi. Každý farebný kanál používa svoju vlastnú funkciu šumu na zvýšenie zaťaženia video čipu. Perlin šum je štandardný algoritmus často používaný v procedurálnom textúrovaní a využíva veľa matematiky.

Zaujímavosťou je, že v matematickom teste z balíka Futuremark, ktorý ukazuje špičkový výkon videočipov v limitných úlohách, sme videli úplne iný obraz v porovnaní s podobnými testami z nášho testovacieho balíka. Výkonnosť riešení zobrazených v diagrame zodpovedá len veľmi zhruba tomu, čo by sa malo získať podľa teórie, a tiež sa líši od toho, čo sme videli skôr v matematických testoch z balíka RightMark 2.0. Napríklad je jasne vidieť, že nová grafická karta sa v tomto teste oveľa priblížila k teoretickej rýchlosti v porovnaní s GPU kartami s architektúrou VLIW.

Poďme sa pozrieť na dôvody. Kedysi HD 6970 nezvýšil špičkový matematický výkon HD 5870, ale to samo osebe nevysvetľuje oneskorenie Cayman. Dôvodom mohla byť jednak nižšia účinnosť architektúry VLIW4, jednak systém smart power managementu, ktorý pri dosiahnutí nastavenej prahovej hodnoty spotreby energie „zabil“ taktovaciu frekvenciu a výkon riešení.

Ale to neovplyvnilo HD 7970. S najväčšou pravdepodobnosťou je dôvod práve v skalárnej architektúre nového čipu. Pretože pomer výkonových čísel v teste a teoretických tomu jasne nasvedčuje. Teoreticky má HD 6970 0,7 matematického výkonu novej karty, no pri tomto teste to vyšlo len na 0,56. Približne rovnaký rozdiel bol získaný aj pre ostatné dosky AMD. Ale pri porovnaní GTX 580 a HD 7970, ktoré majú skalárne architektúry, je teoretický pomer 0,42 (Tahiti je viac ako dvakrát rýchlejší) a praktický pomer je tiež 0,42. To znamená, že efektivita použitia dostupných ALU pre tieto čipy od rôznych výrobcov je úplne rovnaká! Na rozdiel od Cayman a Cypress, ktoré majú architektúru VLIW.

V každom prípade nová doska AMD s obrovským náskokom prekonáva oboch svojich konkurentov od Nvidie a Nvidia jednoznačne potrebuje drasticky zvýšiť svoju matematickú silu v budúcich riešeniach. Medzitým sa objavuje obvyklý obraz - grafické karty Geforce vykazujú slabé výsledky v prípadoch, keď sa jednoduchá a intenzívna matematika vykonáva na kartách Radeon oveľa rýchlejšie. A odchod z Južného ostrova situáciu len zhoršil.

Direct3D 11: Compute Shaders

Na testovanie nových riešení AMD v aplikáciách, ktoré používajú nové funkcie DirectX 11, ako je teselácia a výpočtové shadery, sme použili vzorky zo súprav SDK a ukážky od spoločností Microsoft, Nvidia a AMD.

Najprv sa pozrime na testy, ktoré používajú Compute shadery. Ich vzhľad je jednou z najdôležitejších noviniek v najnovších verziách DX API, používajú sa už v moderných hrách na vykonávanie rôznych úloh: post-processing, simulácie atď. Prvý test ukazuje príklad vykresľovania HDR s mapovaním tónov z DirectX SDK, s post-processingom, ktorý využíva pixelové a výpočtové shadery.

Možno to nie je najlepší príklad pre počítačové shadery, ale celkom jasne ukazuje rozdiel vo výkone. Medzi výpočtami vo výpočte a pixel shadermi pre grafické karty AMD nie je takmer žiadny rozdiel a na Nvidii je pixelový o niečo rýchlejší.

AMD Radeon HD 6970 sa ukázal byť rýchlejší ako jeho predchodca HD 5870 a výkon bol na úrovni Geforce GTX 580, no dnes predstavený HD 7970 je ďaleko pred nimi všetkými a stáva sa lídrom (rozhodli sme sa nepoužiť dvojčipové grafické karty v tomto syntetickom). GTX 560 Ti bola braná hlavne na testy geometrie, a tiež na vyhodnotenie rozdielov medzi riešeniami z rôznych cenových segmentov.

Takže ohlásená doska založená na novom čipe Tahiti je o 40% pred analógovou založenou na Cayman, čo plne zodpovedá rozdielu v teoretickom výkone výpočtových jednotiek. Výhoda oproti konkurenčnej GTX 580 je zase 30-40% (v závislosti od typu shader programu), čo je jednoznačne nižšie, ako je teoreticky možné. GTX 560 Ti výrazne zaostáva, viac ako dvojnásobne.

Druhý test výpočtového shadera je tiež prevzatý z Microsoft DirectX SDK a ukazuje výpočtový problém gravitácie N-tela (N-body), čo je simulácia dynamického časticového systému, ktorý je vystavený fyzikálnym silám, ako je gravitácia.

Výsledky v tomto teste sú veľmi nezvyčajné, pre zastarané riešenia AMD sú podobné číslam z matematického testu 3DMark Vantage – Cypress sa ukázal byť rýchlejší ako Cayman. Napriek veľkej teoretickej prevahe v špičkových číslach je najrýchlejšia grafická karta AMD – dnes predstavená nová Radeon HD 7970 – len o 21 % pred špičkovým riešením Nvidie. A ani GTX 560 Ti nezaostáva. Staré modely rodiny HD 6900 a HD 5800 vykazujú výsledky blízke tým z Geforce GTX 580.

Predovšetkým nás zaujíma rozdiel medzi výsledkami rozhodnutí na Kajmane a Tahiti a v tomto prípade vidíme výhodu čerstvého modelu, rovných 36 %. To je o niečo menej ako teoretický rozdiel medzi týmito modelmi, ale stále je to blízko. Prečo obe karty nevynikli na pozadí veľmi starého HD 5870? Možno za to môže znížená frekvencia PowerTune alebo chýbajúca optimalizácia ovládačov pre novú architektúru. Uvidíme, či Tahiti konečne ukáže výrazné zrýchlenie v teselačných testoch.

Direct3D 11: teselačný výkon

Výpočtové shadery sú veľmi dôležité, ale hlavnou inováciou v Direct3D 11 je stále hardvérová teselácia. Veľmi podrobne sme to zvážili v našom teoretickom článku o Nvidia GF100. Tessellation sa už dlho používa v hrách DX11, ako napríklad STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 a ďalšie. Niektoré z nich využívajú teseláciu na modely postáv, iné na simuláciu realistickej vodnej hladiny alebo krajiny.

Existuje niekoľko rôznych schém na rozdelenie grafických primitív (teselácia). Napríklad teselácia phong, trojuholníky PN, rozdelenie Catmull-Clark. Schéma PN Triangles sa teda používa v STALKER: Call of Pripyat a v Metro 2033 - Phong tessellation. Tieto metódy sa pomerne rýchlo a ľahko implementujú do procesu vývoja hry a existujúcich enginov, a preto sa stali populárnymi.

Prvým testom mozaikovania bude príklad mozaikovania detailov z ATI Radeon SDK. Implementuje nielen teseláciu, ale aj dve rôzne techniky spracovania pixel po pixeli: jednoduché prekrytie normálnych máp a mapovanie paralaxnej oklúzie. Poďme teda porovnať riešenia DX11 od AMD a Nvidie v rôznych podmienkach:

Zaujímavé je, že mapovanie paralaxnej oklúzie (stredné pruhy v diagrame) na grafických kartách od oboch výrobcov je oveľa menej efektívne ako mozaikovanie (spodné pruhy) a mierna mozaikovanie nespôsobuje veľký pokles výkonu – porovnajte horné a spodné pruhy. To znamená, že kvalitná simulácia geometrie pomocou výpočtov pixelov poskytuje ešte nižší výkon ako mozaiková geometria s mapovaním posunu.

Čo sa týka výkonu grafických kariet navzájom, pozrime sa najprv na techniky pixel po pixeli. V jednoduchom bumpmapping teste vedie nová grafická karta AMD, ktorá porazila HD 6970 a GTX 580 o 27 % a 36 %. Ale v čiastkovej skúške komplexných výpočtov pixel po pixeli (pamätajte na vyššie uvedené testy mapovania paralaxy) pred vydaním Cayman boli grafické karty Geforce rýchlejšie ako riešenia AMD, ako aj s povolenou teseláciou. S uvedením Radeonu HD 6970 sa v teselačnom subteste ukázal byť výrazne rýchlejší ako HD 5870 a v teste s malým deliacim faktorom trojuholníka HD 6970 predbehol dokonca aj GTX 580.

Oveľa zaujímavejšie je to, čo sme videli na grafe označenom Radeon HD 7970. Teselácia tu nie je príliš komplikovaná, takže nová grafická karta neprekonala predchádzajúci model o veľa - asi o 30%. Ďalšia vec je POM test. V tomto subteste nový HD 7970 jednoducho roztrhal všetky ostatné riešenia na kusy. Výhoda oproti HD 6970 a GTX 580 je len o niečo menej ako dvojnásobná. Ďalší super výsledok v teste mapovania paralaxy, ktorý hovorí o vysokej efektivite vykonávania zložitých shader programov.

Druhý test výkonu teselácie bude ďalším príkladom pre 3D vývojárov z ATI Radeon SDK - PN Triangles. V skutočnosti sú oba príklady zahrnuté aj v DX SDK, takže sme si istí, že vývojári hier si na nich vytvoria vlastný kód. Tento príklad sme testovali s iným faktorom teselácie, aby sme zistili, ako veľmi to ovplyvňuje celkový výkon.

Ale na tomto príklade už vidíme plnohodnotné porovnanie geometrickej sily riešení AMD a Nvidia v rôznych podmienkach. A ukázalo sa, že je to podľa nás veľmi zaujímavé. Výrazne vyniká grafická architektúra Fermi a čip novej architektúry Tahiti od AMD. Samozrejme, ide o čisto syntetický test a extrémne rozdeľovacie faktory sa v blízkej budúcnosti v hrách pravdepodobne nevyužijú, najmä vzhľadom na celkovú multiplatformnosť. Zaujíma nás architektonický potenciál, preto potrebujeme „syntetiku“.

Ak vo svetelných podmienkach nový Radeon HD 7970 úspešne konkuruje Geforce GTX 580, prekonáva ju v najľahších režimoch a je na rovnakej úrovni v treťom, ale v najťažších podmienkach s veľmi veľkým počtom trojuholníkov s videom Nvidia Geforce karta založená na čipe GF110, je jednoducho nemožné konkurovať - ​​v úlohách extrémnej teselácie je oveľa rýchlejšia ako aj opakovane vylepšené čipy AMD. Nový GPU, aj keď opäť znížil náskok od konkurenta v úlohách spracovania geometrie, je stále veľmi ďaleko od paralelnej prevádzky 16 teselačných blokov v GF110. A dokonca aj GF114 pri maximálnom deliacom pomere sa ukázalo byť rýchlejšie ako Tahiti.

Napriek prehre v najdrsnejších podmienkach s najvyšším pomerom delenia však tahitský HD 7970 inak fungoval dobre, najmä v porovnaní s Caymanom a Cypressom. Nový model AMD v režimoch nízkej a strednej záťaže vykazuje pôsobivý nárast rýchlosti a rozdiel oproti už tak pomalému HD 6970 dosahuje 2,8-násobok. Ale takýto nárast vidíme len v krajnom prípade a najčastejšie to dopadá od 30 do 70 %. Sľubovaného štvornásobného rozdielu sme sa, aspoň zatiaľ, nedočkali.

No maximálny rozdiel medzi riešeniami firiem sa dosahuje v podmienkach extrémnej teselácie, ktorá im v hrách a benchmarkoch nebude blízka. Preto očakávame, že Tahiti výrazne zlepší výkon AMD v existujúcich teselačných benchmarkoch, ako sú 3DMark11 a Heaven.

Poďme sa pozrieť na ďalší benchmark, demo program Nvidia Realistic Water Terrain, známy aj ako Island. Toto demo využíva mozaikovanie a mapovanie posunov na vykreslenie realisticky vyzerajúceho povrchu oceánu a terénu. Vyzerá jednoducho skvele, to je to, čo v súčasných hrách chýba:

Island nie je čisto syntetický test na geometrický výkon, obsahuje komplexné pixelové aj výpočtové shadery a takáto záťaž sa približuje skutočným hrám, ktoré využívajú všetky GPU jednotky naraz, a nie len geometrické, ako v predošlom benchmarku.

Program sme testovali aj so štyrmi rôznymi faktormi mozaikovania, toto nastavenie sa nazýva Dynamic Tessellation LOD. A ak sú pri najnižšom deliacom faktore všetky grafické karty AMD vpredu, potom so zložitosťou práce začnú preberať vedenie dosky založené na čipoch Nvidia. A so zvýšením rozdeľovacieho faktora a zložitosti scény výkon absolútne všetkých Radeonov dramaticky klesá, na rozdiel od konkurenčných riešení.

Zaujímavé je správanie Radeonu HD 7970 v teste. Okamžite je jasné, že v geometrickom potrubí neboli vykonané žiadne zásadné zmeny (vo všeobecnosti to nebolo sľúbené, takže žiadne sťažnosti). Ak je v najľahšom režime nová karta rýchlejšia ako HD 6970 o 35% a GTX 580 o 64%, potom aj keď je LOD nastavená na 25, výkon novej karty klesne na úroveň rýchlosti GTX 560 Ti. Ďalej viac. Pri maximálnom pomere LOD dosiahol rozdiel medzi rýchlosťou Geforce GTX 580 a Radeon HD 7970 3,5-násobok!

Pozrime sa, či sme dostali sľúbený štvornásobný rozdiel medzi HD 7970 a HD 6970. Nie, maximálne oneskorenie GPU Cayman bolo menej ako dvojnásobné. A častejšie len jeden a pol. Vo všeobecnosti nám nie je veľmi jasné, kde hľadať štvornásobné zrýchlenie teselácie, zostáva veriť slovu, že niekde je. Medzičasom konštatujeme ďalšie víťazstvo videočipov od Nvidie – tie sú v geometrických testoch veľmi dobré.

Závery o syntetických testoch

Na základe výsledkov našich syntetických testov najnovšej grafickej karty Radeon HD 7970, založenej na GPU Tahiti z rodiny Južných ostrovov, ako aj výsledkov iných modelov grafických kariet vyrábaných oboma výrobcami diskrétnych video čipov, môžeme konštatujú, že nový produkt sa určite stane lídrom medzi jednočipovými riešeniami dostupnými na trhu. Ide len o skvelé pokračovanie úspešných radov Radeon HD 5800 a HD 6900, ktoré by mali v najbližších mesiacoch poriadne posilniť pozíciu AMD.

Tahiti GPU je založený na novej architektúre využívajúcej najpokročilejšiu 28nm procesnú technológiu a veľmi sa líši od všetkých predchádzajúcich čipov od spoločnosti. Hoci počet niektorých exekučných jednotiek v ňom až tak nenarástol (výpočtové jednotky ALU a ROP), nový GPU obsahuje dôležité architektonické zmeny zamerané na zvýšenie efektivity výpočtov na GPU, ako aj zlepšenie pozícií vo výkone geometrických spracovanie dát. Mnohé z našich syntetických testov ukázali, že výpočtová efektivita v zložitých problémoch a rýchlosť teselácie a vykonávania shaderov geometrie sa výrazne zlepšili, aj keď nie vždy tak, ako sme očakávali.

S video čipmi AMD sa stalo niečo, čo sa muselo stať. To isté, čo Nvidia už prešla o niečo skôr. S posunom dôrazu od grafických výpočtov na všeobecné výpočtové systémy a zodpovedajúcim posunom od VLIW ku skalárnym architektúram, ako aj s pridaním ďalších dôležitých funkcií GPGPU, ako je pokročilé ukladanie do vyrovnávacej pamäte a pridávanie plánovačov do každej výpočtovej jednotky, zvýšenie zložitosti čipu určite prevýši zvýšenie špičkového výkonu. Čiste v skutočnosti sa ukazuje, že predchádzajúce riešenia môžu byť efektívnejšie – sú síce menej produktívne, no dosahuje sa to s menšou námahou (vo forme zložitosti čipu).

Vysvetlime si to na príklade. Výhoda Radeonu HD 7970 oproti rovnakému Radeonu HD 5870 v niektorých syntetických testoch bola ďaleko od rozdielu v zložitosti GPU - napokon, Cypress má presne o polovicu menej tranzistorov (2,15 oproti 4,3 miliardám) a v testoch veľmi zriedka zaostáva. toľko pozadu. Ukazuje sa, že starý čip je efektívnejší ako nový? Áno, ale len pre zastarané čisto grafické úlohy! V prípade negrafických výpočtov a mnohých zložitých 3D výpočtov sa ukázalo, že Tahiti je dokonca viac ako dvakrát výkonnejšie ako Cypress, čo potvrdzujú aj príslušné syntetické látky. GPGPU je budúcnosť a úlohy video čipov budú stále komplikovanejšie, takže AMD jednoducho nemalo inú cestu.

Ale vďaka architektonickým zmenám a svojim charakteristikám sa grafická karta novej série v mnohých syntetických testoch, ktorá bývala „Achillovou pätou“ riešení AMD, stala viac ako konkurencieschopnou, najmä v porovnaní s priamym konkurentom Geforce GTX 580. , a to aj s prihliadnutím na vyššiu cenu. Je to jasne vidieť takmer vo všetkých syntetických testoch balíkov RightMark, Vantage a príkladoch z rôznych SDK.

Ale boli tu aj potenciálne ... no, nie také slabé, ale nie dostatočne silné stránky nového GPU. Medzi ne patrí nie príliš veľký nárast výkonu v niektorých matematických testoch a vynárajú sa geometrické otázky (napríklad kde je sľubované štvornásobné zrýchlenie?). Napriek väčšej zložitosti a oblasti čipu v porovnaní s rovnakým Caymanom sú výsledky modelu HD 7970 niekedy nižšie, ako sa očakávalo, čo nie je vždy ľahké vysvetliť. Predpokladáme, že na vine môže byť chýbajúca optimalizácia ovládačov, pretože pre AMD je táto architektúra úplne nová a vyžaduje si starostlivé a zdĺhavé leštenie. V niektorých testoch mohol zlyhať aj systém správy napájania PowerTune, ktorý by mohol znížiť takt pri dosiahnutí maximálnej spotreby energie v najnáročnejších syntetických testoch, čím by karta nemohla vykazovať očakávaný výkon na základe počtu exekučných jednotiek a ich taktu.

Aj keď celkovo sa výsledky v oblasti syntetiky ukázali ako celkom dobré, a je obzvlášť potešujúce, že inžinieri AMD sprísnili niektoré ich slabé stránky. Bohužiaľ, v súčasných hrách bude oveľa ťažšie dosiahnuť také pôsobivé zisky v porovnaní s pokročilou syntetikou. Hneď z niekoľkých dôvodov. Už len preto, že výkon v herných aplikáciách je na rozdiel od syntetiky zriedka obmedzený jednou charakteristikou grafickej karty a pri tak radikálnej zmene grafickej architektúry je stále potrebné optimalizovať a optimalizovať ovládače. Navyše aj moderné hry zriedka využívajú plné možnosti špičkových grafických kariet PC. Často sú obmedzené rýchlosťou načítania textúr a efektívnym fillrate (šírkou pásma videopamäte) a v takýchto podmienkach sa takéto zložité čipy nedokážu úplne otvoriť. Budeme si musieť počkať na výkonné PC-exkluzivity alebo ďalšiu generáciu herných konzol.

Predpokladáme, že výsledky Radeonu HD 7970 v syntetických testoch potvrdia zodpovedajúce čísla v „hernej“ časti nášho materiálu. V hrách by mala nová HD 7970 prekonať všetkých konkurentov a prekonať Geforce GTX 580 aspoň o 30 % alebo aj viac. Pravdepodobne to dopadne ako obvykle – v niektorých testoch bude väčšia výhoda a v iných takmer žiadna. Každopádne HD 7970 by mal byť najlepší spomedzi všetkých jednočipových modelov AMD a Nvidie, aspoň sme na to našli všetky predpoklady. Prejdime teda k ďalšej časti materiálu – štúdiu rýchlosti v hrách.