7970 poraba. Video kartice

Preidimo na rezultate meritev:

Poraba energije celotnega sistema v stanju mirovanja, W.

Zahvaljujoč optimizaciji procesov in zmanjšanju napetosti v prostem teku se je poraba energije v primerjavi s prvo različico Radeon HD 7970 zmanjšala za skoraj tri vate. Revolucionarnih sprememb pa tu nismo pričakovali. Grafične kartice AMD so že dolgo uspešne s tehnologijo ZeroCore Power.

Poraba energije celotnega sistema pod obremenitvijo, W.

Radeon HD 7970 GHz Edition pod obremenitvijo porabi nekoliko več energije kot njegov predhodnik. Kot si lahko predstavljate, je to posledica višjih taktov, saj je AMD očitno želel iz novih optimizacij čipov iztisniti največjo zmogljivost. Vendar pa je malo verjetno, da bi povečanje porabe energije za šest vatov vplivalo na skupni račun za elektriko.

Temperatura v prostem teku, stopinje Celzija.

Nestrpno smo pričakovali rezultate temperaturnega testa. Zaradi nižje napetosti bi lahko pričakovali padec temperatur v prostem teku. Ampak, žal, sprememb nismo popravili.

Temperatura pod obremenitvijo, stopinje Celzija.

Zanimivo je, da smo dobili razliko med obema video karticama pod obremenitvijo. Model Radeon HD 7970 je dosegel 74°C, GHz Edition pa je dosegel 72°C pod enakimi pogoji. Morda je bil ta potencial mogoč zaradi optimizacij, narejenih med proizvodnjo GPU.

Raven hrupa v načinu mirovanja, dB(A).

V načinu mirovanja ne dobimo skoraj nobene razlike v ravni hrupa. Ker so temperature enake, ni treba, da bi se ventilator vrtel hitreje ali počasneje.

Raven hrupa pod obremenitvijo, dB(A).

Pod obremenitvijo je razlika v ravni hrupa postala pomembnejša. "Stari" Radeon HD 7970 deluje več kot en decibel glasneje kot GHz Edition. Morda je to posledica nižje temperature GPU-ja, ki omogoča, da se ventilator vrti nekoliko počasneje.

Testna metodologija
Nastavitve gonilnika AMD Catalyst - privzeto
antialiasing Nastavitve aplikacije
Anizotropno filtriranje Nastavitve aplikacije
Teselacija Optimiziran AMD
Katalizator A.I. Kakovost filtra teksture Kakovost, omogoči optimizacijo površinskega formata
Počakajte na V-Sync Onemogoči, razen če aplikacija ne določa
AA način Več vzorcev
Trojni puferni Onemogoči
Nastavitve gonilnika NVIDIA
CUDA GPU-ji vse
Anizotropno filtriranje Upravljanje aplikacij
Vertikalna sinhronizacija Uporabite nastavitev aplikacije 3D
Senčenje osvetlitve ozadja Izklopljeno
Največje število predhodno usposobljenih okvirjev 3
Optimizacija pretakanja Samodejno
Način upravljanja porabe Prilagodljivo
Glajenje - korekcija gama Izklopljeno
Način glajenja Nadzor aplikacije
Trojno puferiranje Izklopljeno
Pospeševanje z več zasloni Način delovanja z več zasloni
Filtriranje teksture - anizotropna optimizacija Izklopljeno
Filtriranje teksture - Kakovost Kakovost
Filtriranje teksture – negativno odstopanje UD dovoli
Filtriranje teksture - trilinearna optimizacija Vklopljeno
ProgramAPINastavitveTestni načinidovoljenje
3D Mark Vantage DirectX 10 Profili Performance, High, Extreme
3D oznaka 11 DirectX 11 Profili Performance, Extreme
Unigine Heaven 2 DirectX 11 Največja podrobnost, DirectX 11, teselacija v ekstremnem načinu Brez AA in AF / AA 4x, AF 16x 1920 x 1080 / 2560 x 1440
Crysis 2 + Adrenaline Orodje za primerjavo Crysis 2 DirectX 11 Downtown/Adrenalinski zemljevid. maks. podrobnosti, teksture visoke ločljivosti, DirectX 11 Rob AA 1920 x 1080 / 2560 x 1440
Far Cry 2 + Far Cry 2 Benchmark orodje DirectX 10 Majhen zemljevid ranča. maks. detajliranje Brez AA / AA 4x 1920 x 1080 / 2560 x 1440
Metro 2033 + Metro 2033 Benchmark DirectX 11 Največja podrobnost, DirectX 11, DOF, teselacija, NVIDIA PhysX izklopljen Analitski AA, AF 4x / MSAA 4x, AF 16x 1920 x 1080 / 2560 x 1440
Nezemljani proti Predatorju + Orodje za primerjavo Alien vs Predator DirectX 11 Največja podrobnost, DirectX 11 Brez AA in AF / AA 4x, AF 16x 1920 x 1080 / 2560 x 1440
DiRT 3 DirectX 11 Največja podrobnost Brez AA in AF / AA 4x, AF 16x 1920 x 1080 / 2560 x 1440
mafija 2 DirectX 11 Največja podrobnost, NVIDIA PhysX izklopljen. Brez AA, AF 1x / AA vklopljen, AF 16x 1920 x 1080 / 2560 x 1440
Just Cause 2 DirectX 10 Največja podrobnost, Bokeh filter izklopljen, Izboljšane podrobnosti vode izklopljene Brez AA, AF 2x / AA 4x, AF 16x 1920 x 1080 / 2560 x 1440

Pri testiranju so kot tekmeci Radeon HD 7970 sodelovale naslednje grafične kartice:

  • AMD Radeon HD 6970 (880/5500)
  • Radeon HD 6990 (880/5000)
  • NVIDIA GeForce GTX 580
  • NVIDIA GeForce GTX 590

Overclocking, temperatura, poraba energije

AMD je obljubil, da se bo procesor HD 7970 brez težav overclockal na 1 GHz in višje, kar je lahko verjeti, saj 75 MHz z novo procesno tehnologijo ni tako velik dosežek. Toda naš testni vzorec je zlahka dodal 200 MHz (!) nad nazivno frekvenco GPU-ja, pomnilnik pa se je povečal s 5500 na 6300 efektivnih MHz, vse brez dviga napetosti. Nadaljnji overclocking je naletel na omejitve funkcije Overdrive in jih ni bilo mogoče premagati s pomočjo dobro znanih trikov z registrskimi ključi in pripomočki za overclocking drugih proizvajalcev. HD 7970 ne more niti prebrati BIOS-a z obstoječo programsko opremo, tako da pravi zapisi šele prihajajo.

Videti je, da se Radeon HD 7970 glede TDP res ne razlikuje od HD 6970. Poraba energije sistema pod obremenitvijo je popolnoma enaka, v 2D načinu pa je HD 6970 še bolj požrešen. Overclocking je nekoliko povečal porabo energije, vendar je rezultat še vedno precej manjši kot pri drugih konkurentih - "dvoglavih" HD 6990 in GeForce pospeševalnikih.

Poleg tega se je HD 7970 izkazala za najhladnejšo kartico med vsemi udeleženci testa. Tudi pri maksimalnem overclockingu se segreje manj kot HD 6970. In ker je poraba energije kartic enaka, se je treba zahvaliti novemu hladilnemu sistemu. Učinek je še posebej izrazit, če frekvenco procesorja HD 7970 znižate na raven HD 6970.

Zmogljivost, sintetična merila uspešnosti

  • Radeon HD 7970 prekaša tako HD 6970 kot GeForce GTX 580 z veliko razliko v vseh načinih. Hitreje delujejo le "dvoglave" grafične kartice.
  • Overclockana HD 7970 je po zmogljivosti primerljiva z GeForce GTX 590, čeprav je HD 6990 še vedno pred nami. Slednji ima praviloma izredno visoke rezultate, kar znova postavlja vprašanje o pravilnosti algoritmov, s katerimi 3DMark Vantage izračunava točke. To ni prvič, da na tem testu naletimo na nepojasnjene artefakte.

  • HD 7970 prekaša vse konkurente, razen HD 6990, tudi brez overclockinga.
  • Pri overclockingu se razlika med HD 7970 in starim paradnim modelom z dvema čipoma nevarno skrči.

Zmogljivost, merila uspešnosti iger

Unigine Heaven 2

  • HD 7970 ima ogromno, skoraj dvojno prednost pred HD 6970. Vidi se, da je AMD odlično opravil svoje delo pri teselaciji.
  • Primerljivo zmogljivost ima GeForce GTX 580.
  • Po overclockingu je HD 7970 enak HD 6990, vendar zaostaja za GTX 590.

Kriza 2

  • Razlika med rezultati HD 7970 in HD 6970 je skoraj dvojna.
  • HD 7970 je tudi opazno pred GeForce GTX 580.
  • Brez overclockinga je HD 7970 po zmogljivosti primerljiv z HD 6990, z overclockingom pa dohiti GeForce GTX 590.

Nezemljani proti plenilcem

  • HD 7970 ima 25 % prednost pred HD 6970.
  • GeForce GTX 580 v načinih AA in AF nekoliko zaostaja celo za Radeon HD 6970.
  • Video kartice z dvojnim čipom so opazno hitrejše od novosti in tudi overclocking jim ne omogoča, da bi jih dohiteli.

  • HD 6970 se v tem merilu uspešno obnese, zato je prednost HD 7970 pred njim velika, vendar ne zdrobilna.
  • GeForce GTX 580 se lahko zlahka kosa s HD 7970 pri ločljivosti 1920x1080, vendar zaostaja pri 2560x1440.
  • Dvoprocesorske grafične kartice so za HD 7970 nedosegljive, tudi če so overclockane.

Metro 2033

  • HD 7970 je vsaj za tretjino hitrejši od HD 6970.
  • GeForce GTX 580 še vedno kaže dobre rezultate in ne zaostaja daleč za novicami.
  • SLI in CrossFire delujeta odlično, zato jih HD 7970 tudi z overclockingom ne more premagati, čeprav se približuje HD 6990.

Far Cry 2

  • HD 7970 je 20-25 % hitrejši od HD 6970.
  • HD 7970 je tudi bistveno pred GeForce GTX 580.
  • GTX 590 in HD 6990 sta tudi po overclockingu na nedosegljivi višini za HD 7970.

VLIW4 proti GCN

Končno smo Radeon HD 7970 pognali skozi igralne teste pri enakih frekvencah kot Radeon HD 6970. Diagram jasno kaže, koliko prednosti ponuja nova GCN arhitektura sama v primerjavi z VLIW4.

ugotovitve

AMD je iz nič ustvaril grafične procesorje, ki se radikalno razlikujejo od vsega, kar je bilo izdano pod blagovno znamko Radeon v zadnjih nekaj letih. Po obsegu sprememb je dogodek primerljiv z uvedbo poenotene arhitekture senčil VLIW5 v čipu R600 (Radeon HD 2900). A če se spomnite, kakšno težko pot je moral VLIW5 prehoditi, preden so se razkrile možnosti, ki so mu prisotne, postane opazno, da je tokrat vse povsem drugače.

Arhitektura GCN, ki jo predstavlja čip Tahiti, je že zrel in izjemno učinkovit izdelek. Radeon HD 7970 je 20-50 % hitrejši od AMD-jevega vodilnega procesorja prejšnje generacije z enim čipom in zlahka prekaša svojega glavnega konkurenta, GeForce GTX 580. Čeprav je Tahiti ogromen GPU kompleksnosti brez primere, kartica ne porabi nič več energije kot GeForce GTX 580. kot HD 6970 in ima visok strop overclockinga. In pri overclockingu se zmogljivost že približuje ravni dvoprocesorskih adapterjev Radeon HD 6990 in GeForce GTX 590.

Upoštevajte, da so položaji arhitekture Fermi še vedno močni pri nalogah z aktivno uporabo zmožnosti DirectX 11. V nekaterih igrah je GTX 580 le nekoliko slabši od novega izdelka AMD, tako da ima NVIDIA še vedno vse možnosti, da se maščuje. leto. Enako zanimivo bo videti, kako AMD korak za korakom približuje GPU procesorjem za splošno uporabo. NVIDIA CUDA je z leti dobila veliko prednost, zdaj pa ima AMD enako zmogljivo grafično arhitekturo in procesorje Fusion, ki bodo prej ali slej dobili tudi vdelana jedra GCN.

Testna metodologija

Nastavitve nadzornega centra AMD Catalyst
antialiasing Uporabite nastavitve aplikacije
Anizotropno filtriranje Uporabite nastavitve aplikacije
Teselacija Uporabite nastavitve aplikacije
Catalyst A.I., Kakovost filtriranja teksture Kakovost, omogoči optimizacijo površinskega formata
Raven podrobnosti Mipmap Kakovost
Počakajte na V-Sync izklopljeno, razen če to določa aplikacija
Način anti-aliasinga Več vzorcev AA
Nastavitve Direct3D, Omogoči instanciranje geometrije Vklopljeno
Trojni puferni Izklopljeno
Nastavitve nadzorne plošče NVIDIA
okluzija okolice Izklopljeno
Anizotropno filtriranje Nadzorovano z aplikacijo
Antialiasing - korekcija gama Vklopljeno
Antialiasing-Mode Nadzorovano z aplikacijo
Antialiasing - Nastavitve Nadzorovano z aplikacijo
Antialiasing - Transparentnost Izklopljeno
CUDA-grafični procesorji vse
Največje število vnaprej upodobljenih okvirjev 3
Pospešek z več zasloni/mešani GPU Način delovanja z več zasloni
način upravljanja porabe Prilagodljivo
Filtriranje teksture — optimizacija anizitropnega vzorca Izklopljeno
Filtriranje teksture — negativna pristranskost LOD dovoli
Filtriranje teksture - Kakovost Kakovost
Filtriranje teksture - trilinearna optimizacija Vklopljeno
Nitna optimizacija Samodejno
Trojno puferiranje Izklopljeno
vertikalna sinhronizacija Uporabite nastavitve aplikacije 3D
Nabor meril uspešnosti
Program API Nastavitve Testni način dovoljenje
3D Mark 2011 DirectX 11 Profili Performance, Extreme

Unigine Heaven 2 DirectX 11 maks. kakovost, DirectX 11, teselacija v ekstremnem načinu AF 16x, MSAA 4x 1920 x 1080 / 2560 x 1440
Crysis Warhead + Framebuffer Orodje za primerjalno analizo bojne glave Crysis DirectX 10 Prelet zmrzali. maks. nastavitve, DirectX 10. AF 16x, MSAA 4x 1920 x 1080 / 2560 x 1440
Metro 2033 + Metro 2033 Benchmark DirectX 11 maks. nastavitve, DirectX 11, DOF, teselacija, NVIDIA PhysX izklopljen AF 16x, MSAA 4x 1920 x 1080 / 2560 x 1440
Orodje za primerjavo DiRT 3 + Adrenalinske dirke DirectX 11 Aspen, 8 avtomobilov. maks. kakovost, DirectX 11 AF, AA 4x 1920 x 1080 / 2560 x 1440
Crysis 2 + Adrenaline Orodje za primerjavo Crysis 2 DirectX 11 centralni park. maks. kakovost, DirectX 11, teksture visoke ločljivosti AF 16x, Post MSAA + Edge AA 1920 x 1080 / 2560 x 1440
Battlefield 3 + FRAPS DirectX 11 Začetek misije Going Hunting. maks. kakovost AF 16x, MSAA 4x 1920 x 1080 / 2560 x 1440
Batman: Arkham City. Vgrajeno merilo uspešnosti DirectX 11 maks. kakovost AF, MSAA 4x 1920 x 1080 / 2560 x 1440
The Elder Scrolls 5: Skyrim + FRAPS DirectX 9 Mesto Whiterun. maks. kakovost AF 16x, MSAA 4x 1920 x 1080 / 2560 x 1440
Call of Duty: Modern Warfare 3 + FRAPS DirectX 9 Misija Vrnitev pošiljatelju. maks. kakovost AF, MSAA 4x 1920 x 1080 / 2560 x 1440

Naslednje grafične kartice so sodelovale pri testiranju kot tekmeci Radeon HD 7970 GHz Editon:

  • AMD Radeon HD 7970 (925/5500 MHz, 3 GB)
  • NVIDIA GeForce GTX 680 (1006/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 670 (915/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 590 (607/3414 MHz, 3 GB)
  • AMD Radeon HD 6990 (880/5000 MHz, 4 GB)

Da bi bila oba udeleženca današnje spletke, Radeon HD 7970 GHz Edition in GeForce GTX 680, polno oborožena, sta bila pri testiranju uporabljena najnovejša beta gonilnika NVIDIA (304.48 Beta) in AMD (Catalyst 12.7 Beta). Poleg tega je bil za GTX 680 aktiviran način PCI-E 3.0, ki na platformi Intel X79 uradno ni podprt.

⇡ Overclocking, temperatura, poraba energije

Ker se PowerTune ne kaže pri opazovanih taktnih frekvencah, je frekvenca Boost Clock 1050 MHz postala izhodišče za overclocking. Z napetostjo GPU stvari niso tako preproste. Dejstvo je, da nastavitev napetosti v MSI Afterburnerju (možno je, da se isto zgodi tudi pri drugih pripomočkih, tega nismo preizkusili) nima več vpliva na opazovano napetost. Če ga želite povečati, morate poskusiti nastaviti višje trajno napetost z ustrezno možnostjo. Toda, ne glede na to, kako čudno je videti, to ne ustavi nihanja napetosti, ampak le premakne opazovane vrednosti navzgor. Tako napetosti ne moremo popraviti, lahko pa premaknemo obseg, znotraj katerega se spreminja. Posledično, če ročno nastavite napetost na 1,3 V, bo območje nihanja približno 1,227 - 1,252 V.

Treba je opozoriti, da je bila v nekaterih primerih pri igranju z različnimi pripomočki za overclocking in spremljanje napetost še vedno fiksna na 1,3 V, potem pa je očitno Power Tune znorel in na zaslonu so se pojavili močni artefakti v 3D ne glede na GPU frekvenco. Ne zdi se, da bi bilo vredno poskušati premagati Power Tune, še posebej, ker tako dobro opravlja svoje delo.

Če upoštevamo Boost Clock novega adapterja kot standardno frekvenco GPU-ja v drugih Radeonih (in glede na načela Power Tune je), se je HD 7970 GHz Edition overclockala celo bolje kot običajna HD 7970: do 1240 MHz za procesor in 7320 (1830) MHz iz pomnilnika. Če od 1240 MHz odštejemo razpon Power Tune Boost 50 MHz, dobimo frekvenco, ki jo dosežejo številni primerki standardne HD 7970. Očitno daljša frekvenčna tabela omogoča, da overclockani GPU doseže višje najvišje vrednosti, medtem ko se vrne na prejšnjo nižji prag pri težkih opravilih. Ni pa dejstvo, da kartica dejansko kdaj doseže teh 1240 MHz in ni nenehno v throttlingu. Dokler pripomočki za spremljanje ne dobijo dostopa do notranjosti Power Tune, bo to ostalo skrivnost.

Toda fantastičen overclocking pomnilnika je le zasluga odličnih krmilnikov čipov Tahiti in pomnilniških čipov, ki so očitno nekoliko boljši od tistih, ki so opremljeni s standardnim HD 7970.

HD 7970 GHz Edition se segreje nekoliko bolj kot standardna različica - približno enako kot GeForce GTX 680. Hladilni sistem, vklopljen s polno hitrostjo, omogoča ohranjanje enakih temperatur med močnim overclockingom kot v običajnem načinu, vendar le za ceno ogromnega hrupa. Priznamo, da tudi s samodejnim krmiljenjem ventilatorja HD 7970 GHz Edition naredi veliko več hrupa kot GeForce GTX 680.

Največja zabeležena poraba energije kartice se je po pričakovanjih še vedno nekoliko povečala v primerjavi z običajno HD 7970. Ne mislimo, da AMD laže, ko trdijo, da je TDP obeh različic HD 7970 enak. Očitno ga HD 7970 GHz Edition preprosto bolj aktivno obvladuje. Med overclockingom se seveda poraba energije dvigne do stropa. Močan napajalnik ne bo motil.

⇡ Radeon HD 7970 GHz Edition proti GeForce GTX 680

To so rezultati, zaradi katerih se je vse začelo. Ali je torej AMD-ju uspelo ponovno pridobiti izgubljeno vodstvo?

GeForce GTX 680 brez overclockinga je še vedno boljši od HD 7970, vendar je med overclockiranimi karticami Radeon hitrejši.

Igranje igertesti+ Unigine Heaven

Z ločljivostjo 1920 x 1080 v treh od devetih igralnih meril (Crysis Warhead, DiRT 3, Metro 2033) je Radeon HD 7970 GHz Edition prednjači. V ostalih treh zmaga GeForce GTX 680 (Unigine Heaven 2, Battlefield 3, Skyrim). V ostalih igrah med nasprotniki ni bistvenih razlik. Popoln žreb. V načinu 2560x1440 situacija odtehta v prid HD 7970. Le v CoD 3 in Unigine Heaven GTX 680 ohranja svojo premoč.

Overclocking je boljši za kartico AMD kot za GTX 680: povečanje zmogljivosti je opazno večje in posledično se HD 7970 GHz Edition maščuje tudi pri 1920x1080.

⇡ Radeon HD 7970 GHz Edition proti vsem

  • Žalostno za AMD, toda v 3DMark 2011 je Radeon HD 7970 GHz Edition slabši ne le od GeForce GTX 680, ampak tudi od GTX 670.
  • Prednost GHz Edition pred standardno različico je opazna.

Unigine Heaven 2

  • GHz Edition je dodal nekaj FPS v primerjavi z običajnim HD 7970.
  • Pri 2560x1440 imata GeForce GTX 670 in GTX 680 minimalno prednost, pri 1920x1080 pa HD 7970 GHz Edition opazno zaostaja.
  • Overclockana GHz Edition premaga Radeon HD 6990 in se primerja z GTX 670 in GTZ 680.

Crysis Warhead (DirectX 10)

  • V tem testu celo običajna HD 7970 zlahka premaga GeForce GTX 680 zaradi večje pasovne širine pomnilnika.
  • HD 7970 GHz Edition je celo nekoliko slabša od GeForce GTX 590, overclockana GHz Edition pa je enaka Radeon HD 6990.

Metro 2033 (DirectX 11)

  • Prednost HD 7970 GHz Edition pred običajno različico je majhna.
  • HD 7970 GHz Edition je opazno hitrejša od GeForce GTX 680.
  • Pri overclockingu GHz Edition doseže raven GeForce GTX 590 in Radeon HD 6990.

DiRT 3 (DirectX 11)

  • HD 7970 GHz Edition je veliko boljša od standardne različice.
  • GHz Edition je tudi opazno hitrejša od GTX 680, po zmogljivosti je primerljiva z Radeon HD 6990 in GeForce GTX 590.

Crysis 2 (DirectX 11)

  • V načinu 2560x1440 je opazno povečanje zmogljivosti v primerjavi z običajnim HD 7970.
  • Pri 2560x1440 je HD 7970 GHz Edition tudi pred GeForce GTX 680, overclockana kartica pa je pustila GTX 590 za seboj in dohitela Radeon HD 6990.
  • V načinu 1920x1080 so udeleženci testa dosegli mejo 100 FPS, nastavljeno v Crysisu 2.

Battlefield 3 (DirectX 11)

  • Ponovno ima HD 7970 GHz Edition opazno povečanje FPS v primerjavi s standardnim HD 7970.
  • Novost je približno enaka GTX 670 in GTX 680.
  • Overclockana HD 7970 GHz Edition je pretežka celo za GTX 590.

Batman: Arkham City (DirectX 11)

  • Čarobna fraza GHz Edition ponovno daje HD 7970 lepo povečanje FPS.
  • Pri 1920x1080 je kartica enaka GTX 680, pri 2560x1440 pa jo prekaša.

The Elder Scrolls 5: Skyrim (DirectX 9)

  • Med HD 7970, HD 7970 GHz Edition in GeForce GTX 680 v tej igri ni bistvene razlike: po določeni meji motor Skyrim ne more več uporabljati dodatne računalniške moči.

Call of Duty: Modern Warfare 3 (DirectX 9)

  • V primerjavi s standardno različico HD 7970 ima GHz Edition veliko povečanje števila sličic.
  • Kljub temu je le GeForce GTX 670, ne pa GTX 680, enakovredni tekmec novemu izdelku.

⇡ Sklepi

Za AMD je prvič po preteklih časih Radeon X1950 XTX napočil trenutek, ko je vrhunska grafična kartica vsaj tako dobra kot vodilna NVIDIA iste generacije. HD 7970 GHz Edition je celo nekoliko hitrejša od GeForce GTX 680 v težkih grafičnih načinih (kot je 2560x1440) na splošno zahvaljujoč 384-bitnemu pomnilniškemu vodilu. Poleg tega ima po tovarniškem overclockingu še vedno precejšnjo mejo frekvenc. Posodobljena tehnologija Power Tune ugodno vpliva na potencial overclockinga GPU-ja in pomnilnik se je začel veliko bolje overclockati. V prihodnjih karticah NVIDIA in AMD bomo zagotovo videli cvetoče tehnologije dinamičnega nadzora frekvence in napetosti, kot se je to že zgodilo s CPU.

Pravzaprav je v originalni različici HD 7970 zelo zmogljiva kartica in večina kopij zlahka doseže takšne frekvence, pri katerih lahko dohitite in prehitite GeForce GTX 680. GHz Edition je večinoma modni izdelek tako za lastnika kot za proizvajalec. AMD je overclockal HD 7970 ravno toliko, da se ujema z GTX 680 in še vedno ostane znotraj istega TDP. Naši testi porabe energije jasno kažejo, kaj bi se zgodilo, če bi si razvijalci za cilj postavili brezpogojno zmago nad vodilnim proizvajalcem NVIDIA.

Žal je AMD že izgubil posebno prednost pred karticami NVIDIA v segmentu High-End, ki jo uživa zadnja leta – porabo energije. Če prej vrhunski Radeoni po zmogljivosti niso mogli premagati GeForce GTX 480 in GTX 580, so pa porabili in segrevali veliko manj, je zdaj v merilih izenačena, vendar je TDP Radeon HD 7970 GHz Edition toliko kot 55 W višje kot pri GTX 680.

In še eno vprašanje. Obstoj dveh fizično enakih kartic z različno programsko opremo v liniji Radeon je že videti grdo. Kaj plačujejo kupci HD 7970 GHz Edition, če je skoraj enako mogoče doseči z enostavnim overclockingom standardne HD 7970 in zakaj lastniki slednje niso dobili nove vdelane programske opreme? Ker BIOS-a grafičnih kartic ni mogoče posodobiti tako enostavno kot gonilnike, bi bilo bolje, če bi HD 7970 GHz Edition v celoti nadomestil svojega predhodnika. No, čisto z vidika svetovne harmonije.

  • 2. del - Praktično spoznavanje
  • 3. del – Rezultati testov pri igranju iger (zmogljivost)

V tem delu, kot običajno, bomo preučili samo video kartico in se seznanili z rezultati sintetičnih testov.

plačati

  • GPU: Radeon HD 7970 (Tahiti)
  • vmesnik: PCI Express x16
  • Delovna frekvenca GPU (ROPs): 925 MHz (nominalno 925 MHz)
  • Frekvenca pomnilnika (fizična (učinkovita)): 1375 (5500) MHz (nominalni - 1375 (5500) MHz)
  • Širina vodila za izmenjavo pomnilnika: 384 bit
  • Število računalniških enot v GPU / frekvenca blokov: 32/925 MHz (32/925 MHz nominalno)
  • Število operacij (ALU) v bloku: 64
  • Skupno število operacij (ALU): 2048
  • Število teksturnih enot: 128 (BLF/TLF/ANIS)
  • Število rasterizacijskih blokov (ROP): 32
  • dimenzije: 285×100×33 mm (zadnja vrednost je največja debelina grafične kartice)
  • Barva tekstolita: rdeča
  • Poraba energije (največja 3D/2D/spanje): 215/70/3 W
  • Izhodni priključki: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
  • Podpora za večprocesiranje: CrossFire X (strojna oprema)

AMD Radeon HD 7970 3072MB 384-bit GDDR5 PCI-E

Kartica ima 3072 MB GDDR5 SDRAM, ki je nameščen v 12 čipih na sprednji strani tiskanega vezja.

Ker ni bilo lastnih sintetičnih testov DirectX 11, smo ponovno uporabili primere iz Microsoftovih in AMD SDK-jev ter Nvidia demo. Prvi je HDRToneMappingCS11.exe in NBodyGravityCS11.exe iz DirectX SDK (februar 2010).

Prevzeli smo tudi aplikacije obeh proizvajalcev: Nvidia in AMD. DetailTessellation11 in PNTriangles11 sta bila vzeta iz ATI Radeon SDK (tudi sta v DirectX SDK). Poleg tega je bil uporabljen Nvidijin demo program - Realistic Water Terrain, znan tudi kot Island11 (avtor - Timofey Cheblokov, znan specialist za 3D grafiko).

Sintetični testi so bili izvedeni na naslednjih video karticah:

  • Radeon HD 7970 HD 7970)
  • Radeon HD 6990 s standardnimi parametri (v nadaljevanju HD 6990)
  • Radeon HD 6970 s standardnimi parametri (v nadaljevanju HD 6970)
  • Radeon HD 5870 s standardnimi parametri (v nadaljevanju HD 5870)
  • Geforce GTX 590 s standardnimi parametri (v nadaljevanju GTX 590)
  • Geforce GTX 580 s standardnimi parametri (v nadaljevanju GTX 580)

Za primerjavo rezultatov najnovejše grafične kartice Radeon HD 7970 so bili ti modeli izbrani iz različnih razlogov. Radeon HD 6970 je bil vzet kot neposredni predhodnik najvišjega segmenta, HD 6990 je bila vzeta kot najmočnejša (čeprav z dvema čipoma) rešitev na GPU prejšnje arhitekture, HD 5870 smo dodali za oceno dobička med dvema različnima posodobitve arhitekture in kot GPU natanko pol tako zapleten kot Tahiti.

Izbrane rešitve Nvidia so izbrane, ker je Geforce GTX 580 najhitrejši model podjetja z enim čipom, ki temelji na najnovejši generaciji GPU. Čeprav po ceni ni konkurent predstavljeni grafični kartici AMD, so njeni rezultati zanimivi kot maksimum za aktualne enočipne rešitve Nvidie. In GTX 590 z dvojnim čipom je skrajna in dražja različica podjetja. V testih DirectX 11 smo uporabili tudi Geforce GTX 560 Ti, ki je potreben za oceno povečane geometrijske zmogljivosti novega AMD GPU.

Direct3D 9: Testi polnjenja slikovnih pik

Ta test določa največjo zmogljivost vzorčenja teksture (hitrost tekselov) v načinu FFP za različno število uporabljenih tekstur na slikovno piko:

V našem zastarelem 32-bitnem testu filtriranja tekstur iz RightMarka večina video kartic kaže številke, ki še zdaleč niso teoretično možne. Torej rezultati sintetike teksture v primeru grafične kartice Radeon HD 7970 niso dosegli najvišje vrednosti, zato si bomo še enkrat ogledali hitrost teksturiranja po številkah iz testa 3DMark Vantage, pri katerem vedno dobimo bolj realistične številke.

V našem primeru se je izkazalo, da HD 7970 izbere le do 80 tekselov na uro iz 32-bitnih tekstur z bilinearnim filtriranjem, kar je precej nižje od teoretične številke 128 filtriranih tekselov. Sicer pa se je vse izšlo predvidljivo - vse plošče AMD so pokazale večjo zmogljivost in so pred grafičnimi karticami Nvidia. Navsezadnje ima tudi vrhunski enočipni Geforce GTX 580 le 64 TMU in je zato precej slabši od modela, ki temelji na čipu Tahiti, ki ima 128 TMU, ki delujejo na višji frekvenci. Zato je razlika več kot dvojna. No, GTX 590 z dvojnim čipom v tem testu kaže očitno neustrezen rezultat.

AMD-jeva različica z dvojnim GPU-jem tudi na našem testu očitno ne deluje pravilno, saj HD 7970 skoraj vedno prekaša celo to. No, novi model je svojega predhodnika prehitel za približno 30 %, kar je nekoliko slabše od teoretično možnih vrednosti. Vendar pa je v primerih z majhnim številom tekstur, ko je najbolj prizadeta pasovna širina pomnilnika, rezultat še nižji - približno 25%.

Upoštevajte enake rezultate pri testu stopnje polnjenja:

Številke prikazujejo stopnjo polnjenja in v njih vidimo vse enako, le da upoštevamo število slikovnih pik, zapisanih v medpomnilnik okvirja. Največji rezultat skoraj vedno doseže nova vrhunska grafična kartica iz družine Radeon HD 7900. Ima rekordno število TMU-jev, ki delujejo z višjo frekvenco in učinkovitejši v našem sintetičnem testu. Pojdimo na besedila preprostih senčilnikov slikovnih pik.

Direct3D 9: Benchmarks Pixel Shaders

Prva skupina senčilnikov slikovnih pik, ki jo obravnavamo, je zelo preprosta za sodobne video čipe; vključuje različne različice programov pikslov sorazmerno nizke zahtevnosti: 1.1, 1.4 in 2.0, ki jih najdemo v starih igrah.

Ti testi so preveč preprosti za sodobne grafične procesorje in so večinoma omejeni z zmogljivostjo teksturiranja in včasih s stopnjo polnjenja. Zato ne prikazujejo vseh zmogljivosti sodobnih video čipov, so pa zanimivi z vidika zastarelih igralnih aplikacij. Na dveh najpreprostejših testih je nova Radeon HD 7970 skorajda prehitela celo dvočipno HD 6990, pri težjih testih pa se je uvrstila med HD 6990 in HD 6970. Zanimivo je, kako se razlikujejo testi na GPU-jih različnih arhitektur. In tu je Tahiti nekoliko bližje GF110 kot svojemu predhodniku. Seveda, ne v absolutnem smislu, razlika v njih je zelo velika - od enega in pol do dvakrat.

Zmogljivost pri drugih testih je večinoma omejena s hitrostjo enote teksture in stopnjo polnjenja, zato je nova Radeon HD 7970 približno 30-40 % hitrejša od prejšnje HD 6970, kar je v skladu s teorijo. Vse plošče AMD so pred obema vrhunskima modeloma Geforce, le da pri primerjavi HD 5870 in GTX 590 ni vse tako jasno. Za neuspehe Nvidie pri teh testih je očitno krivo pomanjkanje hitrosti teksturiranja. Toda tudi senčnik s tremi svetlobnimi slikovnimi pikami Phong, ki je ob lansiranju na GF110 bolj odvisen od matematične zmogljivosti GPU, je veliko slabši od Caymana, še bolj pa od Tahitija.

Oglejmo si rezultate bolj zapletenih slikovnih programov vmesnih različic:

In tokrat se je zgodilo približno enako, HD 7970 se nahaja približno med modeloma z enim in dvojnim čipom, ki temeljijo na Caymanu iz serije HD 6900. Cook-Torranceov test je računsko bolj intenziven in razlika v njem približno ustreza na razliko v številu ALU in njihovi frekvenci. Zato je ta test bolj primeren za arhitekturo AMD, katere čipi imajo večje število matematičnih enot in Tahiti ni izjema.

Zanimivo je, da HD 5870 na tem testu prekaša HD 6970 in zdi se, da se je to zgodilo zaradi slabše zmogljivosti tega senčnika na novejšem čipu z arhitekturo VLIW4. Torej, čeprav je novi Radeon HD 7970 presegel HD 6970, je bil v tem testu le 20 % hitrejši od HD 5870.

Drugi test postopkovnega upodabljanja vode »Voda«, ki je bolj odvisen od hitrosti teksturiranja, uporablja odvisno vzorčenje iz tekstur velikih nivojev gnezdenja, grafične kartice pa so razvrščene po hitrosti teksturiranja, prilagojene različni učinkovitosti uporabe TMU. Na tem testu se rešitve AMD vedno dobro znajdejo, HD 7970 pa zagotavlja zelo dober rezultat, čeprav slabši od HD 6990 z dvojnim čipom, a veliko boljši od predhodnika na Caymanu. Najvišja plošča Nvidia z enim čipom zaostaja več kot 2,5-krat!

Direct3D 9: Testi Pixel Shaders 2.0

Ti testi senčnikov DirectX 9 slikovnih pik so bolj zapleteni od prejšnjih, so blizu tistemu, kar trenutno vidimo v večplatformskih igrah, in spadajo v dve kategoriji. Začnimo s preprostejšimi senčniki različice 2.0:

  • Preslikava paralakse- metoda preslikave teksture, znana iz večine sodobnih iger, podrobno opisana v članku.
  • Zamrznjeno steklo— zapletena postopkovna tekstura zamrznjenega stekla z nadzorovanimi parametri.

Obstajata dve različici teh senčil: ena s poudarkom na matematičnih izračunih in ena s prednostjo pridobivanja vrednosti iz tekstur. Razmislite o matematično intenzivnih možnostih, ki so bolj obetavne v smislu prihodnjih aplikacij:

To so univerzalni testi, ki so odvisni tako od hitrosti ALU-jev kot od hitrosti teksturiranja; osredotočajo se na celotno ravnovesje čipa, pa tudi na učinkovitost izvajanja kompleksnih programov. In zmogljivost nove grafične kartice AMD v testu Frozen Glass ni bila le dobra, ampak odlična! To pomeni povečana učinkovitost novega GPU-ja. Na prvem testu se je Radeon HD 7970 izkazal za opazno hitrejši celo od HD 6990 z dvema čipoma. Pa še plošča Nvidia z dvojnim čipom je bila daleč zadaj, da ne omenjamo Geforce GTX 580.

Tu se v drugem testu Parallax Mapping počutijo rešitve Nvidia nekoliko bolje in GTX 580 skoraj doseže HD 6970. Toda danes predstavljena HD 7970 je zelo daleč - nova AMD je pred najboljšo ploščo Nvidia za 80 % , kar jasno kaže na vpliv in matematične izračune ter hitrost teksturiranja. Zanimivo je, da je zelo stari HD 5870 spet hitrejši od HD 6970. Novi HD 7970 pa je 60 % hitrejši od predhodnika, česar očitno ne upravičujejo suhoparne teoretične številke. Tu je vplivala opazno večja učinkovitost skalarne arhitekture v primerjavi z VLIW.

Vendar je v primeru grafičnih kartic AMD vse zelo težko zaradi PowerTune. Konec koncev sintetični testi močno "obremenijo" GPU z izračuni, poraba energije plošč s podporo PowerTune v sintetiki pa lahko preseže nastavljeno mejo. Posledično se lahko zmanjša tudi hitrost GPU-ja, s tem pa bodo rezultati prikazani nižje od pričakovanih. Poglejmo iste teste v modifikaciji s prednostjo vzorcev od tekstur do matematičnih izračunov:

Za obe grafični kartici Nvidia je situacija postala še bolj žalostna, saj so vsi sodobni čipi AMD veliko boljši s hitrostjo teksturiranja in v teh testih samo povečajo svojo nesporno prednost. Tudi GTX 590 z dvema čipoma ne more konkurirati HD 6970 z enim čipom v obeh testih, osredotočenih na teksturiranje, da ne omenjam GTX 580. No, današnja Radeon HD 7900 je najhitrejša kartica z enim čipom, ki zaostaja le za HD 6990. Izkazalo se je, da je razlika med HD 7970 in HD 6970 enaka 26-28%, kar je teoretično dobro razloženo, saj je razlika v hitrosti teksturiranja pri novosti nekoliko večja.

Toda to so bile zastarele naloge, večinoma s poudarkom na teksturiranju in včasih na stopnji polnjenja. Nato si bomo ogledali rezultate še dveh testov senčnikov slikovnih pik – zdaj pa je različica 3.0, najtežja od naših Direct3D 9 API testov senčilnih pikslov. Najbolj razkrivajo v smislu sodobnih računalniških iger, od katerih so mnoge večplatformske. Testi se razlikujejo po tem, da močno obremenijo tako ALU kot teksturne enote, oba programa senčil sta zapletena in dolga ter vključujeta veliko število vej:

  • Preslikava strme paralakse— veliko bolj "težka" tehnika preslikave paralakse, opisana tudi v članku Sodobna terminologija 3D grafike.
  • Krzno- proceduralni senčnik, ki upodablja krzno.

V najtežjih testih DX9 podjetja RightMark se Nvidijine grafične kartice vedno obnesejo zelo močno, v nasprotju z vsemi prejšnjimi testi v našem pregledu. Ti testi niso omejeni z zmogljivostjo pridobivanja teksture, temveč so odvisni od učinkovitosti izvajanja kode senčnika. In prej je Radeon HD 6970 očitno izboljšal položaj AMD v tem testu in povečal učinkovitost pri prehodu z arhitekture VLIW5 na VLIW4.

No, danes smo videli še en preskok v zmogljivosti rešitev podjetja, Radeon HD 7970 jih je dvignil na nedosegljivo raven – nova enočipna grafična kartica je v obeh testih prehitela celo dvočipno HD 6990! Te naloge so odličen primer, kako se zmogljivost kompleksnih izračunov v resničnem svetu izboljšuje pri prehodu z VLIW na skalarno izvajanje.

Tako je nova vrhunska grafična kartica AMD v testih kompleksnih senčilnikov slikovnih pik različice 3.0 uspela ne le dohiteti tekmecev, ampak jo je tudi močno presegla, kar pa že dolgo ni veljalo. Hitrost v obeh testih PS 3.0 je šibko odvisna od pasovne širine pomnilnika in teksturiranja, vendar je koda zapletena, s čimer se zelo dobro spopadata tako arhitektura Nvidia kot najnovejša skalarna arhitektura AMD. Ti testi so med prvimi, kjer opazimo očitno izboljšanje učinkovitosti in največjo pozitivno razliko med prejšnjo in najnovejšo arhitekturo AMD v hitrosti.

Pa dajmo številke, da ne bomo neutemeljeni. Predstavljeni novi Radeon HD 7970 je več kot dvakrat hitrejši od predhodnika in 60-70 % hitrejši od Geforce GTX 580, o čemer si še pred kratkim ne bi upali niti pomisliti. Navsezadnje so bile rešitve Nvidia vedno nedvomno vodilne v tem paru testnih nalog, vendar so se jim grafične kartice, ki temeljijo na Caymanu, lahko približale in najhitrejši Tahiti je končno presegel svojega konkurenta.

Direct3D 10: PS 4.0 pixel shader testi (teksturiranje, zanka)

Druga različica RightMark3D je vključevala dva znana testa PS 3.0 pod Direct3D 9, ki sta bila prepisana za DirectX 10, ter še dva nova testa. Prvi par je dodal možnost omogočanja samosenčenja in supervzorčenja senčil, kar dodatno poveča obremenitev video čipov.

Ti testi merijo zmogljivost senčilnikov pikslov z zanko z velikim številom vzorcev teksture (do nekaj sto vzorcev na slikovno piko v najtežjem načinu) in relativno majhno obremenitvijo ALU. Z drugimi besedami, merijo hitrost pridobivanja teksture in učinkovitost razvejanja v senčniku slikovnih pik.

Prvi test senčilnih pikslov bo Fur. Pri najnižjih nastavitvah uporablja 15 do 30 vzorcev teksture iz višinske karte in dva vzorca iz glavne teksture. Podrobnosti učinka - način "High" poveča število vzorcev na 40-80, vključitev supervzorčenja "shader" - do 60-120 vzorcev, način "High" skupaj s SSAA pa je označen z največjo "resnostjo" - od 160 do 320 vzorcev z višinske karte.

Najprej preverimo načine brez omogočenega supervzorčenja, so razmeroma preprosti, razmerje rezultatov v načinih »Nizko« in »High« pa naj bi bilo približno enako.

Učinkovitost tega testa je odvisna od števila in učinkovitosti TMU-jev ter od učinkovitosti izvajanja kompleksnih programov. V varianti brez supervzorčenja imata efektivna stopnja polnjenja (ROP zmogljivost) in pomnilniška pasovna širina dodaten vpliv na zmogljivost. Rezultati pri nivoju podrobnosti "High" so približno poldrugi krat nižji kot pri "Low", kot bi moralo biti v teoriji, pri najhitrejših rešitvah pa je razlika nekoliko nižja.

Prej so bile pri testih postopkovnega krzna z velikim številom pridobivanja teksture Nvidijine rešitve opazno močnejše, vendar se je od prejšnje generacije AMD-ja razlika začela zožiti. Kaj se je zgodilo z Radeon HD 7970? Odličen rezultat - novi AMD je spet hitrejši od dvočipne plošče prejšnje generacije, enočipna HD 6970 pa dvakrat hitrejša, kar jasno kaže na povečanje učinkovitosti nove arhitekture Južnih otokov. Ja, in rešitve Nvidia so zaostajale, celo GTX 590 z dvojnim čipom je slabša od danes predstavljenega vrhunskega modela Radeon HD 7970.

Oglejmo si rezultat istega testa, vendar z vklopljenim supervzorčenjem "shader", kar štirikrat poveča delo: morda se bo v tej situaciji kaj spremenilo in bo pasovna širina pomnilnika s hitrostjo polnjenja imela manjši učinek:

Omogočanje supervzorčenja za štirikrat poveča teoretično obremenitev, rešitve Nvidia pa so v primerjavi z AMD-jevimi grafičnimi karticami vedno slabše. Zdaj je razlika v učinkovitosti te naloge še bolj očitna in novi HD 7970 je 2,5-krat hitrejši od HD 6970! Geforce GTX 580 je zaradi novega izdelka izgubil približno enako količino.Povsem naravno je, da je celo HD 6990 ostala daleč zadaj, nova plošča pa je okrepila svoje vodstvo, a kaj ...

Drugi test senčnika DX10 meri zmogljivost izvajanja kompleksnih senčil pikslov z zanko z velikim številom pridobivanja teksture in se imenuje Steep Parallax Mapping. Pri nizkih nastavitvah uporablja 10 do 50 vzorcev teksture iz višinske karte in tri vzorce iz glavnih tekstur. Ko vklopite močan način s samosenčenjem, se število vzorcev podvoji, supervzorčenje pa to število štirikrat. Najbolj zapleten testni način s supervzorčenjem in samosenčenjem izbere od 80 do 400 vrednosti teksture, torej osemkrat več kot preprost način. Najprej preverimo preproste možnosti brez supervzorčenja:

Drugi test senčnika Direct3D 10 slikovnih pik je s praktičnega vidika nekoliko bolj zanimiv, saj se v igrah pogosto uporabljajo različice preslikave paralakse, težke različice, kot je naše strmo preslikavo paralakse, pa se uporabljajo v številnih projektih, na primer v igrah serije Crysis in Lost Planet. Poleg tega lahko v našem testu poleg supervzorčenja vklopite samosenčenje, ki približno podvoji obremenitev video čipa, ta način se imenuje "High".

Ta grafikon je podoben prejšnjemu, ne da bi vključeval SSAA, vendar je položaj Nvidie še nekoliko oslabel in Radeon HD 6990 je skoraj dohitel danes predstavljeni model. V posodobljeni različici testa D3D10 brez supervzorčenja HD 7970 kaže odličen rezultat, ki občutno prekaša tako HD 6970 kot GTX 580 in celo GTX 590. več kot krat počasnejši od novega modela) zaostajata. Poglejmo, kaj bo spremenilo vključitev supervzorčenja, saj lahko povzroči velik padec zmogljivosti na ploščah Nvidia.

Ko sta omogočena supervzorčenje in samosenčenje, postane naloga še težja, kombinirana vključitev dveh možnosti hkrati poveča obremenitev kartic za skoraj osemkrat, kar povzroči velik padec zmogljivosti. Razlika med indikatorji hitrosti preizkušenih grafičnih kartic se je spremenila, vpliva tudi vključitev supervzorčenja, kot v prejšnjem primeru - kartice AMD so izboljšale svojo zmogljivost v primerjavi z rešitvami Nvidia.

In zdaj je Radeon HD 7970 spet edini vodilni v primerjavi, saj kaže višje rezultate kot HD 6990. Starejše matične plošče z enim čipom so daleč zadaj, skupaj z Geforce GTX 580. In le dražje možnosti z dvema čipoma od AMD in Nvidia so sposobni vsaj nekaj nato približati novi grafični kartici. Na splošno lahko glede na dva testa senčil D3D10 sklepamo, da se nova arhitektura AMD in njen predstavnik na čipu Tahiti odlično spopadata z "shaderskimi" nalogami, celo bolje kot tradicionalno močni konkurenti iz Nvidie.

Direct3D 10: PS 4.0 Pixel Shader Benchmarks (računalništvo)

Naslednjih nekaj testov senčilnih pikslov vsebuje najmanjše število pridobitev teksture, da se zmanjša vpliv zmogljivosti TMU. Uporabljajo veliko število aritmetičnih operacij in natančno merijo matematično zmogljivost video čipov, hitrost izvajanja aritmetičnih navodil v senčniku slikovnih pik.

Prvi matematični test je Mineral. To je zapleten proceduralni test teksturiranja, ki uporablja samo dva vzorca podatkov teksture in 65 navodil sin in cos.

Rezultati ekstremnih matematičnih testov običajno ustrezajo razliki v frekvencah in številu izvedbenih enot, vendar z določenim vplivom različne učinkovitosti njihove uporabe. Vse najnovejše arhitekture AMD imajo v takih primerih izjemno prednost pred konkurenčnimi grafičnimi karticami Nvidia, kar pojasnjuje rezultate testov, v katerih se rešitve AMD ponovno izkažejo za bistveno bolj produktivne.

Rešitve se nahajajo približno po teoriji, vendar z nekaj izjemami. V praksi so bile odkrite nekatere nianse, povezane z različno učinkovitostjo. Teoretično bi morala biti GeForce GTX 580 več kot dvakrat (2,4-krat) počasnejša od novega modela Radeon HD 7970, v praksi pa je razlika le 80 %, kar je precej manj. Da, in v primerjavi s HD 6970 se pojavljajo vprašanja o optimizaciji nove arhitekture in gonilnikov za ta test. S teoretično računsko prednostjo 40 % je nova plošča AMD le 28 % hitrejša od prejšnje HD 6970 in še manjša razdalja med njo in zelo staro HD 5870, ki temelji na arhitekturi VLIW5. Ali je test res bolj primeren za VLIW (predvsem za VLIW5), ali pa so krivi surovi gonilniki.

Obstaja še ena razlaga – morda je na rezultate plošč HD 7970 HD 6970 v tem testu vplivala tehnologija PowerTune, ki je znižala frekvence, ko je bila dosežena meja porabe energije. Vendar se vse to v primerjavi s konkurentom ne spremeni veliko, saj je tudi draga dvočipna Geforce GTX 590 dosegla le raven HD 6970 in HD 5870. In enočipna GTX 580 je daleč zadaj.

Oglejmo si drugi test izračunov senčil, ki se imenuje Fire. Za ALU je težji in v njem je samo en pridobivanje teksture, število navodil sin in cos pa se je podvojilo, na 130. Poglejmo, kaj se je spremenilo z naraščajočo obremenitvijo:

Vidimo skoraj identično prejšnjemu grafikonu, razen absolutnih številk. Tokrat so vsi grafični procesorji ostali približno na istih pozicijah, le da sta grafični kartici, ki temeljijo na Cayman in Cypress, zamenjali mesta – zdaj je novejši model nekoliko hitrejši, a ne veliko. Čeprav še vedno ni strogega ujemanja s teoretičnimi številkami za največjo zmogljivost, so njihovi rezultati še vedno blizu suhi teoriji. Razlika med HD 7990 in HD 6970 se je nekoliko povečala.

Sicer pa na grafikonu nismo našli nič novega. Hitrost upodabljanja v tem testu je omejena izključno z zmogljivostjo senčilnih enot in njihovo učinkovitostjo, tako da je HD 6990 z dvema čipoma ponovno postal nedvomno vodilni, današnji AMD-ov izdelek pa mu sledi na spodobni razdalji. Obe plošči Geforce sta slabši tudi od zastarelega modela iz družine Radeon HD 5800, a tokrat ostaja prednost rešitev AMD nekoliko manjša kot pri primerjavi teoretičnih številk, kar spet kaže na slabšo optimizacijo oziroma vpliv PowerTune.

Direct3D 10: Testi senčil geometrije

V RightMark3D 2.0 sta dva testa hitrosti senčil geometrije, prva možnost se imenuje "Galaxy", tehnika je podobna "točkovnim spritom" iz prejšnjih različic Direct3D. Animira sistem delcev na GPU, geometrijski senčnik iz vsake točke ustvari štiri oglišča, ki tvorijo delec. Podobni algoritmi bi morali biti široko uporabljeni v prihodnjih igrah DirectX 10.

Sprememba ravnotežja pri testih senčil geometrije ne vpliva na končni rezultat upodabljanja, končna slika je vedno popolnoma enaka, spreminjajo se le metode obdelave scene. Parameter "GS load" določa, v katerem senčniku se izvajajo izračuni - v točki ali geometriji. Število izračunov je vedno enako.

Oglejmo si prvo različico testa "Galaxy" z izračuni v senčniku oglišč za tri stopnje geometrijske kompleksnosti:

Razmerje hitrosti z različno geometrijsko kompleksnostjo prizorov je približno enako za vse rešitve, zmogljivost ustreza številu točk, z vsakim korakom je padec FPS približno dvakrat. Naloga sodobnih grafičnih kartic ni pretežka, zmogljivost pa je omejena predvsem s hitrostjo obdelave geometrije, pa tudi s pasovno širino/zapolnitvijo pomnilnika (v okviru rešitev enega proizvajalca).

V tem testu naj bi se pokazale izboljšane zmogljivosti za obdelavo geometrije Južnih otokov in tako so se pokazale. Nova grafična kartica AMD je v primerjavi z vsemi dosedanjimi rešitvami podjetja res veliko hitrejša pri geometrijskih izračunih. Čeprav je AMD dal do 4-krat večjo rast, se je v tem testu geometrijska zmogljivost povečala za približno 1,5-2-krat. Posledično se je izkazala, da je grafična kartica z enim čipom približno na enaki ravni kot model Radeon HD 6990 z dvojnim čipom na GPU prejšnje generacije.

Tako občutno izboljšanje je pripeljalo do dejstva, da je Tahiti skoraj dohitel Nvidijino vrhunsko grafično kartico, čeprav bi morala biti v nekaterih pogojih še bolj učinkovita pri izvajanju geometrijskih senčil. Prej so bile grafične kartice Nvidia približno dvakrat hitrejše od primerljivih konkurenčnih kartic, zdaj pa ni nobene razlike. Poglejmo, kako se situacija spremeni pri prenosu dela izračunov v geometrijski senčnik:

Ko se je obremenitev v tem testu spremenila, so številke za rešitve Nvidia in večino plošč AMD ostale skoraj nespremenjene. Le nova grafična kartica iz družine HD 7900 se je v tem testu slabo odzvala na spremembo parametra obremenitve GS, ki je odgovoren za prenos dela izračunov v geometrijski senčnik. Zato je plošča pokazala nekoliko višji rezultat kot v prejšnjem diagramu. Poglejmo, kaj se bo spremenilo v naslednjem testu, ki prevzame veliko obremenitev geometrijskih senčil.

"Hyperlight" je drugi test geometrijskih senčil, ki dokazuje uporabo več tehnik hkrati: instanciranje, izhod toka, obremenitev medpomnilnika. Uporablja dinamično ustvarjanje geometrije z risanjem v dva medpomnilnika, kot tudi novo funkcijo v Direct3D 10 – izhod toka. Prvi senčnik generira smer žarkov, hitrost in smer njihove rasti, ti podatki se shranijo v medpomnilnik, ki ga drugi senčnik uporablja za upodabljanje. Za vsako točko žarka je v krogu zgrajenih 14 oglišč, skupaj do milijon izhodnih točk.

Za generiranje "žarkov" se uporablja nova vrsta programa za senčenje, s parametrom "GS load" nastavljenim na "Heavy" - tudi za njihovo risanje. To pomeni, da se v "Uravnoteženem" načinu geometrijski senčniki uporabljajo samo za ustvarjanje in "razraščanje" žarkov, izhod se izvaja z "instanciranjem", v načinu "Heavy" pa je v izhod vključen tudi geometrijski senčnik . Poglejmo si najprej preprost način:

Relativni rezultati v različnih načinih spet približno ustrezajo spremembam obremenitve: v vseh primerih se zmogljivost dobro skalira in je blizu teoretičnih parametrov, po katerih bi morala biti vsaka naslednja raven štetja poligonov manj kot dvakrat počasnejša.

V tem testu bi morala biti hitrost upodabljanja omejena z geometrijsko zmogljivostjo, nova arhitektura podjetja AMD pa se dobro obnese, celo nekoliko prekaša svojega tekmeca pred Geforce GTX 580! Obe plošči z dvojnim čipom sta tukaj pokazali napačne rezultate, zato ju ne bomo mogli primerjati z njima. Toda HD 7970 je 40-50 % hitrejši od svojega predhodnika, HD 6970, kar je očitno posledica arhitekturnih sprememb v GPU. Odlični rezultati zemljevida na Tahitiju jasno pričajo o optimizacijah, izvedenih v enotah za obdelavo geometrijskih podatkov v novem čipu.

Številke bi se morale zelo spremeniti v naslednjem diagramu, v testu z bolj aktivno uporabo geometrijskih senčil. Zanimivo bo tudi med seboj primerjati rezultate, pridobljene v načinih "Uravnoteženo" in "Heavy".

Toda tu Radeon HD 7970 ni uspel doseči rekorda, navsezadnje je razlika med čipi AMD s tradicionalnim grafičnim cevovodom (vključno s Cayman s Tahitijem z dvema rasterizatorjema) in čipi z arhitekturo Fermi, ki ima vzporedno obdelavo geometrije, jasno opazna . In rezultati Geforce GTX 580, ki temelji na čipu GF110, so tako dobri, da za 35-40% prekaša najboljše AMD-jeve rešitve (in to je danes objavljen model).

Čeprav so zmogljivosti novega vrhunskega čipa AMD glede obdelave geometrije in hitrosti izvajanja geometrijskih senčil v primerjavi s prejšnjimi grafičnimi karticami podjetja očitno narasle, prva rešitev, ki temelji na čipu Tahiti, kaže 22-28 % višje rezultate v te teste kot rešitve, ki temeljijo na Kajmanu. Verjetno so se inženirji AMD odločili, da bo takšna optimizacija trikotnikov in geometrijskih procesnih enot dovolj.

Direct3D 10: hitrost pridobivanja teksture iz senčil oglišč

Preizkusi »Pridobivanje teksture vertex« merijo hitrost velikega števila pridobitev teksture iz senčnika oglišč. Testi so si v bistvu podobni, zato bi moralo biti razmerje med rezultati kart pri testih "Zemlja" in "Valovi" približno enako. Oba testa uporabljata preslikavo premika, ki temelji na podatkih vzorčenja teksture, edina pomembna razlika je v tem, da test "Waves" uporablja pogojne skoke, medtem ko test "Earth" ne.

Razmislite o prvem preizkusu "Zemlja", najprej v načinu "Effect detail Low":

Prejšnje študije so pokazale, da na rezultate tega testa hkrati vpliva veliko stvari: tako hitrost teksturiranja kot pasovna širina pomnilnika. In rezultate grafičnih kartic pogosto omejuje kakšna ovira - samo poglejte primerjavo dvočipne GTX 590 in enočipnega analoga - med njima skoraj ni razlike. Čeprav je HD 6990 dvakrat hitrejši od HD 6970.

In nova kartica AMD iz družine Radeon HD 7970 je pokazala zelo dobre rezultate in je skoraj dohitela vodilno HD 6990. Kar se tiče konkurentov z enim čipom, je najboljša v vseh treh načinih. Prednost pred HD 6970 se je gibala od 25 % do 75 %, odvisno od načina. Poglejmo si zmogljivost v istem testu s povečanim številom pridobivanja teksture:

Toda tokrat se je relativni položaj kartic na diagramu opazno spremenil, kar še posebej velja za trdi način. Pri majhnem številu poligonov je hitrost upodabljanja v tem testu odvisna od pasovne širine pomnilnika, zato so bile plošče AMD tako močne v prejšnjem diagramu.

Toda v težkih načinih se je razlika med Nvidijino kartico z enim čipom in novo kartico AMD zmanjšala in tekmujeta med seboj v dokaj tesnem boju. Starejša dvočipna grafična kartica družine Radeon HD 6900 prekaša vse druge rešitve in je v primerjavi z njimi najboljša, čeprav se ji Geforce GTX 590 približuje v težkem načinu.Nova enočipna HD 7970 znova prekaša svojega predhodnika do 70 %, kar lahko kaže na močan vpliv pasovne širine pomnilnika.

Oglejmo si rezultate drugega testa pridobivanja teksture iz senčilnih točk. Test Waves ima manj vzorcev, vendar uporablja pogojne skoke. Število vzorcev bilinearne teksture v tem primeru je do 14 ("Detajl učinka nizek") ali do 24 ("Detajl učinka visok") na točko. Kompleksnost geometrije se spreminja podobno kot prejšnji test.

Rezultati drugega testa teksturiranja oglišč "Waves" so popolnoma drugačni od tistih, ki smo jih videli v prejšnjih diagramih. V tem testu sta grafični kartici AMD in Nvidia, razen HD 6990 in HD 7970, pokazali zelo tesne rezultate, kar je spet mogoče pripisati omejitvi pasovne širine video pomnilnika, saj je ta kazalnik blizu vseh predstavljenih grafičnih kartic.

Toda novi model iz družine Južnih otokov je uspel izstopati, v težkih primerjalnih razmerah je skoraj dohitel dvočipno HD 6990, ki je postal najboljša med vsemi grafičnimi karticami. Razlika med karticami, ki temeljijo na grafičnih procesorjih Cayman in Tahiti, je bila spet 25-70 % v korist novejše rešitve. Razmislite o drugi različici istega testa:

In potem so se zgodile spremembe, podobne tistim, ki smo jih videli prej – grafične kartice Nvidia so se »pogreznile« le v lahkem načinu, večina rešitev AMD pa naenkrat. Vendar to ploščam kalifornijske družbe ni omogočilo, da bi dohitele novi izdelek družine Radeon 7900. Ki je, mimogrede, v srednjem in težkem načinu prehitel vse in je le enkrat ustopil pred HD 6990 z dvojnim čipom.

V načinu nizkega poligona razlika med rešitvami ni tako velika, v srednjem in težkem načinu pa so slabše stare rešitve AMD, sledijo pa jim plošče Nvidia (dvočipna je le malo hitrejša od enoprostorne). čip GTX 580), HD 6990 in HD 7970. Plošča družine HD 7900, ki je bila danes objavljena na testih izbire vrhov, se je izkazala za odlično, precej pred konkurenčnimi grafičnimi karticami Nvidia in njenimi predhodniki istega proizvajalca.

3DMark Vantage: preizkusi funkcij

Kot vedno nam lahko sintetični testi iz paketa 3DMark Vantage pokažejo nekaj, kar smo prej zamudili. Testi funkcij v tem testnem nizu so omogočeni za DirectX 10 in so zanimivi po tem, da se razlikujejo od naših. Ob analizi rezultatov nove grafične kartice Radeon HD 7970 v tem paketu bomo lahko potegnili nekaj novih in uporabnih zaključkov, ki so se nam pri testih družine RightMark izmuznili.

Funkcijski preizkus 1: Polnjenje teksture

Prvi test je test hitrosti pridobivanja teksture. Uporablja se za polnjenje pravokotnika z vrednostmi, prebranimi iz majhne teksture z uporabo več koordinat teksture, ki spremenijo vsak okvir.

Čeprav Futuremarkov test še vedno ne pokaže teoretično možne stopnje hitrosti pridobivanja teksture, je učinkovitost tako AMD kot Nvidia grafičnih kartic pri njem še vedno opazno višja kot pri nas iz RightMarka. Zato pri tem testu teksture dobimo nekoliko drugačno razmerje rezultatov, ki je bližje resnici.

Prva grafična kartica iz nove družine AMD kaže rezultat blizu ustreznega teoretičnega parametra in se z delom spopada učinkoviteje kot prejšnja generacija. Radeon HD 7970 je boljši od HD 6970 za več kot 50 %, čeprav je teoretična razlika le 40 %. Najverjetneje se teksturne enote Tahitija uporabljajo učinkoviteje zaradi izboljšav v sistemu pomnilnika in predpomnilnika, kar je povzročilo povečan rezultat.

Seveda je novi model z enim čipom zaostajal za vodilnim - HD 6990 z dvojnim čipom, vendar tega ni bilo pričakovati. In vendar je jasno razvidno, da se je teksturna zmogljivost grafičnega čipa Tahiti znatno povečala v primerjavi s Caymanom. No, GTX 580 glede na hitrost teksturiranja izgubi pred novim izdelkom kar 2,3-krat. Tudi kartica Nvidia z dvojnim GPU dohiti samo HD 6970.

Funkcijski preizkus 2: Barvno polnjenje

To je test stopnje polnjenja. Uporablja zelo preprost senčnik slikovnih pik, ki ne omejuje zmogljivosti. Interpolirana vrednost barve je zapisana v medpomnilnik zunaj zaslona (cilj upodabljanja) z uporabo alfa mešanja. Uporablja 16-bitni medpomnilnik FP16 zunaj zaslona, ​​ki se najpogosteje uporablja v igrah, ki uporabljajo upodabljanje HDR, zato je ta test precej pravočasen.

Situacija v testu zmogljivosti enote ROP se zelo razlikuje od testa teksturiranja. Številke za ta podtest iz 3DMark Vantage prikazujejo zmogljivost enot ROP, vendar z vplivom količine pasovne širine video pomnilnika (tako imenovana "efektivna stopnja polnjenja"). In tukaj novi model HD 7970 kaže odličen rezultat, saj zaostaja le za dvema vrhunskima video karticama AMD in Nvidia iz prejšnjih generacij, ki imata vgrajena dva GPU-ja.

Kaj pa učinkovitost uporabe ROP blokov, s katerimi se je AMD pohvalil? Dejansko samo 32 ROP v novem čipu Tahiti sploh ne omejuje hitrosti upodabljanja, tudi v specializiranem testu. Opažamo pa nekoliko višjo učinkovitost ROP in hitrejšo stopnjo polnjenja pri novi grafični kartici AMD v primerjavi s starejšimi modeli. Razlika med HD 7970 in HD 6970 je več kot 50 %, kar jasno kaže na večji vpliv pasovne širine in ne na čisto zmogljivost ROP enot.

Kar se tiče primerjave z Nvidio, tudi tukaj razlika v hitrosti (35 %) ustreza teoretični razliki v pasovni širini pomnilnika (36 %) in ne čisti hitrosti blokov ROP. Izkazalo se je, da je bilo 32 takšnih blokov na Kajmanu preprosto odveč in njihove zmogljivosti niso bile nikoli v celoti izkoriščene.

Funkcijski preizkus 3: preslikava okluzije paralakse

Eden najbolj zanimivih testov funkcij, saj se ta tehnika že uporablja v igrah. Nariše en štirikotnik (natančneje dva trikotnika) s posebno tehniko Parallax Occlusion Mapping, ki posnema kompleksno geometrijo. Uporabljajo se operacije sledenja žarkov, ki zahtevajo veliko virov, in zemljevid globine visoke ločljivosti. Tudi ta površina je zasenčena z uporabo težkega Straussovega algoritma. To je test zelo zapletenega in težkega senčnika slikovnih pik za video čip, ki vsebuje številne pridobitve teksture med sledenjem žarkov, dinamičnim razvejanjem in zapletenimi izračuni Straussove osvetlitve.

Ta test se od drugih podobnih razlikuje po tem, da rezultati v njem niso odvisni le od hitrosti matematičnih izračunov, učinkovitosti izvajanja veje ali hitrosti pridobivanja teksture, ampak od vsega po malem. Za doseganje visoke hitrosti je tu pomembno ravnovesje blokov GPU, zelo opazno vpliva tudi na hitrost in učinkovitost razvejanja v senčnikih.

Primerjalni rezultati grafičnih kartic AMD v diagramu so na splošno podobni tistim, ki smo jih videli v testu zmogljivosti teksture pri 3DMark Vantage, le da je novi Radeon HD 7970 tudi pri tej nalogi očitno učinkovitejši, saj je spet skoraj dohitel Dual-GPU HD 6990 - odličen rezultat! Plošče Nvidia so v tem primeru dobile nekaj povečanja zmogljivosti, kar potrjuje sklep, da na rezultate tega testa ne vpliva samo zmogljivost teksture.

Tako se AMD-jev novi model dobro obnese in precej popusti pred ploščo z dvema čipoma, ki temelji na dveh Caymanovih. Svojega predhodnika z enim čipom je prehitel za 66 %. Ta številka ne ustreza pospešku od Kajmana do Tahitija v nobenem od teoretičnih parametrov in lahko kaže na izboljšanje učinkovitosti izvajanja zapletenih izračunov razvejanja. Tudi prej veljavni dober rezultat Geforce GTX 580 je dvakrat slabši kot pri novem AMD. Pravzaprav so se vse grafične kartice tega proizvajalca izkazale za hitrejše od vrhunskega modela linije Geforce GTX 500, ki temelji na enem čipu.

Funkcijski preizkus 4: GPU tkanina

Test je zanimiv po tem, da izračuna fizične interakcije (imitacija tkanine) z uporabo video čipa. Uporabljena je simulacija oglišč z uporabo kombiniranega delovanja senčil oglišč in geometrije z več prehodi. Uporabite stream out za prenos točk iz enega simulacijskega prehoda v drugega. Tako se testira zmogljivost izvajanja senčilnih in geometrijskih senčil ter hitrost iztoka.

Hitrost upodabljanja v tem testu je odvisna tudi od mnogih drugih parametrov. Tu sta glavna dejavnika zmogljivost obdelave geometrije in učinkovitost geometrijskih senčil. Zato je povsem logično, da se grafične kartice Nvidia v tej aplikaciji počutijo odlično, precej pred svojimi konkurenti.

In tudi danes predstavljeni Radeon HD 7970, kljub jasnemu izboljšanju zmogljivosti v primerjavi s HD 6970, tukaj ni mogel konkurirati enočipnemu Geforce GTX 580 in je bil nekoliko slabši od njega. To je eden tistih geometrijskih testov, ki pokaže prednost najnovejših grafičnih kartic HD 6900 pred prejšnjimi linijami, v katerih so povečali hitrost obdelave geometrije in geometrijskih senčil. Radeon HD 7970 je izboljšal rezultat še za 35 %, vendar to ni bilo dovolj – rešitve Nvidia še naprej vodijo na tem testu. Čeprav ugotavljamo, da je novi model še vedno bistveno izboljšal AMD-jev položaj v geometrijskih testih.

Funkcijski preizkus 5: GPU delci

Test za fizično simulacijo učinkov na podlagi sistemov delcev, izračunanih z uporabo video čipa. Uporablja se tudi simulacija oglišč, vsako točko predstavlja en sam delec. Stream out se uporablja za enak namen kot v prejšnjem testu. Izračunanih je več sto tisoč delcev, vsi so animirani posebej, izračunani so tudi njihovi trki z višinsko karto.

Podobno kot pri enem od naših testov RightMark3D 2.0 so delci narisani z uporabo geometrijskega senčnika, ki ustvari štiri oglišča iz vsake točke, da tvori delec. Toda test najbolj obremeni bloke senčil z izračuni vrhov, testiran je tudi stream out.

Rezultati naslednjega testa iz paketa 3DMark Vantage so podobni tistim, ki smo jih videli v prejšnjem diagramu, vendar je hitrost obdelave geometrije v njem postala še pomembnejša. In tako so grafične kartice Nvidia potisnile še naprej in za seboj pustile celo pošast z dvema čipoma – Radeon HD 6990. Aja, dejstvo je – celo GTX 580 je prehitela vse plošče AMD, vključno s povsem novim modelom, ki temelji na GPU Tahiti.

Aja, čeprav je plošča, ki temelji na novem čipu, pokazala močnejši rezultat v primerjavi z rešitvami na osnovi Cayman in Cypress, je Geforce zaostal. Razlika med HD 7970 in HD 6970 v tej primerjavi je bila nekaj več kot 30 %, kar kaže na jasen učinek hitrosti ALU. V sintetičnih testih simulacije tkanin in delcev 3DMark Vantage, ki aktivno uporabljajo geometrijske senčnike, rešitve AMD še naprej zaostajajo za konkurenčnimi grafičnimi karticami z zelo visoko hitrostjo obdelave geometrije.

Funkcijski preizkus 6: Perlinov hrup

Zadnji preizkus lastnosti paketa Vantage je matematično intenziven test video čipa, ki izračuna več oktav algoritma Perlinovega šuma v senčniku slikovnih pik. Vsak barvni kanal uporablja lastno funkcijo šuma za povečanje obremenitve video čipa. Perlinov hrup je standardni algoritem, ki se pogosto uporablja pri proceduralnem teksturiranju in uporablja veliko matematike.

Zanimivo je, da smo pri matematičnem testu iz paketa Futuremark, ki prikazuje najvišjo zmogljivost video čipov pri omejenih nalogah, videli povsem drugačno sliko v primerjavi s podobnimi testi iz našega testnega paketa. Učinkovitost rešitev, prikazanih na diagramu, le zelo približno ustreza tistemu, kar bi bilo treba dobiti po teoriji, in se tudi razlikuje od tistega, kar smo videli prej pri matematičnih testih iz paketa RightMark 2.0. Na primer, jasno je razvidno, da se je nova grafična kartica v tem testu precej približala teoretični hitrosti v primerjavi z GPU karticami z arhitekturo VLIW.

Poglejmo si razloge. Nekoč HD 6970 ni povečal največje matematične zmogljivosti HD 5870, vendar samo to ne pojasni zaostanka Caymana. Razlog je lahko tako v nižji učinkovitosti arhitekture VLIW4, kot tudi v pametnem sistemu za upravljanje porabe energije, ki je ob doseženem nastavljenem pragu porabe energije »ubil« taktno frekvenco in zmogljivost rešitev.

Vendar to ni vplivalo na HD 7970. Najverjetneje je razlog le v skalarni arhitekturi novega čipa. Ker razmerje številk uspešnosti v testu in teoretičnih to jasno kaže. Teoretično ima HD 6970 0,7 matematične moči nove kartice, a se je na tem testu izkazala le za 0,56. Približno enako razliko smo dobili za druge plošče AMD. Toda če primerjamo GTX 580 in HD 7970, ki imata skalarno arhitekturo, je teoretično razmerje 0,42 (Tahiti je več kot dvakrat hitrejši), praktično razmerje pa je tudi 0,42. To pomeni, da je učinkovitost uporabe razpoložljivih ALU za te čipe različnih proizvajalcev popolnoma enaka! Za razliko od Cayman in Cypress, ki imata arhitekturo VLIW.

V vsakem primeru nova plošča AMD prekaša oba svoja tekmeca iz Nvidie z veliko razliko, Nvidia pa mora očitno drastično povečati svojo matematično moč v prihodnjih rešitvah. Medtem se kaže običajna slika – grafične kartice Geforce kažejo slabe rezultate v primerih, ko se preprosta in intenzivna matematika na karticah Radeon izvaja veliko hitreje. In izstop z Južnega otoka je položaj le še poslabšal.

Direct3D 11: računalniški senčniki

Za testiranje novih rešitev AMD v aplikacijah, ki uporabljajo nove funkcije DirectX 11, kot so teselacija in računalniški senčniki, smo uporabili vzorce iz SDK-jev in demonstracij Microsofta, Nvidie in AMD.

Najprej si oglejmo teste, ki uporabljajo senčnike Compute. Njihov videz je ena najpomembnejših novosti v najnovejših različicah API-ja DX, uporabljajo se že v sodobnih igrah za izvajanje različnih nalog: naknadna obdelava, simulacije ipd. Prvi test prikazuje primer HDR upodabljanja s preslikavo tonov. iz DirectX SDK, z naknadno obdelavo, ki uporablja slikovne in računalniške senčnike.

To morda ni najboljši primer za računalniške senčnike, vendar precej jasno kaže razliko v zmogljivosti. Med izračuni pri računanju in senčnikih slikovnih pik za grafične kartice AMD skoraj ni razlike, pri Nvidii pa je piksel nekoliko hitrejši.

AMD Radeon HD 6970 se je izkazal za hitrejšega od svojega predhodnika HD 5870 in je deloval na ravni Geforce GTX 580, vendar je danes predstavljena HD 7970 daleč pred vsemi in postane vodilna (odločili smo se, da ne bomo uporabljali dveh čipov video kartice v tej sintetiki). GTX 560 Ti smo vzeli predvsem za geometrijske teste, pa tudi za oceno razlike med rešitvami iz različnih cenovnih segmentov.

Tako je napovedana plošča, ki temelji na novem čipu Tahiti, 40% pred analogno na osnovi Caymana, kar v celoti ustreza razliki v teoretični zmogljivosti računalniških enot. Po drugi strani je prednost pred konkurenčnim GTX 580 30-40% (odvisno od vrste senčilnega programa), kar je očitno nižje, kot je teoretično možno. GTX 560 Ti močno zaostaja, več kot dvakrat.

Drugi test računalniškega senčnika je prav tako vzet iz Microsoft DirectX SDK in prikazuje računski problem gravitacije N-body (N-body), simulacijo dinamičnega sistema delcev, ki je podvržen fizičnim silam, kot je gravitacija.

Rezultati tega testa so zelo nenavadni, za zastarele rešitve AMD so podobni številkam iz matematičnega testa 3DMark Vantage - Cypress se je izkazal za hitrejši od Caymana. Kljub veliki teoretični premoči v največjih številkah je AMD-jeva najhitrejša grafična kartica – danes predstavljena nova Radeon HD 7970 – le 21 % pred vrhunsko rešitvijo Nvidia. In tudi GTX 560 Ti ne zaostaja veliko. Stari modeli družin HD 6900 in HD 5800 kažejo rezultate, ki so blizu rezultatom Geforce GTX 580.

Predvsem pa nas zanima razlika med rezultati odločitev na Kajmanu in Tahitiju in v tem primeru vidimo prednost svežega modela, ki znaša 36 %. To je nekoliko manj od teoretične razlike med tema modeloma, a še vedno blizu. Zakaj obe kartici nista izstopali v ozadju zelo stare HD 5870? Morda je kriva zmanjšana frekvenca PowerTune ali pomanjkanje optimizacije gonilnikov za novo arhitekturo. Poglejmo, ali bo Tahiti končno pokazal občuten pospešek pri testih teselacije.

Direct3D 11: Zmogljivost teselacije

Računalniški senčniki so zelo pomembni, vendar je glavna inovacija v Direct3D 11 še vedno strojna teselacija. Zelo podrobno smo ga obravnavali v našem teoretičnem članku o Nvidia GF100. Teselacija se že dolgo uporablja v igrah DX11, kot so STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 in druge. Nekateri od njih uporabljajo teselacijo za modele likov, drugi za simulacijo realistične vodne površine ali pokrajine.

Obstaja več različnih shem za particioniranje grafičnih primitivov (teselacija). Na primer, teselacija phong, trikotniki PN, podrazdelek Catmull-Clark. Torej je shema ploščic PN Triangles uporabljena v STALKER: Call of Pripyat in v Metro 2033 - teselacija Phong. Te metode so razmeroma hitre in enostavne za implementacijo v proces razvoja iger in obstoječe motorje, zato so postale priljubljene.

Prvi test teselacije bo primer Detail Tesellation iz ATI Radeon SDK. Izvaja ne samo teselacijo, ampak tudi dve različni tehniki obdelave pikslov za pikslo: preprosto prekrivanje normalnih zemljevidov in preslikavo okluzije paralakse. No, pa primerjajmo DX11 rešitve AMD in Nvidia v različnih pogojih:

Zanimivo je, da je preslikava okluzije paralakse (srednje črte na diagramu) na video karticah obeh proizvajalcev veliko manj učinkovita kot teselacija (spodnje črte), zmerna teselacija pa ne daje velikega padca zmogljivosti – primerjajte zgornjo in spodnjo vrstico. To pomeni, da visokokakovostna geometrijska simulacija z uporabo izračunov slikovnih pik zagotavlja še nižjo zmogljivost kot geometrija s teseliranim modelom s preslikavo premikov.

Kar zadeva zmogljivost grafičnih kartic med seboj, si najprej poglejmo tehnike slikovnih pik. V preprostem testu bumpmappinga vodi nova AMD-jeva grafična kartica, ki je premagala HD 6970 in GTX 580 za 27 % oziroma 36 %. Toda v kompleksnem podtestu za izračune slikovnih pik (spomnite se zgornjih testov preslikave paralakse) pred izdajo Caymana so bile grafične kartice Geforce hitrejše od rešitev AMD, pa tudi z omogočeno teselacijo. Z izdajo Radeon HD 6970 se je v podtestu teselacije izkazalo, da je opazno hitrejši od HD 5870, na testu z majhnim faktorjem trikotnika cepitve pa je HD 6970 prehitel celo GTX 580.

Precej bolj zanimivo je tisto, kar smo videli na grafikonu z oznako Radeon HD 7970. Teselacija tukaj ni preveč zapletena, tako da nova grafična kartica ni presegla prejšnjega modela za približno 30 %. Druga stvar je test POM. V tem podtestu je novi HD 7970 preprosto raztrgal vse druge rešitve. Prednost pred HD 6970 in GTX 580 je le malo manj kot dvojna. Še en super rezultat v testu preslikave paralakse, ki govori o visoki učinkovitosti izvajanja kompleksnih programov senčil.

Drugi test zmogljivosti teselacije bo še en primer za 3D razvijalce iz ATI Radeon SDK - PN Triangles. Pravzaprav sta oba primera vključena tudi v DX SDK, zato smo prepričani, da razvijalci iger na podlagi njih ustvarijo lastno kodo. Ta primer smo preizkusili z drugačnim faktorjem teselacije, da bi videli, koliko vpliva na celotno zmogljivost.

Toda v tem primeru že vidimo popolno primerjavo geometrijske moči rešitev AMD in Nvidia v različnih pogojih. In po našem mnenju se je izkazalo za zelo zanimivo. Močno izstopa grafična arhitektura Fermi in čip nove arhitekture Tahiti iz AMD. Seveda je to čisto sintetični test in v igrah v bližnji prihodnosti verjetno ne bodo uporabljeni ekstremni faktorji cepitve, še posebej glede na celotno večplatformo. Zanima nas arhitekturni potencial, zato rabimo »sintetiko«.

Če v svetlobnih pogojih novi Radeon HD 7970 uspešno konkurira Geforce GTX 580, ga prekaša v najlažjih načinih in enakomerno v tretjem, vendar v najtežjih pogojih z zelo velikim številom trikotnikov z grafično kartico Nvidia Geforce ki temelji na čipu GF110, je preprosto nemogoče tekmovati - pri nalogah ekstremne teselacije je veliko hitrejši od celo večkrat izboljšanih čipov AMD. Novi GPU, čeprav je ponovno zmanjšal zaostanek pred konkurentom pri opravilih obdelave geometrije, je še vedno zelo daleč od vzporednega delovanja 16 teselacijskih blokov v GF110. In celo GF114 pri največjem razmerju delitve se je izkazal za hitrejši od Tahitija.

Kljub temu, da je izgubil v najtežjih razmerah z najvišjim razmerjem delitve, se je HD 7970 s Tahitija sicer dobro obnesel, še posebej v primerjavi s Cayman in Cypress. AMD-jev novi model v načinih lahke in srednje obremenitve kaže impresivno povečanje hitrosti, razlika v primerjavi z že tako počasnim HD 6970 pa doseže 2,8-krat. Toda takšno povečanje vidimo le v skrajnem primeru in najpogosteje se izkaže od 30 do 70%. Obljubljene štirikratne razlike nismo videli, vsaj še ne.

Toda največja razlika med rešitvami podjetij je dosežena v pogojih ekstremne teselacije, ki je v igrah in merilih, ki so jim blizu, ne bo. Zato pričakujemo, da bo Tahiti znatno izboljšal AMD-jevo zmogljivost v obstoječih merilih uspešnosti teselacije, kot sta 3DMark11 in Heaven.

Oglejmo si še eno merilo uspešnosti, demo program Nvidia Realistic Water Terrain, znan tudi kot Island. Ta predstavitev uporablja teselacijo in preslikavo premikov za prikaz realističnega videza oceanske površine in terena. Izgleda odlično, to je tisto, kar manjka v trenutnih igrah:

Island ni zgolj sintetični test za geometrijsko zmogljivost, vsebuje tako kompleksne slikovne kot računalniške senčnike, takšna obremenitev pa je bližja pravim igram, ki uporabljajo vse enote GPU hkrati in ne le geometrijskih, kot v prejšnjem merilu.

Program smo preizkusili tudi s štirimi različnimi faktorji teselacije, ta nastavitev se imenuje Dynamic Tessellation LOD. In če so pri najnižjem faktorju delitve vse grafične kartice AMD naprej, potem s kompleksnostjo dela začnejo prevzeti vodilno vlogo plošče, ki temeljijo na čipih Nvidia. In s povečanjem faktorja particije in kompleksnosti scene se zmogljivost absolutno vseh Radeonov dramatično zmanjša, za razliko od konkurenčnih rešitev.

Zanimivo je obnašanje Radeon HD 7970 na testu. Takoj je jasno, da v geometrijskem cevovodu ni bilo kardinalnih sprememb (na splošno to ni bilo obljubljeno, zato ni bilo pritožb). Če je v najlažjem načinu nova kartica hitrejša od HD 6970 za 35 % in GTX 580 za 64 %, potem tudi ko je LOD nastavljen na 25, zmogljivost nove kartice pade na raven hitrosti GTX 560 Ti. Še več. Pri največjem razmerju LOD je razlika med hitrostjo Geforce GTX 580 in Radeon HD 7970 dosegla 3,5-krat!

Preverimo, ali smo dobili obljubljeno štirikratno razliko med HD 7970 in HD 6970. Ne, največji zamik Cayman GPU-ja je bil manj kot dvakrat. In pogosteje le eno in pol. Na splošno nam ni zelo jasno, kje iskati štirikratni pospešek teselacije, ostaja verjeti na besedo, da je nekje. Medtem navajamo še eno zmago za video čipe iz Nvidie - zelo dobri so pri geometrijskih testih.

Zaključki o sintetičnih testih

Na podlagi rezultatov naših sintetičnih testov najnovejše grafične kartice Radeon HD 7970, ki temelji na GPU Tahiti iz družine Južnih otokov, ter rezultatov drugih modelov grafičnih kartic, ki jih proizvajata oba proizvajalca diskretnih video čipov, lahko sklepajo, da bo novi izdelek zagotovo postal vodilni med rešitvami z enim čipom, ki so na voljo na trgu. To je le odlično nadaljevanje uspešnih linij Radeon HD 5800 in HD 6900, ki naj bi v prihodnjih mesecih resno okrepile položaj AMD.

Tahiti GPU temelji na novi arhitekturi z uporabo najnaprednejše 28nm procesne tehnologije in se zelo razlikuje od vseh prejšnjih čipov podjetja. Čeprav število nekaterih izvajalskih enot v njem ni tako naraslo (računalništvo ALU in ROP), ima novi GPU pomembne arhitekturne spremembe, katerih cilj je povečanje učinkovitosti računalništva GPU, pa tudi izboljšanje pozicij v zmogljivosti obdelave geometrijskih podatkov. Številni naši sintetični testi so pokazali, da se je računalniška učinkovitost pri kompleksnih problemih ter hitrost izvajanja teselacije in geometrijskega senčnika znatno izboljšala, čeprav ne vedno tako, kot smo pričakovali.

Z video čipi AMD se je zgodilo nekaj, kar se je zagotovo zgodilo. Enako, kar je Nvidia že minila malo prej. S premikom poudarka z grafičnega računalništva na računalništvo za splošne namene in ustreznim premikom z VLIW na skalarne arhitekture, pa tudi z dodatkom drugih pomembnih funkcij GPGPU, kot sta napredno predpomnjenje in dodajanje razporejevalnikov vsaki računalniški enoti, se poveča kompleksnost čipa. zagotovo preseže povečanje največje zmogljivosti. Se pravi, čisto v resnici se izkaže, da so prejšnje rešitve lahko učinkovitejše - čeprav so manj produktivne, se to doseže z manj truda (v obliki kompleksnosti čipa).

Pojasnimo to s primerom. Prednost Radeon HD 7970 pred istim Radeon HD 5870 v nekaterih sintetičnih testih je bila daleč od razlike v kompleksnosti GPU - navsezadnje ima Cypress natanko polovico manj tranzistorjev (2,15 proti 4,3 milijarde), pri testih pa zelo redko zaostaja toliko zadaj. Izkazalo se je, da je stari čip učinkovitejši od novega? Da, vendar samo za zastarela povsem grafična opravila! V primeru negrafičnih izračunov in številnih zapletenih 3D izračunov se je Tahiti izkazal za celo več kot dvakrat močnejši od Cypress, kar potrjuje ustrezna sintetika. GPGPU je prihodnost, naloge video čipov pa bodo še vedno bolj zapletene, tako da AMD preprosto ni imel druge poti.

Toda zahvaljujoč arhitekturnim spremembam in njenim značilnostim je grafična kartica nove serije v številnih sintetičnih testih, ki je bila nekoč "Ahilova peta" rešitev AMD, postala več kot konkurenčna, zlasti v primerjavi z neposrednim konkurentom Geforce GTX 580. , tudi ob upoštevanju višje cene. To je jasno razvidno iz skoraj vseh sintetičnih testov paketov RightMark, Vantage in primerov iz različnih SDK-jev.

Obstajale pa so tudi potencialno ... no, ne tako šibke, a premalo močne strani novega GPU-ja. Ti vključujejo ne preveliko povečanje zmogljivosti pri nekaterih matematičnih testih, pojavljajo se geometrijska vprašanja (na primer, kje je obljubljeni štirikratni pospešek?). Kljub večji kompleksnosti in površini čipa v primerjavi z istim Caymanom so rezultati modela HD 7970 včasih nižji od pričakovanih, kar ni vedno lahko razložiti. Domnevamo, da je morda krivo pomanjkanje optimizacije gonilnikov, saj je za AMD ta arhitektura popolnoma nova in zahteva skrbno in dolgotrajno poliranje. Pri nekaterih testih bi lahko odpovedal tudi sistem za upravljanje porabe energije PowerTune, ki bi lahko znižal takt pri doseganju največje porabe energije pri najzahtevnejših sintetičnih testih, kar bi preprečilo, da bi kartica pokazala pričakovano zmogljivost glede na število izvršilnih enot in njihovo taktno frekvenco.

Čeprav so se na splošno rezultati pri sintetiki izkazali za precej dobre, je še posebej razveseljivo, da so inženirji AMD zaostrili nekatere njihove šibke točke. Žal bo v trenutnih igrah veliko težje doseči tako impresivne dobičke v primerjavi z napredno sintetiko. Takoj iz več razlogov. Tudi samo zato, ker je zmogljivost v igralnih aplikacijah redko omejena s katero koli lastnostjo grafične kartice, za razliko od sintetike, in s tako radikalno spremembo grafične arhitekture, je treba gonilnike še vedno optimizirati in optimizirati. Poleg tega tudi sodobne igre le redko uporabljajo vse zmogljivosti vrhunskih računalniških grafičnih kartic. Pogosto so omejeni s hitrostjo pridobivanja teksture in efektivno hitrostjo polnjenja (pasovna širina video pomnilnika), v takih pogojih pa se tako zapleteni čipi ne morejo popolnoma odpreti. Počakati bomo morali na zmogljive ekskluzivne računalnike ali naslednjo generacijo igralnih konzol.

Predvidevamo, da bodo rezultate Radeon HD 7970 na sintetičnih testih potrdile ustrezne številke v "igralnem" delu našega gradiva. V igrah naj bi nova HD 7970 prekašala vse konkurente in Geforce GTX 580 za vsaj 30 % ali celo več. Verjetno se bo izšlo kot običajno – pri nekaterih testih bo prednost večja, pri drugih pa skoraj nobene prednosti. Vsekakor bi moral biti HD 7970 najboljši med vsemi enočipnimi modeli AMD in Nvidia, vsaj za to smo našli vse predpogoje. Preidimo torej k naslednjemu delu gradiva – študiju hitrosti v igrah.