7970 fogyasztás. Videokártyák

Térjünk át a mérési eredményekre:

A teljes rendszer energiafogyasztása készenléti üzemmódban, W.

A folyamatoptimalizálásnak és az üresjárati feszültség csökkentésének köszönhetően a fogyasztás csaknem három wattal csökkent a Radeon HD 7970 első verziójához képest. Itt azonban nem számítottunk semmiféle forradalmi változásra. Az AMD grafikus kártyák régóta sikeresek a ZeroCore Power technológiával.

A teljes rendszer teljesítményfelvétele terhelés alatt, W.

Terhelés alatt a Radeon HD 7970 GHz Edition valamivel több energiát fogyaszt, mint elődje. Amint azt el lehet képzelni, ez a magasabb órajelnek köszönhető, hiszen az AMD egyértelműen a maximális teljesítményt akarta kisajtolni az új chipoptimalizálásokból. Az áramfogyasztás hat wattos növekedése azonban valószínűleg nem befolyásolja a teljes villanyszámlát.

Üresjárati hőmérséklet, Celsius fok.

Kíváncsian vártuk a hőmérsékletmérés eredményét. Az alacsonyabb feszültség miatt az alapjárati hőmérséklet csökkenésére lehetett számítani. De sajnos nem javítottuk a változtatásokat.

Hőmérséklet terhelés alatt, Celsius fok.

Érdekes módon terhelés alatt kaptuk meg a különbséget a két videokártya között. A Radeon HD 7970 modell elérte a 74°C-ot, de a GHz Edition ugyanezen körülmények között elérte a 72°C-ot. Ezt a lehetőséget talán a GPU gyártása során végrehajtott optimalizálás tette lehetővé.

Zajszint üresjáratban, dB(A).

Üres üzemmódban szinte semmilyen zajszintbeli különbséget nem kapunk. Mivel a hőmérséklet azonos, nincs szükség arra, hogy a ventilátor gyorsabban vagy lassabban forogjon.

Zajszint terhelés alatt, dB(A).

Terhelés alatt a zajszint különbség jelentősebbé vált. A "régi" Radeon HD 7970 több mint egy decibellel hangosabban fut, mint a GHz Edition. Ez talán a GPU alacsonyabb hőmérsékletének köszönhető, ami lehetővé teszi, hogy a ventilátor kicsit lassabban forogjon.

Vizsgálati módszertan
AMD Catalyst illesztőprogram beállításai - Alapértelmezett
élsimítás Alkalmazás beállítások
Anizotróp szűrés Alkalmazás beállítások
Tesselation AMD optimalizált
Katalizátor A.I. Textúra szűrő minősége Minőség, Engedélyezze a felületformátum optimalizálását
Várjon a Vsync-re Letiltás, hacsak az alkalmazás nem határozza meg
AA mód Többmintás
Háromszoros pufferelés Letiltás
NVIDIA illesztőprogram beállításai
CUDA GPU-k Minden
Anizotróp szűrés Alkalmazáskezelés
Vertikális szinkron Használja a 3D alkalmazás beállítását
Háttérvilágítás árnyékolás Ki
Az előre betanított képkockák maximális száma 3
Streaming optimalizálás Auto
Energiagazdálkodási mód Adaptív
Simítás – gamma korrekció Ki
Simító - mód Alkalmazásvezérlés
Háromszoros pufferelés Ki
Több kijelzős gyorsítás Több kijelzős teljesítmény mód
Textúra szűrés - Anizotróp optimalizálás Ki
Textúra szűrés - Minőség Minőség
Textúra szűrés - Negatív UD eltérés Lehetővé teszi
Textúra szűrés - Trilineáris optimalizálás Tovább
ProgramAPIBeállításokTeszt módokEngedély
3D Mark Vantage DirectX 10 Profilok Teljesítmény, Magas, Extrém
3D Mark 11 DirectX 11 Profilok Teljesítmény, Extrém
Unigine Heaven 2 DirectX 11 Maximális részletesség, DirectX 11, tesselláció Extreme módban AA és AF nélkül / AA 4x, AF 16x 1920x1080 / 2560x1440
Crysis 2 + Adrenaline Crysis 2 benchmark eszköz DirectX 11 Belváros/Adrenalin térkép. Max. részletek, nagy felbontású textúrák, DirectX 11 Edge AA 1920x1080 / 2560x1440
Far Cry 2 + Far Cry 2 benchmark eszköz DirectX 10 Ranch kis térkép. Max. részletezve AA nélkül / AA 4x 1920x1080 / 2560x1440
Metro 2033 + Metro 2033 benchmark DirectX 11 Maximális részletesség, DirectX 11, DOF, tesselláció, NVIDIA PhysX kikapcsolva Analitikai AA, AF 4x / MSAA 4x, AF 16x 1920x1080 / 2560x1440
Aliens versus Predator + Alien vs Predator Benchmark Tool DirectX 11 Maximális részletesség, DirectX 11 AA és AF nélkül / AA 4x, AF 16x 1920x1080 / 2560x1440
DiRT 3 DirectX 11 Maximális részletesség AA és AF nélkül / AA 4x, AF 16x 1920x1080 / 2560x1440
maffia 2 DirectX 11 Maximális részletesség, NVIDIA PhysX kikapcsolva. AA nélkül, AF 1x / AA bekapcsolva, AF 16x 1920x1080 / 2560x1440
Csak mert 2 DirectX 10 Maximális részlet, Bokeh szűrő kikapcsolva, Fokozott vízrészlet ki AA nélkül, AF 2x / AA 4x, AF 16x 1920x1080 / 2560x1440

A következő videókártyák vettek részt a tesztelésben a Radeon HD 7970 riválisaként:

  • AMD Radeon HD 6970 (880/5500)
  • Radeon HD 6990 (880/5000)
  • NVIDIA GeForce GTX 580
  • NVIDIA GeForce GTX 590

Túlhúzás, hőmérséklet, energiafogyasztás

Az AMD azt ígérte, hogy a HD 7970 processzor gond nélkül túlhajt 1 GHz-re és magasabbra, ami könnyen hihető, hiszen a 75 MHz az új folyamattechnológiával nem is olyan nagy teljesítmény. A tesztmintánk azonban könnyedén hozzáadott 200 MHz-et (!) a GPU alapfrekvenciájához, és a memória 5500 effektív MHz-ről 6300 effektív MHz-re túlhajtott, mindezt a feszültség emelése nélkül. A további túlhúzás az Overdrive funkció korlátaiba ütközött, melyeket a rendszerleíró kulcsokkal és harmadik féltől származó túlhúzó segédprogramokkal már jól ismert trükkökkel sem lehetett leküzdeni. A HD 7970 még a BIOS-t sem tudja beolvasni a meglévő szoftverekkel, így az igazi rekordok még csak most jönnek.

Úgy tűnik, hogy a Radeon HD 7970 valóban nem különbözik a HD 6970-től a TDP tekintetében. A rendszer fogyasztása terhelés alatt is pontosan megegyezik, 2D módban pedig a HD 6970 még falánkabb. A túlhajtás némileg növelte az energiafogyasztást, de az eredmény még mindig jóval kevesebb, mint a többi versenytársé - a "kétfejű" HD 6990 és a GeForce gyorsítók.

Ráadásul a HD 7970 bizonyult a leghidegebb kártyának a teszt résztvevői közül. Maximális túlhúzásnál is kevésbé melegszik, mint a HD 6970. És mivel a kártyák fogyasztása megegyezik, az új hűtőrendszernek köszönhetjük. A hatás különösen szembetűnő, ha a HD 7970 processzor frekvenciáját HD 6970 szintre csökkenti.

Teljesítmény, szintetikus benchmark

  • A Radeon HD 7970 minden módban hatalmas különbséggel felülmúlja a HD 6970-et és a GeForce GTX 580-at is. Csak a "kétfejű" videokártyák működnek gyorsabban.
  • A túlhajtható HD 7970 teljesítményét tekintve a GeForce GTX 590-hez hasonlítható, bár a HD 6990 még mindig előttünk áll. Ez utóbbi általában rendkívül magas eredményeket hoz, ami ismét felveti a kérdést, hogy a 3DMark Vantage pontokat számító algoritmusok helyesek-e. Nem ez az első alkalom, hogy megmagyarázhatatlan műtermékekkel találkozunk ebben a tesztben.

  • A HD 7970 felülmúlja az összes versenytársat, kivéve a HD 6990-et, még túlhajtás nélkül is.
  • Túlhúzáskor a HD 7970 és a régi, kétchipes zászlóshajó közötti különbség vészesen csökken.

Teljesítmény, játék benchmark

Unigine Heaven 2

  • A HD 7970 kolosszális, majdnem kétszeres előnnyel rendelkezik a HD 6970-hez képest. Látható, hogy az AMD remek munkát végzett a tesszelláció terén.
  • Hasonló teljesítményt nyújt a GeForce GTX 580.
  • Túlhajtva a HD 7970 egyenrangú a HD 6990-el, de elmarad a GTX 590-től.

Crysis 2

  • A HD 7970 és a HD 6970 eredményei között majdnem kétszeres a különbség.
  • A HD 7970 érezhetően megelőzi a GeForce GTX 580-at is.
  • Túlhúzás nélkül a HD 7970 teljesítményében a HD 6990-hez hasonlítható, túlhúzással pedig utoléri a GeForce GTX 590-et.

Aliens vs Predators

  • A HD 7970 25%-os előnnyel rendelkezik a HD 6970-hez képest.
  • A GeForce GTX 580 AA és AF módban még a Radeon HD 6970 mögött is kissé elmarad.
  • A kétchipes videokártyák érezhetően gyorsabbak az újdonságnál, ráadásul még a túlhúzás sem engedi a felzárkózást.

  • A HD 6970 jól teljesít ebben a benchmarkban, ezért a HD 7970 előnye vele szemben nagy, de nem letörő.
  • A GeForce GTX 580 könnyedén felveszi a versenyt a HD 7970-gyel 1920x1080 felbontásban, de 2560x1440-nél elmarad.
  • A kétprocesszoros videokártyák még túlhajtva sem érhetők el a HD 7970 számára.

Metró 2033

  • A HD 7970 legalább harmadával gyorsabb, mint a HD 6970.
  • A GeForce GTX 580 továbbra is jó eredményeket mutat, és nem sokkal marad el a hírtől.
  • Az SLI és a CrossFire remekül működik, így a HD 7970 még túlhúzással sem tudja legyőzni őket, pedig már közeledik a HD 6990-hez.

Far Cry 2

  • A HD 7970 20-25%-kal gyorsabb, mint a HD 6970.
  • A HD 7970 szintén jelentősen megelőzi a GeForce GTX 580-at.
  • A GTX 590 és a HD 6990 még túlhajtás után is elérhetetlen magasságban van a HD 7970 számára.

VLIW4 vs GCN

Végül a Radeon HD 7970-et játékteszteken futtattuk le azonos frekvencián a Radeon HD 6970-nel. A diagram jól mutatja, hogy az új GCN architektúra önmagában mekkora előnyt biztosít a VLIW4-hez képest.

megállapításait

Az AMD a semmiből készített GPU-kat, amelyek gyökeresen különböznek mindentől, amit Radeon márkanév alatt adtak ki az elmúlt néhány évben. A változtatások mértékét tekintve az esemény az R600 chipben (Radeon HD 2900) az egységes shader architektúra VLIW5 bevezetéséhez hasonlítható. De ha emlékszel, milyen nehéz utat kellett megtennie a VLIW5-nek, mielőtt a benne rejlő lehetőségek feltárulnának, akkor észrevehető, hogy ezúttal minden teljesen más.

A Tahiti chip által képviselt GCN architektúra már kiforrott és rendkívül hatékony termék. A Radeon HD 7970 20-50%-kal gyorsabb, mint az AMD előző generációs egychipes zászlóshajója, és könnyedén felülmúlja fő versenytársát, a GeForce GTX 580-at. Annak ellenére, hogy Tahiti egy hatalmas, példátlanul bonyolult GPU, a kártya nem fogyaszt többet, mint a GeForce GTX 580. mint a HD 6970, és magas a túlhajtási mennyezete. Túlhajtva pedig a teljesítmény már megközelíti a kétprocesszoros Radeon HD 6990 és GeForce GTX 590 adapterek szintjét.

Megjegyzendő, hogy a Fermi architektúra pozíciói továbbra is erősek a DirectX 11 képességek aktív kihasználásával járó feladatokban.Bizonyos játékokban a GTX 580 csak kis mértékben marad el az AMD új termékétől, így az NVIDIA-nak még mindig megvan minden esélye, hogy bosszút álljon. év. Ugyanilyen érdekes lesz látni, hogy az AMD hogyan hozza lépésről lépésre közelebb a GPU-kat az általános célú processzorokhoz. Az NVIDIA CUDA-ja nagy előnyt kapott az évek során, de most az AMD is ugyanolyan erős grafikus architektúrával és Fusion processzorokkal rendelkezik, amelyek előbb-utóbb beágyazott GCN magokat is kapnak.

Vizsgálati módszertan

Az AMD Catalyst Control Center beállításai
élsimítás Alkalmazásbeállítások használata
Anizotróp szűrés Alkalmazásbeállítások használata
Tesselation Alkalmazásbeállítások használata
Catalyst A.I., textúra szűrési minőség Minőség, Engedélyezze a felületformátum optimalizálását
Mipmap részletességi szint Minőség
Várjon a Vsync-re kikapcsolva, hacsak az alkalmazás nem írja elő
Anti-aliasing mód Több minta AA
Direct3D beállítások, Geometry Instancing engedélyezése Tovább
Háromszoros pufferelés Ki
NVIDIA Vezérlőpult beállításai
környezeti elzáródás Ki
Anizotróp szűrés Alkalmazás által vezérelt
Antialiasing – Gamma korrekció Tovább
Antialiasing-mód Alkalmazás által vezérelt
Élsimítás – Beállítások Alkalmazás által vezérelt
Élsimítás – Átlátszóság Ki
CUDA-GPU-k Minden
Maximum előre renderelt képkockák 3
Többképernyős/vegyes GPU-gyorsítás Több megjelenítési teljesítmény mód
energiagazdálkodási mód Adaptív
Textúra szűrés — Anizitróp mintaoptimalizálás Ki
Textúra szűrése – negatív LOD torzítás lehetővé teszi
Textúra szűrés - Minőség Minőség
Textúra szűrés - Trilineáris optimalizálás Tovább
Menetes optimalizálás Auto
Háromszoros pufferelés Ki
vertikális szinkron Használja a 3D alkalmazás beállításait
Egy sor benchmark
Program API Beállítások Teszt üzemmódban Engedély
3D Mark 2011 DirectX 11 Profilok Teljesítmény, Extrém

Unigine Heaven 2 DirectX 11 Max. minőség, DirectX 11, tesselláció Extreme módban AF 16x, MSAA 4x 1920x1080 / 2560x1440
Crysis Warhead + Framebuffer Crysis Warhead teljesítménymérő eszköz DirectX 10 Frost átrepülés. Max. beállítások, DirectX 10. AF 16x, MSAA 4x 1920x1080 / 2560x1440
Metro 2033 + Metro 2033 benchmark DirectX 11 Max. beállítások, DirectX 11, DOF, tesselláció, NVIDIA PhysX kikapcsolva AF 16x, MSAA 4x 1920x1080 / 2560x1440
DiRT 3 + Adrenaline Racing Benchmark eszköz DirectX 11 Aspen, 8 autó. Max. minőség, DirectX 11 AF, AA 4x 1920x1080 / 2560x1440
Crysis 2 + Adrenaline Crysis 2 benchmark eszköz DirectX 11 központi park. Max. minőség, DirectX 11, nagy felbontású textúrák AF 16x, Post MSAA + Edge AA 1920x1080 / 2560x1440
Battlefield 3 + FRAPS DirectX 11 A Going Hunting küldetés kezdete. Max. minőség AF 16x, MSAA 4x 1920x1080 / 2560x1440
Batman: Arkham City. Beépített benchmark DirectX 11 Max. minőség AF, MSAA 4x 1920x1080 / 2560x1440
The Elder Scrolls 5: Skyrim + FRAPS DirectX 9 Whiterun városa. Max. minőség AF 16x, MSAA 4x 1920x1080 / 2560x1440
Call of Duty: Modern Warfare 3 + FRAPS DirectX 9 Küldetés Vissza a feladóhoz. Max. minőség AF, MSAA 4x 1920x1080 / 2560x1440

A következő videokártyák vettek részt a tesztelésben a Radeon HD 7970 GHz Editon riválisaként:

  • AMD Radeon HD 7970 (925/5500 MHz, 3 GB)
  • NVIDIA GeForce GTX 680 (1006/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 670 (915/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 590 (607/3414 MHz, 3 GB)
  • AMD Radeon HD 6990 (880/5000 MHz, 4 GB)

Annak érdekében, hogy a mai intrika mindkét résztvevője, a Radeon HD 7970 GHz Edition és a GeForce GTX 680 teljesen élesíthető legyen, az NVIDIA (304.48 Beta) és az AMD (Catalyst 12.7 Beta) legújabb béta-illesztőprogramjait használták a teszteléshez. Ezenkívül a PCI-E 3.0 módot aktiválták a GTX 680-hoz, amelyet hivatalosan nem támogat az Intel X79 platform.

⇡ Túlhúzás, hőmérséklet, energiafogyasztás

Mivel a PowerTune nem mutatja magát a megfigyelt órajel-frekvenciákon, az 1050 MHz-es Boost Clock lett a túlhúzás kiindulópontja. A GPU feszültséggel a dolgok nem ilyen egyszerűek. Az a helyzet, hogy az MSI Afterburner feszültségbeállítása (lehet, hogy más közműveknél is ugyanez történik, nem próbáltuk) már nincs hatással a megfigyelt feszültségre. A növeléséhez meg kell próbálnia magasabbat beállítani állandó feszültséget a megfelelő opció használatával. De bármilyen furcsán is néz ki, ez nem akadályozza meg a feszültség ingadozását, csak felfelé tolja el a megfigyelt értékeket. Így a feszültséget nem tudjuk rögzíteni, de eltolhatjuk azt a tartományt, amelyen belül változik. Ennek eredményeként, ha manuálisan állítja be a feszültséget 1,3 V-ra, akkor az oszcillációs tartomány körülbelül 1,227 - 1,252 V lesz.

Meg kell jegyezni, hogy bizonyos esetekben, amikor különféle túlhúzó és figyelő segédprogramokkal játszottunk, a feszültséget továbbra is 1,3 V-on rögzítették, de akkor a Power Tune látszólag megőrült, és a GPU-tól függetlenül erős műtermékek jelentek meg a képernyőn 3D-ben. frekvencia. Nem úgy tűnik, hogy érdemes megpróbálni legyőzni a Power Tune-t, főleg, hogy olyan jól végzi a dolgát.

Ha az új adapter Boost Clock-ját tekintjük a többi Radeon szabványos GPU-frekvenciájának (és a Power Tune elveit tekintve az is), a HD 7970 GHz Edition még a hagyományos HD 7970-nél is jobban túlhúzott: akár 1240-ig. MHz a processzor és 7320 (1830) MHz a memóriából. Ha 1240 MHz-ből kivonjuk az 50 MHz-es Power Tune Boost tartományt, akkor azt a frekvenciát kapjuk, amit a szabványos HD 7970 sok példánya elér. Úgy tűnik, a hosszabb frekvenciatábla lehetővé teszi a túlhúzott GPU számára, hogy magasabb csúcsértékeket érjen el, miközben visszagördül az előzőre alsó küszöb nehéz feladatoknál. Az viszont nem tény, hogy a kártya valóban valaha is eléri ezt az 1240 MHz-et, és nincs állandóan fojtásban. Amíg a felügyeleti segédprogramok hozzá nem férnek a Power Tune belsejéhez, ez rejtély marad.

De a fantasztikus memória túlhajtás csak a Tahiti chip és a memóriachipek kiváló vezérlőinek érdeme, látszólag valamivel jobbak a szabványos HD 7970-el felszerelteknél.

A HD 7970 GHz Edition valamivel jobban felmelegszik, mint a szabványos verzió – nagyjából annyit, mint a GeForce GTX 680. A teljes sebességgel bekapcsolt hűtőrendszer lehetővé teszi, hogy erős túlhajtáskor ugyanazt a hőmérsékletet tartsuk, mint normál módban, de csak kolosszális zaj árán. Valljuk be, hogy a HD 7970 GHz Edition még automatikus ventilátorvezérléssel is sokkal több zajt ad, mint a GeForce GTX 680.

A kártya maximális rögzített fogyasztása a várakozásoknak megfelelően még mindig kissé megnőtt a normál HD 7970-hez képest. Szerintünk az AMD nem hazudik, amikor azt állítja, hogy a HD 7970 mindkét verziójának TDP-je megegyezik. Úgy tűnik, a HD 7970 GHz Edition egyszerűen aktívabban sajátítja el. Túlhúzáskor természetesen az áramfelvétel a plafonig rúg. Az erős tápegység nem zavarja.

⇡ Radeon HD 7970 GHz Edition vs GeForce GTX 680

Ezek azok az eredmények, amelyekért minden elkezdődött. Tehát sikerült az AMD-nek visszaszereznie az elvesztett vezető szerepet?

A túlhajtás nélküli GeForce GTX 680 még mindig jobban teljesít, mint a HD 7970, de a túlhajtható Radeon kártyák közül gyorsabb.

Szerencsejátéktesztek+ Unigine Heaven

Kilencből háromban (Crysis Warhead, DiRT 3, Metro 2033) 1920x1080-as felbontással a Radeon HD 7970 GHz Edition megelőzi. A másik háromban a GeForce GTX 680 nyer (Unigine Heaven 2, Battlefield 3, Skyrim). Más játékokban nincs jelentős különbség az ellenfelek között. Tökéletes húzás. A 2560x1440-es módban a helyzet felülmúlja a HD 7970-et. Csak a CoD 3-ban és az Unigine Heavenben őrzi meg a GTX 680 felsőbbrendűségét.

A túlhúzás jobb az AMD kártyának, mint a GTX 680-nak: érezhetően nagyobb a teljesítménynövekedés, és ennek köszönhetően a HD 7970 GHz Edition még 1920x1080-nál is bosszút áll.

⇡ Radeon HD 7970 GHz Edition mindenki ellen

  • Az AMD sajnálatos, de a 3DMark 2011-ben a Radeon HD 7970 GHz Edition nemcsak a GeForce GTX 680-nál, hanem a GTX 670-nél is alulmúlja.
  • A GHz Edition előnye a standard verzióval szemben szembetűnő.

Unigine Heaven 2

  • A GHz-es kiadás néhány FPS-t adott a normál HD 7970-hez képest.
  • 2560x1440-nél a GeForce GTX 670 és GTX 680 rendelkezik minimális előnnyel, de 1920x1080-nál a HD 7970 GHz Edition érezhetően elmarad.
  • A túlhúzott GHz-es kiadás veri a Radeon HD 6990-et, és összehasonlítható a GTX 670-zel és a GTZ 680-al.

Crysis Warhead (DirectX 10)

  • Ebben a tesztben még a normál HD 7970 is könnyedén veri a GeForce GTX 680-at a nagyobb memória sávszélessége miatt.
  • A HD 7970 GHz Edition még a GeForce GTX 590-nél is valamivel rosszabb, a túlhúzott GHz-es Edition pedig egyenrangú a Radeon HD 6990-el.

Metro 2033 (DirectX 11)

  • A HD 7970 GHz Edition előnye csekély a normál verzióhoz képest.
  • A HD 7970 GHz Edition észrevehetően gyorsabb, mint a GeForce GTX 680.
  • Túlhúzott állapotban a GHz Edition eléri a GeForce GTX 590 és a Radeon HD 6990 szintjét.

DiRT 3 (DirectX 11)

  • A HD 7970 GHz Edition sokkal jobb, mint a standard verzió.
  • A GHz-es kiadás is észrevehetően gyorsabb, mint a GTX 680, teljesítményét tekintve a Radeon HD 6990-hez és a GeForce GTX 590-hez hasonlítható.

Crysis 2 (DirectX 11)

  • A 2560x1440-es módban észrevehető teljesítménynövekedés tapasztalható a normál HD 7970-hez képest.
  • A 2560x1440-es felbontásban a HD 7970 GHz Edition is megelőzi a GeForce GTX 680-at, a túlhajtható kártya pedig maga mögött hagyta a GTX 590-et és utolérte a Radeon HD 6990-et.
  • Az 1920x1080-as módban a teszt résztvevői elérik a Crysis 2-ben beállított 100 FPS-es korlátot.

Battlefield 3 (DirectX 11)

  • A HD 7970 GHz Edition ismét észrevehető FPS-növekedést mutat a szabványos HD 7970-hez képest.
  • Az újdonság nagyjából a GTX 670 és a GTX 680 szintjén van.
  • A túlhúzott HD 7970 GHz-es kiadás még egy GTX 590-hez is túl kemény.

Batman: Arkham City (DirectX 11)

  • A GHz Edition varázslatos kifejezés ismét kellemes FPS-löketet ad a HD 7970-nek.
  • 1920x1080-as felbontásban a kártya a GTX 680-al egyenrangú, 2560x1440-nél pedig felülmúlja azt.

The Elder Scrolls 5: Skyrim (DirectX 9)

  • Ebben a játékban nincs jelentős különbség a HD 7970, a HD 7970 GHz Edition és a GeForce GTX 680 között: egy bizonyos határ után a Skyrim motor már nem tud további számítási teljesítményt használni.

Call of Duty: Modern Warfare 3 (DirectX 9)

  • A HD 7970 törzsverziójához képest a GHz Edition nagy képfrekvenciás növekedést mutat.
  • Ennek ellenére csak a GeForce GTX 670, a GTX 680 nem egyenrangú riválisa az új terméknek.

⇡ Következtetések

Az AMD számára a Radeon X1950 XTX régmúlt napjai óta először jött el a pillanat, amikor a csúcsvideokártya legalább olyan jó, mint az azonos generációs NVIDIA zászlóshajója. A HD 7970 GHz Edition a 384 bites memóriabusznak köszönhetően összességében még a GeForce GTX 680-nál is gyorsabb nehéz grafikus módokban (például 2560x1440). Ráadásul a gyári túlhajtás után is jelentős frekvenciatartaléka van. A frissített Power Tune technológia jótékony hatással van a GPU túlhajtási potenciáljára, és a memória sokkal jobban kezdett túlhúzni. Mind az NVIDIA, mind az AMD jövőbeli kártyáiban minden bizonnyal virágzó dinamikus frekvencia- és feszültségszabályozási technológiát fogunk látni, ahogy ez már a CPU-val is megtörtént.

Valójában az eredeti verzióban a HD 7970 egy nagyon erős kártya, és a legtöbb másolat könnyen eléri azt a frekvenciát, amelyen utolérheti és megelőzheti a GeForce GTX 680-at. A GHz Edition többnyire divattermék mind a tulajdonos, mind a tulajdonos számára. a gyártó. Az AMD éppen annyira túlhajtotta a HD 7970-et, hogy megfeleljen a GTX 680-nak, és továbbra is ugyanazon a TDP-n belül maradjon. Energiafogyasztási tesztjeink egyértelműen megmutatják, mi lett volna, ha a fejlesztők az NVIDIA zászlóshajója feletti feltétlen győzelmet tűzték volna ki célul.

Sajnos az AMD már elveszített egy különleges előnyt az NVIDIA kártyákkal szemben a High-End szegmensben, amit az elmúlt években élvezett - az energiafogyasztást. Ha a korábbi csúcskategóriás Radeonok teljesítményben nem tudták felülmúlni a GeForce GTX 480-at és GTX 580-at, de sokkal kevesebbet fogyasztottak és fűtöttek, akkor most döntetlen van a benchmarkokban, a TDP Radeon HD 7970 GHz Edition viszont annyi. 55 W-tal magasabb, mint a GTX 680-é.

És még egy kérdés. Már az is csúnyán néz ki, hogy a Radeon vonalban két fizikailag egyforma, különböző szoftveres kártya létezik. Mire fizetnek a HD 7970 GHz Edition vásárlói, ha a szabványos HD 7970 könnyed túlhajtásával is szinte ugyanezt lehet elérni, és az utóbbi tulajdonosai miért nem kaptak új firmware-t? Mivel a videokártyák BIOS-a nem frissíthető olyan egyszerűen, mint az illesztőprogramok, jobb lenne, ha a HD 7970 GHz Edition teljesen lecserélné elődjét. Nos, pusztán a világharmónia szempontjából.

  • 2. rész - Gyakorlati ismerkedés
  • 3. rész – Játékteszt eredményei (teljesítmény)

Ebben a részben a szokásos módon magát a videokártyát tanulmányozzuk, valamint megismerkedünk a szintetikus tesztek eredményeivel.

Fizetés

  • GPU: Radeon HD 7970 (Tahiti)
  • Felület: PCI Express x16
  • GPU működési frekvencia (ROP): 925 MHz (névleges 925 MHz)
  • Memória frekvencia (fizikai (effektív)): 1375 (5500) MHz (névleges - 1375 (5500) MHz)
  • Memóriacsere busz szélessége: 384 bites
  • A számítási egységek száma a GPU-ban / a blokkok frekvenciája: 32/925 MHz (névleges 32/925 MHz)
  • Műveletek száma (ALU) egy blokkban: 64
  • Műveletek teljes száma (ALU): 2048
  • Textúra egységek száma: 128 (BLF/TLF/ANIS)
  • Raszterezési blokkok száma (ROP): 32
  • Méretek: 285×100×33 mm (az utolsó érték a videokártya maximális vastagsága)
  • Textolit szín: piros
  • Energiafogyasztás (csúcs 3D/2D/alvó állapot): 215/70/3 W
  • Kimeneti csatlakozók: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
  • Többfeldolgozás támogatása: CrossFire X (hardver)

AMD Radeon HD 7970 3072 MB 384 bites GDDR5 PCI-E

A kártya 3072 MB GDDR5 SDRAM-mal rendelkezik, amely 12 chipben van elhelyezve a PCB elülső oldalán.

Saját DirectX 11 szintetikus benchmark hiányában ismét a Microsoft és az AMD SDK-kból és az Nvidia demójából vettünk példákat. Az első a HDRToneMappingCS11.exe és az NBodyGravityCS11.exe a DirectX SDK-ból (2010. február).

Mindkét gyártótól vettünk kérelmet: Nvidia és AMD. A DetailTessellation11 és a PNTtriangles11 az ATI Radeon SDK-ból származnak (ezek a DirectX SDK-ban is megtalálhatók). Ezenkívül az Nvidia demóprogramját használták - Realistic Water Terrain, más néven Island11 (szerző - Timofey Cheblokov, a 3D grafika jól ismert specialistája).

Szintetikus teszteket a következő videokártyákon végeztek:

  • Radeon HD 7970 HD 7970)
  • Radeon HD 6990 szabványos paraméterekkel (a továbbiakban HD 6990)
  • Radeon HD 6970 szabványos paraméterekkel (a továbbiakban HD 6970)
  • Radeon HD 5870 szabványos paraméterekkel (a továbbiakban HD 5870)
  • Geforce GTX 590 szabványos paraméterekkel (a továbbiakban GTX 590)
  • Geforce GTX 580 szabványos paraméterekkel (a továbbiakban GTX 580)

A legújabb Radeon HD 7970 grafikus kártya eredményeinek összehasonlításához különféle okok miatt választották ezeket a modelleket. A Radeon HD 6970 a csúcsszegmens közvetlen elődje, a HD 6990 a legerősebb (bár kétchipes) megoldás volt az előző architektúra GPU-ján, a HD 5870-et adtuk hozzá, hogy kiértékeljük a két különböző közötti erősítést. architektúrafrissítések, és GPU-ként pontosan fele olyan bonyolult, mint Tahiti.

A kiválasztott Nvidia megoldásokat azért választották, mert a Geforce GTX 580 a cég leggyorsabb egylapkás modellje, amely a legújabb generációs GPU-ra épül. Bár árát tekintve nem vetélytársa a bemutatott AMD videokártyának, eredményei az Nvidia jelenlegi egychipes megoldásaihoz képest maximum érdekesek. A kétchipes GTX 590 pedig a cég extrém, magasabb árfekvésű változata. A DirectX 11 tesztekben a Geforce GTX 560 Ti-t is használtuk, amelyre az új AMD GPU megnövekedett geometriai teljesítményének értékeléséhez van szükség.

Direct3D 9: Pixelkitöltési tesztek

Ez a teszt meghatározza a textúra-mintavételezés csúcsteljesítményét (texelsebesség) FFP módban pixelenként eltérő számú textúra esetén:

A RightMark elavult 32 bites textúraszűrő tesztjében a legtöbb videokártya olyan számokat mutat, amelyek elméletileg messze nem lehetségesek. A textúraszintetika eredménye tehát a Radeon HD 7970 videokártya esetében nem érte el a csúcsértéket, így ismét számokkal nézzük a textúrázási sebességet a 3DMark Vantage tesztből, melyben mindig reálisabb számokat kapunk.

Esetünkben kiderült, hogy a HD 7970 óránként csak legfeljebb 80 texelt választ ki a 32 bites textúrákból bilineáris szűréssel, ami jóval alacsonyabb, mint a 128 szűrt texel elméleti adata. Ellenkező esetben minden kiszámíthatóan alakult - minden AMD kártya nagyobb teljesítményt mutatott, és megelőzi az Nvidia videokártyákat. Hiszen még a legjobb egylapkás Geforce GTX 580 is csak 64 TMU-val rendelkezik, és ezért jóval gyengébb a Tahiti chipre épülő modellnél, amely 128 TMU-val dolgozik magasabb frekvencián. Ezért a különbség több mint kétszeres. Nos, a kétchipes GTX 590 ebben a tesztben egyértelműen nem megfelelő eredményt mutat.

Az AMD két GPU-s verziója sem működik megfelelően a tesztünkben, mert a HD 7970 szinte mindig még azt is felülmúlja. Nos, az új modell mintegy 30%-kal előzte meg elődjét, ami valamivel rosszabb, mint az elméletileg lehetséges értékek. Azonban kis számú textúra esetén, amikor a memória sávszélessége a leginkább érintett, az eredmény még alacsonyabb - körülbelül 25%.

Tekintsük ugyanazokat az eredményeket a kitöltési tesztben:

A számok a kitöltési arányt mutatják, és bennük mindent ugyanazt látunk, kivéve azt, hogy a képkockapufferbe írt pixelek számát figyelembe véve. A maximális eredményt szinte mindig a Radeon HD 7900 család új csúcskategóriás videokártyája éri el, amelynek rekordszámú TMU-ja fut magasabb frekvencián és hatékonyabban szintetikus tesztünkben. Térjünk át az egyszerű pixel shader szövegeire.

Direct3D 9: Pixel Shaders benchmarkok

A pixel-shaderek első csoportja, amelyet figyelembe veszünk, nagyon egyszerű a modern videochipekhez; a pixelprogramok viszonylag alacsony bonyolultságú változatait tartalmazza: 1.1, 1.4 és 2.0, amelyek a régi játékokban találhatók.

Ezek a tesztek túl egyszerűek a modern GPU-k számára, és leginkább a textúrázási teljesítmény és néha a kitöltési sebesség korlátozza őket. Ezért nem mutatják meg a modern videochipek összes képességét, de az elavult játékalkalmazások szempontjából érdekesek. A két legegyszerűbb tesztben az új Radeon HD 7970 még a kétlapkás HD 6990-et is majdnem megelőzte, de a nehezebb teszteknél a HD 6990 és a HD 6970 között foglalt helyet. Érdekes, hogy a különböző architektúrájú GPU-kon végzett tesztek miben térnek el egymástól. És itt Tahiti valamivel közelebb áll a GF110-hez, mint elődjéhez. Természetesen nem abszolút értelemben a különbség nagyon nagy - másfél-kétszeres.

Az egyéb tesztek teljesítményét leginkább a textúraegység sebessége és a kitöltési arány korlátozza, így az új Radeon HD 7970 körülbelül 30-40%-kal gyorsabb, mint a korábbi HD 6970, ami összhangban van az elmélettel. Minden AMD alaplap megelőzi mindkét csúcs Geforce modellt, kivéve, hogy a HD 5870 és a GTX 590 összehasonlítása során nem minden olyan egyértelmű. A textúra sebességének hiánya egyértelműen okolható az Nvidia kudarcaiért ezekben a tesztekben. De még a GF110-en elindított Phong három fényes pixel shader is, amely inkább a GPU matematikai teljesítményétől függ, sokkal rosszabb, mint a Cayman, és még inkább a Tahiti.

Nézzük meg a köztes verziók bonyolultabb pixelprogramjainak eredményeit:

És ezúttal is nagyjából ugyanaz lett, a HD 7970 megközelítőleg a HD 6900-as sorozat Cayman alapú egylapkás és kétchipes modelljei között helyezkedik el.A Cook-Torrance teszt számításigényesebb, és a különbség benne megközelítőleg megfelel az ALU-k számának és gyakoriságának különbségének. Ezért ez a teszt jobban megfelel az AMD architektúrának, amelynek chipjei nagyobb számú matematikai egységet tartalmaznak, és ez alól Tahiti sem kivétel.

Érdekes módon a HD 5870 felülmúlja a HD 6970-et ebben a tesztben, és úgy tűnik, hogy ez a shader gyengébb teljesítménye miatt történt egy újabb VLIW4 architektúrájú chipen. Tehát bár az új Radeon HD 7970 felülmúlta a HD 6970-et, ebben a tesztben csak 20%-kal volt gyorsabb, mint a HD 5870.

A „Water” eljárási vízmegjelenítés második tesztje, amely jobban függ a textúra sebességétől, függő mintavételezést használ nagy egymásba ágyazási szintek textúráiból, és a videokártyákat a textúrázási sebesség szerint rangsorolják, a különböző TMU-használati hatékonysághoz igazítva. Ebben a tesztben az AMD megoldások mindig jól szerepelnek, és a HD 7970 nagyon jó eredményt ad, bár rosszabb, mint a kétlapkás HD 6990, de sokkal jobb, mint elődje a Cayman-on. A legjobb egychipes Nvidia tábla több mint 2,5-szeres lemaradásban van!

Direct3D 9: Pixel Shaders 2.0 tesztek

A DirectX 9 pixel shaderek ezen tesztjei összetettebbek, mint az előzőek, közel állnak ahhoz, amit jelenleg a többplatformos játékokban látunk, és két kategóriába sorolhatók. Kezdjük az egyszerűbb 2.0-s verziójú shaderekkel:

  • Parallax leképezés- a legtöbb modern játékból ismert textúratérképezési módszer, amelyet a cikkben részletesen ismertetünk.
  • Fagyott üveg— a fagyasztott üveg összetett eljárási textúrája ellenőrzött paraméterekkel.

Ezeknek a shadereknek két változata létezik: az egyik a matematikai számításokra összpontosít, a másik pedig az értékek textúrákból való lekérését részesíti előnyben. Fontolja meg a matematikailag intenzív lehetőségeket, amelyek ígéretesebbek a jövőbeni alkalmazások szempontjából:

Ezek univerzális tesztek, amelyek mind az ALU-k sebességétől, mind a textúrázás sebességétől függenek; a chip általános egyensúlyára, valamint az összetett programok végrehajtásának hatékonyságára összpontosítanak. Az új AMD grafikus kártya teljesítménye pedig a Frozen Glass tesztben nemcsak jó volt, hanem kiváló is! Ezt jelenti az új GPU fokozott hatékonysága. Az első tesztben a Radeon HD 7970 még a kétlapkás HD 6990-nél is érezhetően gyorsabbnak bizonyult. És még a kétchipes Nvidia kártya is messze elmaradt, a Geforce GTX 580-ról nem is beszélve.

Itt, a második Parallax Mapping tesztben az Nvidia megoldásai egy kicsit jobban érzik magukat, és a GTX 580 majdnem eléri a HD 6970-et. De a ma bemutatott HD 7970 nagyon messze van - az új AMD 80%-kal megelőzi a legjobb Nvidia kártyát , amely egyértelműen jelzi a befolyást és a matematikai számításokat és a textúra sebességét. Érdekes módon a nagyon régi HD 5870 ismét gyorsabb, mint a HD 6970. Az új HD 7970 pedig 60%-kal gyorsabb elődjénél, amit a száraz elméleti adatok egyértelműen nem igazolnak. Itt a skaláris architektúra VLIW-hez képest észrevehetően nagyobb hatékonysága érintett.

Az AMD videokártyák esetében viszont a PowerTune miatt minden nagyon nehéz. Hiszen a szintetikus tesztek erősen „terhelik” a GPU-t a számításokkal, és a szintetikus PowerTune-támogatással rendelkező kártyák energiafogyasztása is meghaladhatja a beállított határt. Ennek következtében a GPU órajele is csökkenhet, és ezzel együtt a vártnál gyengébb eredményeket mutatnak majd. Tekintsük ugyanazokat a teszteket a módosításnál, a textúráktól a matematikai számításokig terjedő minták preferálásával:

Mindkét Nvidia videokártya esetében még szomorúbb lett a helyzet, hiszen az összes modern AMD chip sokkal jobb textúra sebességgel rendelkezik, és ezekben a tesztekben csak növeli vitathatatlan előnyét. Még a kétlapkás GTX 590 sem tud versenyezni az egylapkás HD 6970-el mindkét textúrázásra fókuszáló tesztben, a GTX 580-ról nem is beszélve. Nos, a mai Radeon HD 7900 a leggyorsabb egychipes kártya, csak mögötte. A HD 7970 és a HD 6970 közötti különbség 26-28%-nak bizonyult, ami elméletileg jól magyarázható, mivel az újdonság textúra sebességében valamivel nagyobb a különbség.

De ezek elavult feladatok voltak, többnyire a textúrára, és néha a fillrate-re helyezték a hangsúlyt. Ezután még két pixel shader teszt eredményét nézzük meg – de most a 3.0-s verziót, a Direct3D 9 API pixel shader tesztjeink közül a legnehezebbet. Ezek a legleleplezőbbek a modern PC-játékok tekintetében, amelyek közül sok többplatformos. A tesztek abban különböznek, hogy erősen terhelik mind az ALU-kat, mind a textúra egységeket, mindkét shader program összetett és hosszú, és nagyszámú elágazást tartalmaz:

  • Meredek parallaxis leképezés— egy sokkal "nehezebb" fajta parallaxis leképezési technika, amelyet a 3D grafika modern terminológiája című cikk is ismertet.
  • Szőrme- procedurális árnyékoló, amely bundát renderel.

A RightMark legnehezebb DX9-tesztjein az Nvidia videokártyái mindig nagyon jól teljesítenek, ellentétben a felülvizsgálatunkban szereplő összes korábbi teszttel. Ezeket a teszteket nem korlátozza a textúra lekérési teljesítménye, hanem inkább a shader kód végrehajtásának hatékonyságától függenek. Korábban pedig a Radeon HD 6970 egyértelműen javította az AMD pozícióját ebben a tesztben, növelve a hatékonyságot a VLIW5 architektúráról a VLIW4-re való áttéréskor.

Nos, ma újabb ugrást láthattunk a cég megoldásainak teljesítményében, a Radeon HD 7970 elérhetetlen szintre emelte őket - az új egychipes videokártya mindkét tesztben még a kétlapkás HD 6990-et is felülmúlta! Ezek a feladatok nagyszerű példái annak, hogyan javul az összetett számítások valós teljesítménye, ha a VLIW-ről a skaláris végrehajtásra váltunk.

A 3.0-s verziójú komplex pixelshaderek tesztjei során tehát az új csúcskategóriás AMD videokártya nemcsak utol tudta érni a versenytársakat, de jelentős különbséggel is felülmúlta azt, ami sokáig nem volt így. A sebesség mindkét PS 3.0 tesztben gyengén függ a memória sávszélességétől és textúrájától, de a kód összetett, amivel az Nvidia architektúra és a legújabb AMD skalár architektúra is nagyon jól megbirkózik. Ezek a tesztek az elsők között vannak, ahol egyértelmű javulást észlelünk a hatékonyságban és a legnagyobb pozitív különbséget a korábbi és a legújabb AMD architektúra között a sebesség tekintetében.

De adjuk meg a számokat, hogy ne legyünk alaptalanok. A bemutatott új Radeon HD 7970 több mint kétszer olyan gyors, mint elődje, és 60-70%-kal gyorsabb a Geforce GTX 580-nál, amire mostanában még gondolni sem mernénk. Hiszen az Nvidia megoldásai mindig is vitathatatlanul élen jártak ebben a tesztfeladat-párban, de a Cayman alapú videokártyák közelebb tudtak kerülni hozzájuk, és a leggyorsabb Tahiti végül felülmúlta versenytársát.

Direct3D 10: PS 4.0 pixel shader tesztek (textúrázás, loopolás)

A RightMark3D második verziója két ismert PS 3.0 tesztet tartalmazott Direct3D 9 alatt, amelyeket átírtak a DirectX 10-re, valamint további két új tesztet. Az első pár hozzáadta az önárnyékolás és a shader szupermintavételezés lehetőségét, ami ráadásul növeli a videochipek terhelését.

Ezek a tesztek a hurkolt pixel-shaderek teljesítményét mérik nagyszámú textúramintával (akár több száz mintával képpontonként a legnehezebb módban) és viszonylag kis ALU-terheléssel. Más szóval, mérik a textúra lekérésének sebességét és az elágazás hatékonyságát a pixel shaderben.

Az első pixel shader teszt a Fur lesz. A legalacsonyabb beállításoknál 15-30 textúramintát használ a magasságtérképből és két mintát a fő textúrából. Az Effect detail - "High" mód 40-80-ra növeli a minták számát, a "shader" szuperminta beépítése - akár 60-120 mintára, a "High" módot pedig az SSAA-val együtt a maximális "súlyosság" jellemzi. - 160-320 minta a magassági térképről.

Először nézzük meg azokat a módokat, amelyekben nincs engedélyezve a szupermintavétel, ezek viszonylag egyszerűek, és az "Alacsony" és "Magas" módban elért eredmények arányának megközelítőleg azonosnak kell lennie.

A teszt teljesítménye a TMU-k számától és hatékonyságától, valamint az összetett programok végrehajtásának hatékonyságától függ. A szupermintavételezés nélküli változatban az effektív kitöltési sebesség (ROP teljesítmény) és a memória sávszélessége további hatással van a teljesítményre. A "High" részletezési szinttel az eredmények körülbelül másfélszer alacsonyabbak, mint az "alacsony"-nál, ahogyan annak elméletben lennie kellene, de a leggyorsabb megoldásoknál valamivel kisebb a különbség.

Korábban a nagyszámú textúra lekéréssel végzett procedurális szőrmegjelenítés tesztjein az Nvidia megoldásai érezhetően erősebbek voltak, de az előző generációs AMD-től kezdődően a különbség szűkülni kezdett. Mi történt a Radeon HD 7970-el? Kiváló eredmény - az új AMD ismét gyorsabb, mint az előző generáció kétlapkás kártyája, az egylapkás HD 6970 pedig kétszer lemaradt, ami egyértelműen az új Southern Islands architektúra hatékonyságának növekedését jelzi. Igen, és az Nvidia megoldásai elmaradtak, még a kétchipes GTX 590 is alulmarad a ma bemutatott Radeon HD 7970 csúcsmodellnél.

Nézzük meg ugyanennek a tesztnek az eredményét, de bekapcsolt "shader" szupermintavétel mellett, ami megnégyszerezi a munkát: lehet, hogy valami megváltozik egy ilyen helyzetben, és a memória sávszélessége kitöltési sebességgel kisebb hatással lesz:

A szupermintavételezés engedélyezése megnégyszerezi az elméleti terhelést, az Nvidia megoldásai pedig mindig alulteljesítenek az AMD grafikus kártyáihoz képest. Most még szembetűnőbb a különbség a feladat hatékonyságában, és az új HD 7970 2,5-szer gyorsabb, mint a HD 6970! Körülbelül ugyanennyit veszített az új terméktől a Geforce GTX 580. Teljesen természetes, hogy még a HD 6990 is jócskán lemaradt, és az új tábla megerősítette vezető szerepét, de mit ...

A második shader DX10 teszt az összetett hurkos pixelshaderek végrehajtásának teljesítményét méri nagyszámú textúra lekéréssel, és az úgynevezett Steep Parallax Mapping. Alacsony beállításoknál 10-50 textúramintát használ a magasságtérképből és három mintát a fő textúrákból. Ha bekapcsolja a nehéz módot önárnyékolással, a minták száma megduplázódik, a szupermintavétel pedig megnégyszerezi ezt a számot. A legösszetettebb tesztmód szupermintavételezéssel és önárnyékolással 80-400 textúraértéket választ ki, vagyis nyolcszor többet, mint az egyszerű mód. Először ellenőrizzük az egyszerű opciókat szupermintavétel nélkül:

A második Direct3D 10 pixeles shader teszt valamivel érdekesebb gyakorlati szempontból, mivel a parallaxis leképezési változatokat széles körben használják a játékokban, és a nehéz változatokat, mint például a meredek parallaxis leképezésünket, számos projektben használják, például a Crysis és Lost Planet játékok. Tesztünkben ráadásul a szupermintavétel mellett bekapcsolható az önárnyékolás, ami nagyjából megkétszerezi a videochip terhelését, ezt a módot "High"-nek hívják.

Ez a diagram hasonló az előzőhöz, SSAA nélkül, de az Nvidia pozíciója még egy kicsit gyengült, a Radeon HD 6990 pedig majdnem utolérte a ma bemutatott modellt. A szupermintavétel nélküli teszt frissített D3D10-es verziójában a HD 7970 kiváló eredményt mutat, jelentősen felülmúlva mind a HD 6970-et, mind a GTX 580-at, sőt a GTX 590-et is. Több mint szer lassabb, mint az új modell) lemaradnak. Lássuk, mi változtatja meg a szupermintavételezést, nagy teljesítménycsökkenést okozhat az Nvidia kártyákon.

A szupermintavétel és az önárnyékolás engedélyezése esetén a feladat még nehezebbé válik, két opció egyszerre történő kombinálása csaknem nyolcszorosára növeli a kártyák terhelését, ami nagy teljesítménycsökkenést okoz. A tesztelt videokártyák sebességmutatói között változott a különbség, a szupermintavétel beépítése megvan a hatása, ahogy az előző esetben is - az AMD kártyák teljesítményét javították az Nvidia megoldásokhoz képest.

És most ismét a Radeon HD 7970 az egyedüli vezető az összehasonlításban, magasabb eredményeket mutatva, mint a HD 6990. A cég régebbi egychipes alaplapjai messze elmaradnak a Geforce GTX 580 mellett. És csak a drágább kétlapkás opciók az AMD-től és az Nvidiától legalább néhányra képesek megközelíteni a friss videokártyát. Általánosságban elmondható, hogy két D3D10 shader teszt alapján arra a következtetésre juthatunk, hogy az új AMD architektúra és képviselője a Tahiti chipen tökéletesen megbirkózik a "shader" feladatokkal, még jobban, mint az Nvidia hagyományosan erős versenytársai.

Direct3D 10: PS 4.0 Pixel Shader összehasonlítási alapjai (számítástechnika)

A következő néhány pixel shader teszt tartalmazza a minimális számú textúra lekérést, hogy csökkentse a TMU teljesítményének hatását. Nagyszámú aritmetikai műveletet alkalmaznak, és pontosan mérik a videochipek matematikai teljesítményét, az aritmetikai utasítások végrehajtási sebességét a pixel shaderben.

Az első matematikai teszt ásványi anyag. Ez egy összetett eljárási textúrázási teszt, amely csak két textúra adatmintát és 65 sin és cos utasítást használ.

Az extrém matematikai tesztek eredményei általában megfelelnek a gyakoriságok és a végrehajtási egységek számának különbségének, de némi befolyással az eltérő felhasználási hatékonyságra. Az összes legújabb AMD architektúra elsöprő előnnyel rendelkezik ilyen esetekben a versengő Nvidia grafikus kártyákkal szemben, és ez magyarázza a teszteredményeket, amelyek során az AMD megoldások ismét lényegesen produktívabbnak bizonyulnak.

A megoldások megközelítőleg az elmélet szerint helyezkednek el, de néhány kivétellel. A gyakorlatban felfedeztek néhány, az eltérő hatékonysággal kapcsolatos árnyalatokat. Elméletileg a GeForce GTX 580-nak több mint kétszer (2,4-szer) lassabbnak kellene lennie, mint az új Radeon HD 7970 modellnek, de a gyakorlatban csak 80%-os a különbség, ami jóval kevesebb. Igen, és a HD 6970-hez képest kérdések merülnek fel az új architektúra és az illesztőprogramok ehhez a teszthez való optimalizálásával kapcsolatban. 40%-os elméleti számítási előnyével az új AMD kártya mindössze 28%-kal gyorsabb, mint a korábbi HD 6970, és még kisebb a távolság közte és a VLIW5 architektúrán alapuló nagyon régi HD 5870 között. Vagy a teszt valóban jobban megfelel a VLIW-hez (főleg a VLIW5-höz), vagy a nyers illesztőprogramok a hibásak.

Van egy másik magyarázat is - talán a HD 7970 HD 6970 kártyák eredményeit ebben a tesztben befolyásolta a PowerTune technológia, amely csökkentette a frekvenciákat az energiafogyasztási határ elérésekor. Mindez azonban nem sokat változtat egy versenytárshoz képest, mert még a drága kétchipes Geforce GTX 590 is csak a HD 6970 és a HD 5870 szintjét érte el. Az egychipes GTX 580 pedig messze elmarad.

Nézzük a shader számítások második tesztjét, amelyet Fire-nek hívnak. Az ALU-hoz nehezebb, és csak egy texture fetch van benne, a sin és cos utasítások száma pedig megduplázódott, 130-ra. Lássuk, mi változott a terhelés növekedésével:

Az abszolút számokat leszámítva szinte megegyezik az előző diagrammal. Ezúttal az összes GPU megközelítőleg ugyanazon a pozíción maradt, csakhogy a Cayman és Cypress alapú videokártyák helyet cseréltek - most az újabb modell valamivel gyorsabb, de nem sokkal. Bár még mindig nincs szigorú megfelelés a csúcsteljesítmény elméleti adataival, eredményeik még mindig közel állnak a száraz elmélethez. A HD 7990 és a HD 6970 közötti különbség kissé nőtt.

Egyébként semmi újat nem találtunk a diagramon. A renderelési sebességet ebben a tesztben kizárólag a shader egységek teljesítménye és azok hatékonysága korlátozza, így a dual-chip HD 6990 ismét egyértelmű vezető lett, és az AMD mai újdonsága is tisztes távolságban követi. Mindkét Geforce lap még a Radeon HD 5800 család elavult modelljénél is alulmúlja, ezúttal azonban az AMD megoldások előnye valamivel kisebb marad, mint az elméleti számok összehasonlításakor, és ez ismét rosszabb optimalizációt vagy PowerTune hatást jelez.

Direct3D 10: Geometry Shader tesztek

A RightMark3D 2.0-ban két geometriai árnyékoló sebességteszt létezik, az első opció neve "Galaxy", a technika hasonló a Direct3D korábbi verzióinak "pont spritejéhez". Egy részecskerendszert animál a GPU-n, minden pontból egy geometriai árnyékoló négy csúcsot hoz létre, amelyek részecskéket alkotnak. Hasonló algoritmusokat széles körben kell használni a jövőbeni DirectX 10 játékokban.

A geometria shader teszteknél az egyensúly megváltoztatása nem befolyásolja a végeredményt, a végső kép mindig pontosan ugyanaz, csak a jelenetfeldolgozási módok változnak. A "GS load" paraméter határozza meg, hogy melyik shaderben történjen a számítás – csúcsban vagy geometriában. A számítások száma mindig azonos.

Tekintsük a „Galaxy” teszt első verzióját a vertex shaderben végzett számításokkal a geometriai összetettség három szintjére:

A jelenetek különböző geometriai összetettségű sebességeinek aránya minden megoldásnál megközelítőleg azonos, a teljesítmény a pontok számának felel meg, minden lépésnél körülbelül kétszeres az FPS csökkenés. A modern videokártyák feladata nem túl nehéz, a teljesítménynek pedig elsősorban a geometriai feldolgozás sebessége szab határt, de a memória sávszélessége/kitöltési sebessége is (egy gyártó megoldásain belül).

Ebben a tesztben a Southern Islands továbbfejlesztett geometria-feldolgozási képességeinek kellett volna megjelenniük, és így megjelentek. Az új AMD grafikus kártya valóban sokkal gyorsabb a geometriai számításokban, mint a cég összes korábbi megoldása. Bár az AMD akár 4-szeres növekedési mutatókat adott, ebben a tesztben a geometriai teljesítmény körülbelül 1,5-2-szeresére nőtt. Ennek eredményeként az egylapkás videokártya megközelítőleg azonos szintűnek bizonyult az előző generációs GPU-n lévő kétchipes Radeon HD 6990 modellel.

Egy ilyen jelentős javulás oda vezetett, hogy Tahiti majdnem utolérte az Nvidia csúcskategóriás videokártyáját, bár annak bizonyos körülmények között még hatékonyabbnak kellene lennie a geometria árnyékolók végrehajtásában. Korábban az Nvidia grafikus kártyái körülbelül kétszer olyan gyorsak voltak, mint a hasonló versenytársak kártyái, de most már nincs különbség. Nézzük meg, hogyan változik a helyzet, amikor a számítások egy részét átvisszük a geometria árnyékolóba:

Amikor a terhelés megváltozott ebben a tesztben, a számok szinte változatlanok maradtak az Nvidia megoldások és a legtöbb AMD kártya esetében. Ebben a tesztben csak a HD 7900 család új videókártyája reagált rosszul a GS terhelési paraméterének változására, amely a számítások egy részének a geometria shaderre való átviteléért felelős. Ezért a tábla valamivel magasabb eredményt mutatott, mint az előző diagramon. Lássuk, mi fog változni a következő tesztben, amely nagy terhelést feltételez a geometria-shaderekre.

A "Hyperlight" a geometria-shaderek második tesztje, amely egyszerre több technika használatát mutatja be: példányosítás, adatfolyam kimenet, pufferterhelés. Dinamikus geometria létrehozását használja két pufferbe való rajzolással, valamint a Direct3D 10 új funkcióját - stream kimenetet. Az első shader generálja a sugarak irányát, növekedési sebességét és irányát, ezek az adatok egy pufferbe kerülnek, amit a második shader használ a rendereléshez. A gerenda minden pontjára 14 csúcsot építenek egy körbe, összesen legfeljebb egymillió kimeneti pontot.

Egy új típusú shader programmal "sugarak" generálnak, és a "GS load" paramétert "Heavy"-re állítják - ezek rajzolására is. Vagyis a "Kiegyensúlyozott" módban a geometriai shadereket csak sugarak létrehozására és "növesztésére" használják, a kimenetet "példányozással" hajtják végre, és a "Heavy" módban a geometriai shader is részt vesz a kimenetben. . Nézzük először az egyszerű módot:

A relatív eredmények a különböző módokban ismét nagyjából megfelelnek a terhelésváltozásoknak: a teljesítmény minden esetben jól skálázódik, és közel áll az elméleti paraméterekhez, amely szerint minden következő sokszög számlálási szintnek kétszer olyan lassúnak kell lennie.

Ebben a tesztben a renderelési sebességet a geometriai teljesítmény korlátozza, és az AMD új architektúrája remekül teljesít, még a Geforce GTX 580-zal szemben is kissé felülmúlja versenytársát! Itt mindkét dual-chip tábla hibás eredményt mutatott, így nem tudjuk őket összehasonlítani velük. De a HD 7970 40-50%-kal gyorsabb elődjénél, a HD 6970-nél, ami egyértelműen a GPU architekturális változásainak köszönhető. A Tahiti térkép kiváló eredményei egyértelműen tanúskodnak az új chip geometriai adatfeldolgozó egységeiben végzett optimalizálásról.

A számoknak nagyot kell változniuk a következő diagramon, egy tesztben a geometria-shaderek aktívabb használatával. Érdekes lesz összehasonlítani egymással a "Kiegyensúlyozott" és a "Nehéz" módban kapott eredményeket.

De itt a Radeon HD 7970-nek nem sikerült rekordot elérnie, elvégre jól észrevehető a különbség a hagyományos grafikus pipeline AMD chipek (beleértve a Cayman-t Tahitivel két raszterezővel) és a Fermi architektúrájú chipek között, amelyek párhuzamos geometria-feldolgozást tartalmaznak. . A GF110 chipre épülő Geforce GTX 580 eredményei pedig olyan jók, hogy az AMD legjobb megoldásait (és ez a ma bejelentett modell) 35-40%-kal felülmúlja.

Bár az AMD új csúcskategóriás chipjének képességei a geometriafeldolgozás és a geometriai shaderek végrehajtási sebessége tekintetében egyértelműen nőttek a cég korábbi videokártyáihoz képest, a Tahiti chipre épülő első megoldás 22-28%-kal magasabb eredményt mutat ezek a tesztek, mint a Cayman alapú megoldások. Valószínűleg az AMD mérnökei úgy döntöttek, hogy a háromszögek és a geometriai feldolgozó egységek ilyen optimalizálása elegendő lesz.

Direct3D 10: textúra lekérési sebesség a vertex shaderekből

A "Vertex Texture Fetch" tesztek nagyszámú textúra lekérésének sebességét mérik egy vertex shaderből. A tesztek lényegét tekintve hasonlóak, tehát a „Föld” és a „Hullámok” tesztben a kártyák eredményei közötti aránynak megközelítőleg azonosnak kell lennie. Mindkét teszt textúra mintavételi adatokon alapuló eltolásleképezést használ, az egyetlen lényeges különbség, hogy a "Waves" teszt feltételes ugrásokat használ, míg a "Föld" teszt nem.

Tekintsük az első „Föld” tesztet, először „Effect Detail Low” módban:

Korábbi tanulmányok kimutatták, hogy ennek a tesztnek az eredményét egyszerre sok minden befolyásolja: mind a textúrázási sebesség, mind a memória sávszélessége. A videokártyák eredményeit pedig gyakran korlátozza valamilyen gát – nézzük csak meg a kétchipes GTX 590 és az egychipes analóg összehasonlítását – szinte semmi különbség nincs köztük. Bár a HD 6990 kétszer olyan gyors, mint a HD 6970.

A Radeon HD 7970 család új AMD kártyája pedig nagyon jó eredményeket mutatott fel, majdnem utolérte a vezető HD 6990-et. Ami az egychipes versenytársakat illeti, mindhárom módban a legjobb. Az előny a HD 6970-hez képest módtól függően 25% és 75% között mozgott. Nézzük meg a teljesítményt ugyanabban a tesztben, megnövekedett számú textúralekéréssel:

De ezúttal észrevehetően megváltozott a kártyák egymáshoz viszonyított helyzete a diagramon, és ez különösen igaz a kemény módra. Kis számú sokszög esetén a renderelési sebesség ebben a tesztben a memória sávszélességén múlik, ezért voltak olyan erősek az AMD kártyák az előző diagramon.

De nehéz módokban az Nvidia egylapkás kártyája és az AMD új kártyája között csökkent a különbség, és meglehetősen szoros küzdelemben versenyeznek egymással. A Radeon HD 6900 család régebbi, kétchipes videokártyája minden más megoldást felülmúl, és ehhez képest a legjobb, bár a Geforce GTX 590 megközelíti azt heavy módban.Az új egylapkás HD 7970 ismét akár 70-el felülmúlja elődjét %, ami a memória sávszélességének erős befolyását jelezheti.

Tekintsük a vertex shaderekből származó textúra lekérések második tesztjének eredményeit. A Waves teszt kevesebb mintát tartalmaz, de feltételes ugrásokat használ. A bilineáris textúra minták száma ebben az esetben csúcsonként legfeljebb 14 ("Effect detail Low") vagy 24 ("Effect detail High") lehet. A geometria összetettsége az előző teszthez hasonlóan változik.

A második "Waves" vertex textúrázási teszt eredményei teljesen eltérnek attól, amit az előző diagramokon láttunk. Ebben a tesztben a HD 6990 és a HD 7970 kivételével az AMD és az Nvidia videokártyák nagyon közeli eredményeket mutatnak, ami ismét a videomemória sávszélességének korlátozottságára vezethető vissza, hiszen ez a mutató az összes bemutatott videokártyánál közel van.

Ám a Southern Islands család új modellje sikerült kiemelkedni, nehéz összehasonlítási körülmények között majdnem utolérte a duplachipes HD 6990-et, amely az összes videokártya közül a legjobb lett. A Cayman és Tahiti GPU-ra épülő kártyák között ismét 25-70% volt a különbség az újabb megoldás javára. Tekintsük ugyanennek a tesztnek a második változatát:

Aztán a korábban látottakhoz hasonló változások következtek – az Nvidia videokártyák csak light módban "ereszkedtek le", a legtöbb AMD megoldás pedig egyszerre. Ez azonban nem tette lehetővé, hogy a kaliforniai cég táblái utolérjék a Radeon 7900-as család újdonságát, amely egyébként közepes és nehéz üzemmódban mindenkit megelőzött, és csak egyszer engedett a duplachipes HD 6990-nek.

Alacsony poligon módban nem olyan nagy a különbség a megoldások között, de közepes és nehéz módban a régi AMD megoldások gyengébbek, ezt követik az Nvidia lapok (a kétchipes csak valamivel gyorsabb, mint az egy- chip GTX 580), a HD 6990 és a HD 7970. A HD 7900 család kártyája a csúcskiválasztás tesztjein ma bejelentette, hogy kiválónak bizonyult, jócskán megelőzve az Nvidia és az azonos gyártó elődei konkurens videokártyáit.

3DMark Vantage: Funkciótesztek

Mint mindig, a 3DMark Vantage csomag szintetikus tesztjei megmutathatnak valamit, amit korábban elmulasztottunk. A tesztcsomag szolgáltatástesztjei DirectX 10-kompatibilisek, és érdekesek, mert különböznek a miénktől. A csomagban található új Radeon HD 7970 videokártya eredményeit elemezve olyan új és hasznos következtetéseket vonhatunk majd le, amelyek a RightMark család tesztjei során elkerültek bennünket.

1. jellemző teszt: Textúra kitöltés

Az első teszt a textúra lekérési sebesség tesztje. Egy téglalap kitöltésére szolgál egy kis textúrából kiolvasott értékekkel, több textúrakoordinátával, amelyek minden képkockát megváltoztatnak.

Bár a Futuremark tesztje továbbra sem mutatja az elméletileg lehetséges textúralekérési sebességet, mind az AMD, mind az Nvidia videokártyák hatékonysága még így is érezhetően magasabb benne, mint a miénkben a RightMarktól. Ezért ebben a textúra tesztben kissé eltérő arányú eredményeket kapunk, ami közelebb áll az igazsághoz.

Az AMD új családjának első videókártyája a megfelelő elméleti paraméterhez közeli eredményt mutat, és hatékonyabban birkózik meg a munkával, mint az előző generáció. A Radeon HD 7970 több mint 50%-kal felülmúlja a HD 6970-et, bár az elméleti különbség csak 40%. Valószínűleg a Tahiti textúraegységeit hatékonyabban használják a memória és a gyorsítótár-rendszer fejlesztései miatt, ami a megnövekedett eredményt okozta.

Természetesen az új egychipes modell elmaradt a vezetőtől - a kétlapkás HD 6990-től, de ez nem volt várható. És mégis jól látható, hogy a Tahiti grafikus chip textúrateljesítménye jelentősen megnőtt a Caymanhoz képest. Nos, a GTX 580 akár 2,3-szor veszít az új termékkel szemben a textúrázási sebesség tekintetében. Még a két GPU-s Nvidia kártya is csak a HD 6970-hez ér utol.

2. jellemzőteszt: Színkitöltés

Ez egy kitöltési arány teszt. Nagyon egyszerű pixel shader-t használ, amely nem korlátozza a teljesítményt. Az interpolált színértéket a rendszer egy képernyőn kívüli pufferbe (renderelési cél) írja alfa keveréssel. 16 bites FP16 képernyőn kívüli puffert használ, ami a leggyakrabban használt HDR-megjelenítést használó játékokban, így ez a teszt meglehetősen időszerű.

A ROP egység teljesítménytesztjének helyzete nagyon eltér a textúrázási teszttől. A 3DMark Vantage résztesztjének számai a ROP egységek teljesítményét mutatják, de a videomemória sávszélességének (az úgynevezett "effektív kitöltési sebesség") befolyásával. És itt az új HD 7970 modell kiváló eredményt mutat, csak a korábbi generációk két csúcs AMD és Nvidia videokártyája mögött, amelyek két GPU-t tartalmaznak.

De mi a helyzet a ROP blokkok használatának hatékonyságával, amellyel az AMD dicsekedett? Valójában az új Tahiti chipben mindössze 32 ROP egyáltalán nem korlátozza a renderelési sebességet, még egy speciális tesztben sem. És megjegyezzük, hogy az új AMD grafikus kártya valamivel magasabb ROP-hatékonyságot és gyorsabb kitöltési arányt mutat a régebbi modellekhez képest. A HD 7970 és a HD 6970 közötti különbség több mint 50%, ami egyértelműen a sávszélesség nagyobb befolyását jelzi, nem pedig a ROP egységek tiszta teljesítményét.

Ami az Nvidiával való összehasonlítást illeti, itt is a sebességbeli különbség (35%) a memóriasávszélesség elméleti különbségének (36%) felel meg, nem pedig a ROP blokkok tiszta sebességének. Kiderült, hogy 32 ilyen blokk a Kajmánban egyszerűen felesleges volt, és képességeiket soha nem használták ki teljesen.

3. jellemző teszt: Parallax okklúziós leképezés

Az egyik legérdekesebb funkcióteszt, mivel ezt a technikát már használják a játékokban. Egy négyszöget (pontosabban két háromszöget) rajzol a speciális, összetett geometriát utánzó Parallax Occlusion Mapping technikával. Meglehetősen erőforrás-igényes sugárkövetési műveleteket és nagy felbontású mélységtérképet használnak. Ezt a felületet is árnyékolják a nehéz Strauss-algoritmus segítségével. Ez egy nagyon összetett és nehéz pixel shader tesztje egy videochiphez, amely számos textúra lekérést tartalmaz sugárkövetés, dinamikus elágazás és összetett Strauss-világítási számítások során.

Ez a teszt abban különbözik a többi hasonló teszttől, hogy az eredmény nem csak a matematikai számítások sebességétől, az elágazások végrehajtásának hatékonyságától vagy a textúrák lekérésének sebességétől függ, hanem egy kicsit mindentől. A nagy sebesség eléréséhez itt fontos a GPU blokkok egyensúlya, ami a shaderekben az elágazás sebességére és hatékonyságára is nagyon érezhetően hat.

Az ábrán látható AMD videokártyák összehasonlító eredményei általában hasonlóak ahhoz, amit a 3DMark Vantage textúra teljesítménytesztjénél láttunk, azzal a különbséggel, hogy az új Radeon HD 7970 egyértelműen hatékonyabb ebben a feladatban is, mert ismét majdnem utolérte. a dual-GPU HD 6990 – kiváló eredmény! Az Nvidia lapok teljesítménynövekedést kaptak ebben az esetben, ami megerősíti azt a következtetést, hogy nem csak a textúra teljesítménye befolyásolja a teszt eredményeit.

Az AMD új modellje tehát jól teljesít, jócskán enged a két kajmánon alapuló kétlapkás lapnak. 66%-kal előzte meg egychipes elődjét. Ez a szám egyetlen elméleti paraméterben sem felel meg a Kajmán-szigeteki és Tahiti közötti gyorsulásnak, és az összetett elágazási számítások végrehajtásának hatékonyságának javulását jelezheti. A Geforce GTX 580 korábban jónak tartott eredménye is kétszer olyan rossz, mint az új AMD-é. Valójában ennek a gyártónak az összes videokártyája gyorsabbnak bizonyult, mint a Geforce GTX 500 sorozat csúcsmodellje, amely egyetlen chipre épül.

4. szolgáltatásteszt: GPU-szövet

A teszt érdekessége, hogy egy videochip segítségével számítja ki a fizikai kölcsönhatásokat (szövetimitáció). Csúcsszimulációt alkalmazunk, a vertex és a geometria shader kombinált működésével, több lépéssel. Használja a stream out-ot a csúcsok egyik szimulációs lépésből a másikba való átviteléhez. Így teszteljük a csúcs- és geometria-shaderek végrehajtásának teljesítményét és a kiáramlási sebességet.

A renderelési sebesség ebben a tesztben sok más paramétertől is függ. A fő tényezők itt a geometria feldolgozás teljesítménye és a geometria árnyékolók hatékonysága. Tehát teljesen logikus, hogy az Nvidia videokártyák remekül érzik magukat ebben az alkalmazásban, jóval megelőzve versenytársaikat.

És még a ma bemutatott Radeon HD 7970, annak ellenére, hogy a HD 6970-hez képest egyértelmű teljesítményjavulást mutatott, itt nem tudta felvenni a versenyt az egychipes Geforce GTX 580-zal, és némileg alulmúlta azt. Ez egyike azoknak a geometriai teszteknek, amelyek megmutatják a legújabb HD 6900-as videokártyák előnyét a korábbi sorokkal szemben, amelyekben megnövelték a geometriafeldolgozás és a geometria-shaderek sebességét. A Radeon HD 7970 további 35%-kal javította az eredményt, de ez nem volt elég – ebben a tesztben továbbra is az Nvidia megoldásai vezetnek. Bár megjegyezzük, hogy az új modell így is jelentősen javította az AMD pozícióját a geometriai tesztekben.

5. szolgáltatásteszt: GPU részecskék

Teszt az effektusok fizikai szimulálására videochip segítségével kiszámított részecskerendszereken. Csúcsszimulációt is alkalmaznak, minden csúcs egyetlen részecskét képvisel. A Stream out ugyanarra a célra használható, mint az előző tesztben. Több százezer részecskét számítanak ki, mindegyiket külön animálják, és a magassági térképpel való ütközésüket is kiszámítják.

Hasonlóan az egyik RightMark3D 2.0 tesztünkhöz, a részecskéket egy geometria árnyékolóval rajzoljuk meg, amely minden pontból négy csúcsot hoz létre a részecske kialakításához. De a teszt leginkább a shader blokkokat tölti be vertex számításokkal, a stream out is tesztelésre kerül.

A 3DMark Vantage csomag következő tesztjének eredményei hasonlóak az előző diagramon látottakhoz, de a geometria-feldolgozás sebessége még fontosabbá vált. És így az Nvidia videokártyák még tovább nyomultak előre, még a kétchipes szörnyeteg - a Radeon HD 6990 -et is maga mögött hagyva. Jaj, ez tény - még a GTX 580 is megelőzte az összes AMD kártyát, beleértve a Tahiti GPU-ra épülő vadonatúj modellt is.

Sajnos, bár az új chipre épülő tábla erősebb eredményt mutatott a Cayman és Cypress alapú megoldásokhoz képest, a Geforce lemaradt. A HD 7970 és a HD 6970 közötti különbség ebben az összehasonlításban valamivel több mint 30% volt, ami az ALU sebességének egyértelmű hatását jelzi. A 3DMark Vantage szintetikus textil- és részecskeszimulációs tesztjein, amelyek aktívan használnak geometriai árnyékolókat, az AMD megoldásai továbbra is lemaradnak a rivális videokártyák mögött, amelyek nagyon nagy geometriai feldolgozási sebességgel rendelkeznek.

6. szolgáltatásteszt: Perlin-zaj

A Vantage csomag utolsó funkciótesztje a videochip matematikailag intenzív tesztje, a Perlin zajalgoritmus több oktávját számolja ki a pixel shaderben. Mindegyik színcsatorna saját zajfunkciót használ a videochip terhelésének növelésére. A Perlin zaj egy szabványos algoritmus, amelyet gyakran használnak az eljárási textúrákban, és sok matematikát használ.

Érdekes módon a Futuremark csomagból származó matematikai tesztben, amely a videochipek csúcsteljesítményét mutatja limitfeladatokban, teljesen más képet láttunk a tesztcsomagunk hasonló tesztjeihez képest. A diagramon látható megoldások teljesítménye csak nagyon durván felel meg annak, amit az elmélet szerint meg kellene kapni, és el is tér attól, amit korábban a RightMark 2.0 csomag matematikai tesztjei során láttunk. Jól látható például, hogy az új videókártya ebben a tesztben sokkal közelebb került az elméleti sebességhez, mint a GPU-alapú VLIW architektúrájú kártyákhoz.

Nézzük az okokat. Valamikor a HD 6970 nem javította a matematikai csúcsteljesítményt a HD 5870-hez képest, de ez önmagában nem magyarázza meg a Kajmánok elmaradását. Az ok egyrészt a VLIW4 architektúra alacsonyabb hatékonysága, másrészt az intelligens energiagazdálkodási rendszer lehet, amely a beállított fogyasztási küszöb elérésekor "megölte" a megoldások órajelét és teljesítményét.

De ez nem befolyásolta a HD 7970-et. Valószínűleg az ok csupán az új chip skaláris architektúrájában keresendő. Mert a tesztben szereplő és az elméleti teljesítményadatok aránya egyértelműen ezt jelzi. Elméletileg a HD 6970 az új kártya matematikai erejének 0,7-ével rendelkezik, de ezen a teszten ez csak 0,56-nak bizonyult. Körülbelül ugyanez a különbség a többi AMD kártya esetében is. De ha összehasonlítjuk a skaláris architektúrájú GTX 580-at és a HD 7970-et, akkor az elméleti arány 0,42 (Tahiti több mint kétszer olyan gyors), és a gyakorlati arány is 0,42. Vagyis a különböző gyártóktól származó chipekhez a rendelkezésre álló ALU-k használatának hatékonysága teljesen azonos! Ellentétben a Cayman és a Cypress, amelyek VLIW architektúrával rendelkeznek.

Mindenesetre az új AMD lap mindkét Nvidia versenytársát felülmúlja hatalmas különbséggel, és az Nvidiának egyértelműen drasztikusan növelnie kell matematikai erejét a jövőbeli megoldásaiban. Mindeközben a szokásos kép rajzolódik ki - a Geforce videokártyák gyenge eredményeket mutatnak azokban az esetekben, amikor az egyszerű és intenzív matematikát sokkal gyorsabban hajtják végre a Radeon kártyákon. A Déli-sziget kilépése pedig csak súlyosbította a helyzetet.

Direct3D 11: Shaderek számítása

Az AMD új megoldásainak teszteléséhez azokban az alkalmazásokban, amelyek olyan új DirectX 11-szolgáltatásokat használnak, mint a tesselláció és a számítási árnyékolók, mintákat használtunk az SDK-kból, valamint a Microsoft, az Nvidia és az AMD demóiból.

Először is nézzük meg a Compute shadereket használó teszteket. Megjelenésük az egyik legfontosabb újítás a DX API legújabb verzióiban, már a modern játékokban is alkalmazzák különféle feladatok elvégzésére: utófeldolgozás, szimuláció, stb. a DirectX SDK-ból, utófeldolgozással, amely pixel- és számítási árnyékolókat használ.

Lehet, hogy nem ez a legjobb példa a számítási árnyékolókra, de elég jól mutatja a teljesítménybeli különbséget. Szinte nincs különbség a számítások között az AMD videokártyák számítási és pixel shaderei között, az Nvidián pedig a pixeles valamivel gyorsabb.

Az AMD Radeon HD 6970 gyorsabbnak bizonyult elődjénél, a HD 5870-nél, és a Geforce GTX 580 szintjén teljesített, de a ma bemutatott HD 7970 messze megelőzi őket, és vezető szerepet tölt be (úgy döntöttünk, hogy nem használunk két chipet videokártyák ebben a szintetikus). A GTX 560 Ti elsősorban geometriai tesztekre készült, illetve a különböző árszegmensek megoldásai közötti különbségek értékelésére.

Tehát az új Tahiti chipre épülő bejelentett tábla 40%-kal megelőzi a Cayman alapú analógot, ami teljes mértékben megfelel a számítási egységek elméleti teljesítményében mutatkozó különbségnek. A versenytárs GTX 580-hoz képest viszont 30-40% az előnye (a shader program típusától függően), ami egyértelműen alacsonyabb az elméletileg lehetségesnél. A GTX 560 Ti messze elmarad, több mint duplája.

A második számítási árnyékoló teszt szintén a Microsoft DirectX SDK-ból származik, és egy N-test (N-test) gravitációs számítási problémát mutat be, egy dinamikus részecskerendszer szimulációját, amely fizikai erőknek, például gravitációnak van kitéve.

Ennek a tesztnek az eredményei nagyon szokatlanok, az elavult AMD megoldások esetében hasonlóak a 3DMark Vantage matematikai tesztjeihez – a Cypress gyorsabbnak bizonyult, mint a Cayman. A csúcsszámok nagy elméleti fölénye ellenére az AMD leggyorsabb grafikus kártyája – a ma bemutatott új Radeon HD 7970 – mindössze 21%-kal előzi meg az Nvidia csúcsmegoldását. És még a GTX 560 Ti sem marad el sokkal. A HD 6900 és HD 5800 családok régi modelljei a Geforce GTX 580-hoz közeli eredményeket mutatnak.

Leginkább a Kajmán és Tahiti döntéseinek különbségére vagyunk kíváncsiak, és ebben az esetben a friss modell 36%-os előnyét látjuk. Ez valamivel kevesebb, mint a modellek közötti elméleti különbség, de még mindig közel áll hozzá. Miért nem tűnt ki mindkét kártya a nagyon régi HD 5870 hátteréből? Talán a PowerTune csökkentett gyakorisága vagy az új architektúra illesztőprogramjainak optimalizálásának hiánya a felelős. Lássuk, végre jelentős gyorsulást mutat-e Tahiti a tessellációs teszteken.

Direct3D 11: Tesselációs teljesítmény

A számítási árnyékolók nagyon fontosak, de a Direct3D 11 fő újítása továbbra is a hardveres tesszelláció. Az Nvidia GF100-ról szóló elméleti cikkünkben részletesen megvizsgáltuk. A Tessellationt régóta használják DX11 játékokban, mint például a STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 és mások. Némelyikük tesszellációt használ karaktermodellekhez, mások valósághű vízfelületet vagy tájat szimulálnak.

Számos különböző séma létezik a grafikus primitívek particionálására (tesselláció). Például phong tesselláció, PN háromszögek, Catmull-Clark felosztás. Tehát a PN-háromszögek csempézési sémáját a STALKER: Call of Pripyat és a Metro 2033 - Phong tessellációban használják. Ezek a módszerek viszonylag gyorsan és egyszerűen beépíthetők a játékfejlesztési folyamatba és a meglévő motorokba, ezért váltak népszerűvé.

Az első tessellációs teszt az ATI Radeon SDK-ból származó Detail Tessellation példa lesz. Nemcsak tesszellációt valósít meg, hanem két különböző pixelenkénti feldolgozási technikát is: a normál térképek egyszerű átfedését és a parallaxis okklúziós leképezést. Nos, hasonlítsuk össze az AMD és az Nvidia DX11 megoldásait különböző körülmények között:

Érdekes módon a parallaxis okklúziós leképezés (a diagramon középső sávok) mindkét gyártó videokártyáján jóval kevésbé hatékony, mint a tesszelláció (alsó sávok), és a mérsékelt tesszelláció nem ad nagy teljesítménycsökkenést - hasonlítsa össze a felső és az alsó sávot. Vagyis a pixelszámításokat használó kiváló minőségű geometriai szimuláció még alacsonyabb teljesítményt biztosít, mint az eltolásleképezéssel ellátott mozaikszerű geometria.

Ami a videokártyák egymáshoz viszonyított teljesítményét illeti, először nézzük meg a pixelenkénti technikákat. Az egyszerű bumpmapping tesztben az AMD új grafikus kártyája vezet az élen, mind a HD 6970-et, mind a GTX 580-at 27%-kal, illetve 36%-kal megelőzve. De az összetett pixelenkénti számítási résztesztben (emlékezzünk a fenti parallaxis leképezési tesztekre), a Cayman megjelenése előtt a Geforce videokártyák gyorsabbak voltak, mint az AMD megoldások, valamint a tesszelláció bekapcsolásával. A Radeon HD 6970 megjelenésével a tesszellációs résztesztben észrevehetően gyorsabbnak bizonyult, mint a HD 5870, a kis háromszög hasítási tényezővel végzett tesztben pedig a HD 6970 még a GTX 580-at is megelőzte.

Sokkal érdekesebb az, amit a Radeon HD 7970 címkével ellátott diagramon láttunk. A tesszelláció itt nem túl bonyolult, így az új videokártya nem sokkal - körülbelül 30%-kal - felülmúlta az előző modellt. Egy másik dolog a POM teszt. Ebben a résztesztben az új HD 7970 egyszerűen darabokra tépte az összes többi megoldást. Az előny a HD 6970 és GTX 580 előtt csak valamivel kevesebb, mint duplája. Egy másik szuper eredmény a parallaxis leképezési tesztben, amely az összetett shader programok végrehajtásának nagy hatékonyságáról beszél.

A második tesszellációs teljesítményteszt egy újabb példa az ATI Radeon SDK - PN Triangles 3D-s fejlesztői számára. Valójában mindkét példa a DX SDK része is, így biztosak vagyunk benne, hogy a játékfejlesztők ezek alapján készítik el saját kódjukat. Ezt a példát egy másik tessellációs tényezővel teszteltük, hogy megtudjuk, mennyire befolyásolja az általános teljesítményt.

De ebben a példában már teljes értékű összehasonlítást láthatunk az AMD és az Nvidia megoldások geometriai erejéről különböző körülmények között. És véleményünk szerint nagyon érdekesnek bizonyult. Erősen kiemelkedik a Fermi grafikus architektúra, és az AMD új Tahiti architektúrájának chipje. Természetesen ez egy tisztán szintetikus teszt, és a közeljövőben nem valószínű, hogy szélsőséges felosztási tényezőket alkalmaznak a játékokban, különösen a teljes multiplatform miatt. Érdekelnek bennünket az építészeti lehetőségek, ezért van szükségünk „műanyagra”.

Ha fényviszonyok között az új Radeon HD 7970 sikeresen felveszi a versenyt a Geforce GTX 580-al, a legkönnyebb módokban is felülmúlja azt, és egyenrangú a harmadikban, de a legnehezebb körülmények között nagyon sok háromszöggel egy Nvidia Geforce videóval A GF110 chipre épülő kártya egyszerűen lehetetlen versenyezni - extrém tesszellációs feladatokban sokkal gyorsabb, mint akár többször javított AMD chipek. Bár az új GPU ismét csökkentette a lemaradást versenytársától a geometria-feldolgozási feladatokban, a GF110 16 tesszellációs blokkja még mindig nagyon messze van a párhuzamosítástól. És még a GF114 is a maximális megosztási arány mellett gyorsabbnak bizonyult, mint Tahiti.

Annak ellenére azonban, hogy a legzordabb körülmények között a legmagasabb megosztási aránnyal veszített, a tahiti alapú HD 7970 egyébként remekül teljesített, különösen a Cayman és a Cypress összehasonlításában. Az AMD új modellje könnyű és közepes terhelésű módban lenyűgöző sebességnövekedést mutat, a különbség pedig az amúgy is lassú HD 6970-hez képest eléri a 2,8-szeresét. De ilyen növekedést csak szélsőséges esetben látunk, és leggyakrabban 30-ról 70% -ra. Nem láttuk a beígért négyszeres különbséget, legalábbis még nem.

De a maximális különbséget a cégek megoldásai között extrém tesszelációs körülmények között érik el, ami nem lesz a hozzájuk közel álló játékokban és benchmarkokban. Ezért arra számítunk, hogy Tahiti jelentősen javítani fogja az AMD teljesítményét a meglévő tessellációs benchmarkokban, mint például a 3DMark11 és a Heaven.

Vessünk egy pillantást egy másik tesztre, az Nvidia Realistic Water Terrain demóprogramra, más néven Szigetre. Ez a demó tesszellációt és eltolásleképezést használ, hogy valósághű megjelenésű óceánfelszínt és terepet jelenítsen meg. Nagyon jól néz ki, ez hiányzik a jelenlegi játékokból:

Az Island nem pusztán szintetikus geometriai teljesítményteszt, összetett pixel- és számítási shadereket is tartalmaz, és egy ilyen terhelés közelebb áll azokhoz a valódi játékokhoz, amelyek minden GPU-egységet egyszerre használnak, és nem csak geometrikusakat, mint az előző benchmarkban.

A programot négy különböző tesszellációs tényezővel is teszteltük, ezt a beállítást Dynamic Tessellation LOD-nak hívják. És ha a legalacsonyabb felosztási tényező mellett az összes AMD videokártya előrébb van, akkor a munka összetettségével az Nvidia chipekre épülő kártyák kezdik átvenni a vezetést. A partíciótényező és a jelenet összetettségének növekedésével pedig az összes Radeon teljesítménye drámaian csökken, ellentétben a versengő megoldásokkal.

Érdekes a Radeon HD 7970 viselkedése a tesztben. Azonnal kiderül, hogy a geometriai csővezetéken nem történtek kardinális változtatások (általában ezt nem ígérték, így nem lehet panasz). Ha a legkönnyebb módban az új kártya 35%-kal gyorsabb, mint a HD 6970, és 64%-kal a GTX 580, akkor még akkor is, ha a LOD 25-re van állítva, az új kártya teljesítménye a sebesség szintjére csökken. a GTX 560 Ti. Tovább tovább. A maximális LOD arány mellett a Geforce GTX 580 és a Radeon HD 7970 sebessége közötti különbség elérte a 3,5-szeresét!

Nézzük meg, hogy a HD 7970 és a HD 6970 között elértük-e az ígért négyszeres különbséget. Nem, a Cayman GPU maximális késése kevesebb volt, mint kétszeres. És gyakrabban csak másfél. Általában nem nagyon világos számunkra, hogy hol keressük a tesszelláció négyszeres gyorsulását, marad a szóban hinni, hogy valahol van. Addig is kijelentjük, hogy újabb győzelmet aratott az Nvidia videochipje - nagyon jók a geometriai tesztekben.

Következtetések a szintetikus tesztekről

A Southern Islands családból származó Tahiti GPU-n alapuló Radeon HD 7970 videokártya szintetikus tesztjeink, valamint a két különálló videochip gyártója által gyártott más videokártya-modellek eredményei alapján megállapíthatjuk, hogy arra a következtetésre jutottak, hogy az új termék mindenképpen vezető szerepet tölt be a piacon elérhető egychipes megoldások között. Ez csak egy nagyszerű folytatása a sikeres Radeon HD 5800 és HD 6900 vonalnak, aminek komolyan meg kell erősítenie az AMD pozícióját a következő hónapokban.

A Tahiti GPU a legújabb 28 nm-es folyamattechnológiát alkalmazó új architektúrán alapul, és nagyban különbözik a cég összes korábbi chipjétől. Bár a benne lévő végrehajtó egységek száma nem nőtt annyira (ALU-k és ROP-ok számítási egységek), az új GPU fontos architekturális változtatásokat tartalmaz, amelyek célja a GPU-n történő számítástechnika hatékonyságának növelése, valamint a geometriai teljesítmény javítása. adatfeldolgozás. Számos szintetikus tesztünk azt mutatta, hogy a számítási hatékonyság összetett problémák esetén, valamint a tesszelláció és a geometriai árnyékoló végrehajtásának sebessége jelentősen javult, bár nem mindig annyira, mint vártuk.

Az AMD videochipekkel történt valami, aminek meg kellett történnie. Ugyanaz, amit az Nvidia már túladott egy kicsit korábban. A grafikus számítástechnikáról az általános célú számítástechnikára való áttérés, a VLIW-ről a skaláris architektúrákra való átállás, valamint az egyéb fontos GPGPU-funkciók hozzáadásával, mint például a fejlett gyorsítótár és ütemezők hozzáadása az egyes számítási egységekhez, a chip bonyolultságának növekedését eredményezi. biztosan meghaladja a csúcsteljesítmény növekedését. Vagyis pusztán valójában kiderül, hogy a korábbi megoldások hatékonyabbak lehetnek - bár kevésbé produktívak, ez kisebb ráfordítással (chipkomplexitás formájában) érhető el.

Magyarázzuk meg ezt egy példával. A Radeon HD 7970 előnye ugyanazzal a Radeon HD 5870-el szemben egyes szintetikus tesztekben messze nem volt különbség a GPU bonyolultságában - elvégre a Cypressnek pontosan feleannyi tranzisztorja van (2,15 a 4,3 milliárddal szemben), és a tesztekben nagyon ritkán késik. annyi mögött. Kiderült, hogy a régi chip hatékonyabb, mint az új? Igen, de csak elavult, pusztán grafikai feladatokhoz! A nem grafikus számítások és sok összetett 3D számítás esetében Tahiti még több mint kétszer olyan erősnek bizonyult, mint a Cypress, és ezt a megfelelő szintetikus anyagok is megerősítik. A GPGPU a jövő, a videochipek feladatai pedig tovább bonyolódnak, így az AMD-nek egyszerűen nem volt más útja.

De az építészeti változtatásoknak és jellemzőinek köszönhetően az új sorozat videokártyája számos szintetikus tesztben, amely korábban az AMD megoldások "Achilles-sarka" volt, több mint versenyképes lett, különösen a közvetlen versenytárs Geforce GTX 580-hoz képest. , még a magasabb árat is figyelembe véve. Ez jól látható a RightMark szinte minden szintetikus tesztjén, a Vantage csomagokon és a különféle SDK-kból származó példákon.

De voltak potenciálisan... nos, nem olyan gyenge, de nem elég erős oldalai az új GPU-nak. Ezek között szerepel egyes matematikai tesztek teljesítményének nem túl nagy növekedése, illetve geometriai kérdések merülnek fel (például hol van a beígért négyszeres gyorsulás?). Annak ellenére, hogy a chip nagyobb összetettsége és területe azonos Caymanhoz képest, a HD 7970 modell eredményei néha alacsonyabbak a vártnál, amit nem mindig könnyű megmagyarázni. Feltételezzük, hogy az illesztőprogram-optimalizálás hiánya lehet a hibás, mivel az AMD számára ez az architektúra teljesen új, és gondos és hosszadalmas polírozást igényel. Egyes teszteknél a PowerTune energiagazdálkodási rendszer is meghibásodhat, ami a legnagyobb fogyasztás elérésekor a legigényesebb szintetikus teszteknél is csökkentheti az órajeleket, megakadályozva ezzel, hogy a kártya a végrehajtási egységek száma és azok órajele alapján a várt teljesítményt mutassa.

Bár összességében a szintetikus eredmények meglehetősen jónak bizonyultak, és különösen örömteli, hogy az AMD mérnökei szigorították néhány gyenge pontjukat. Sajnos a jelenlegi játékokban sokkal nehezebb lesz ilyen lenyűgöző eredményeket elérni, mint a fejlett szintetikával. Azonnal több okból is. Még csak azért is, mert a játékalkalmazások teljesítményét ritkán korlátozza a videokártya bármely jellemzője, ellentétben a szintetikus technológiával, és a grafikus architektúra ilyen radikális változása miatt az illesztőprogramokat továbbra is optimalizálni és optimalizálni kell. Ráadásul még a modern játékok is ritkán használják ki a csúcskategóriás PC grafikus kártyák teljes képességeit. Gyakran korlátozza őket a textúrák lekérésének sebessége és a tényleges kitöltési sebesség (videomemória sávszélessége), és ilyen körülmények között az ilyen összetett chipek nem nyílnak meg teljesen. Várnunk kell a nagy teljesítményű PC-exkluzívokra vagy a játékkonzolok következő generációjára.

Feltételezzük, hogy a Radeon HD 7970 szintetikus tesztek eredményeit megerősítik az anyagunk "játék" részében található megfelelő adatok. A játékok terén az új HD 7970-nek minden versenytársat felül kell múlnia, és legalább 30%-kal, vagy még többet kell felülmúlnia a Geforce GTX 580-at. Valószínűleg a szokásos módon fog működni - egyes teszteknél nagyobb lesz az előny, másokban pedig szinte semmi. Mindenesetre a HD 7970 legyen a legjobb az AMD és Nvidia egylapkás modelljei közül, legalábbis ehhez minden előfeltételt megtaláltunk. Tehát térjünk át az anyag következő részére - a játékok sebességének tanulmányozására.