7970 консумация. Видео карти

Нека да преминем към резултатите от измерването:

Консумирана мощност на цялата система в режим на празен ход, W.

Благодарение на оптимизацията на процеса и намаляването на напрежението в режим на празен ход консумацията на енергия е намаляла с почти три вата в сравнение с първата версия на Radeon HD 7970. Тук обаче не очаквахме революционни промени. Графичните карти AMD отдавна са успешни с технологията ZeroCore Power.

Консумирана мощност на цялата система под натоварване, W.

При натоварване Radeon HD 7970 GHz Edition консумира малко повече енергия от своя предшественик. Както можете да си представите, това се дължи на по-високите тактови честоти, тъй като AMD очевидно искаше да извлече максимална производителност от новите оптимизации на чиповете. Увеличението на консумацията на енергия от шест вата обаче е малко вероятно да повлияе на общата сметка за електроенергия.

Температура на празен ход, градуси по Целзий.

С нетърпение очаквахме резултатите от температурния тест. Поради по-ниското напрежение може да се очаква спад в температурите на празен ход. Но, уви, не поправихме промените.

Температура при натоварване, градуси по Целзий.

Интересното е, че получихме разликата между двете видео карти при натоварване. Моделът Radeon HD 7970 достигна 74°C, но GHz Edition достигна 72°C при същите условия. Може би този потенциал е станал възможен поради оптимизации, направени по време на производството на графичния процесор.

Ниво на шум в режим на празен ход, dB(A).

В режим на празен ход не получаваме почти никаква разлика в нивото на шума. Тъй като температурите са еднакви, няма нужда вентилаторът да се върти по-бързо или по-бавно.

Ниво на шум при натоварване, dB(A).

При натоварване разликата в нивото на шума стана по-значителна. „Старият“ Radeon HD 7970 работи с повече от един децибел по-високо от GHz Edition. Може би това се дължи на по-ниската температура на графичния процесор, което позволява на вентилатора да се върти малко по-бавно.

Методология на изпитване
Настройки на драйвера на AMD Catalyst - по подразбиране
антиалиасинг Настройки на приложението
Анизотропно филтриране Настройки на приложението
Теселация AMD Оптимизиран
Catalyst A.I. Качество на текстурния филтър Качество, активиране на оптимизиране на формата на повърхността
Изчакайте V-Sync Деактивирайте, освен ако приложението не посочва
AA режим Множество проби
Троен буфер Деактивирайте
Настройки на драйвера на NVIDIA
CUDA графични процесори всичко
Анизотропно филтриране Управление на приложения
Вертикална синхронизация Използвайте настройка на 3D приложение
Засенчване на фоновото осветление Изключено
Максимален брой предварително обучени рамки 3
Оптимизация на поточно предаване Автоматичен
Режим на управление на захранването Адаптивен
Изглаждане - гама корекция Изключено
Изглаждане - режим Контрол на приложението
Тройно буфериране Изключено
Ускорение на няколко дисплея Режим на много дисплея
Текстурно филтриране - анизотропна оптимизация Изключено
Текстурно филтриране – качество Качество
Текстурно филтриране - Отрицателно UD отклонение Позволява
Текстурно филтриране - трилинейна оптимизация На
ПрограмаAPIНастройкиТестови режимиРазрешение
3D Mark Vantage DirectX 10 Профили Performance, High, Extreme
3D Марк 11 DirectX 11 Профили Performance, Extreme
Unigine Heaven 2 DirectX 11 Максимална детайлност, DirectX 11, теселация в Extreme режим Без AA и AF / AA 4x, AF 16x 1920x1080 / 2560x1440
Crysis 2 + Adrenaline Crysis 2 Benchmark Tool DirectX 11 Карта на центъра/адреналина. Макс. детайлност, текстури с висока разделителна способност, DirectX 11 Edge AA 1920x1080 / 2560x1440
Far Cry 2 + Far Cry 2 Benchmark Tool DirectX 10 Малка карта на ранчото. Макс. детайлизиране Без AA / AA 4x 1920x1080 / 2560x1440
Показател за Metro 2033 + Metro 2033 DirectX 11 Максимална детайлност, DirectX 11, DOF, теселация, изключен NVIDIA PhysX Аналитичен AA, AF 4x / MSAA 4x, AF 16x 1920x1080 / 2560x1440
Извънземни срещу Хищник + Инструмент за сравнителен анализ на Alien срещу Predator DirectX 11 Максимална детайлност, DirectX 11 Без AA и AF / AA 4x, AF 16x 1920x1080 / 2560x1440
DiRT 3 DirectX 11 Максимална детайлност Без AA и AF / AA 4x, AF 16x 1920x1080 / 2560x1440
мафия 2 DirectX 11 Максимална детайлност, изключен NVIDIA PhysX. Без AA, AF 1x / AA включен, AF 16x 1920x1080 / 2560x1440
Просто кауза 2 DirectX 10 Максимална детайлност, Боке филтърът е изключен, подобрените детайли за водата са изключени Без AA, AF 2x / AA 4x, AF 16x 1920x1080 / 2560x1440

Следните видеокарти взеха участие в тестването като съперници на Radeon HD 7970:

  • AMD Radeon HD 6970 (880/5500)
  • Radeon HD 6990 (880/5000)
  • NVIDIA GeForce GTX 580
  • NVIDIA GeForce GTX 590

Овърклок, температура, консумация на енергия

AMD обеща, че процесорът HD 7970 ще овърклокне до 1 GHz и по-високи без проблеми, в което е лесно да се повярва, тъй като 75 MHz с новата технология на процеса не е толкова голямо постижение. Но нашата тестова проба лесно добави 200 MHz (!) над номиналната честота на графичния процесор и паметта се овърклокна от 5500 до 6300 ефективни MHz, без да се повишава напрежението. По-нататъшният овърклок се натъкна на ограниченията на функцията Overdrive и не беше възможно да ги преодолеем с помощта на добре познати трикове с ключове на системния регистър и помощни програми за овърклок на трети страни. HD 7970 дори не може да чете BIOS със съществуващ софтуер, така че истинските записи тепърва предстоят.

Изглежда, че Radeon HD 7970 наистина не се различава от HD 6970 по отношение на TDP. Консумацията на енергия на системата при натоварване е абсолютно същата, а в 2D режим HD 6970 е още по-ненаситен. Овърклокът леко добави към консумацията на енергия, но резултатът все още е много по-малък от този на другите конкуренти - "двуглавите" HD 6990 и GeForce ускорителите.

Освен това HD 7970 се оказа най-студената карта от всички участници в теста. Дори при максимален овърклок загрява по-малко от HD 6970. И тъй като консумацията на енергия на картите е същата, трябва да кажем благодарение на новата система за охлаждане. Ефектът е особено изразен, ако намалите честотата на процесора HD 7970 до нивото на HD 6970.

Производителност, синтетични бенчмаркове

  • Radeon HD 7970 превъзхожда HD 6970 и GeForce GTX 580 с огромна разлика във всички режими. Само "двуглавите" видеокарти работят по-бързо.
  • Овърклокната HD 7970 е сравнима по производителност с GeForce GTX 590, въпреки че HD 6990 все още е напред. Последният като цяло има изключително високи резултати, което за пореден път повдига въпроса за коректността на алгоритмите, с които 3DMark Vantage изчислява точки. Това не е първият път, когато срещаме необясними артефакти в този тест.

  • HD 7970 превъзхожда всички конкуренти с изключение на HD 6990 дори без овърклок.
  • При овърклок разликата между HD 7970 и стария флагман с два чипа се свива опасно.

Производителност, бенчмаркове за игри

Unigine Heaven 2

  • HD 7970 има колосално, почти двукратно предимство пред HD 6970. Вижда се, че AMD свърши страхотна работа с теселацията.
  • Сравнима производителност има GeForce GTX 580.
  • С овърклок HD 7970 е наравно с HD 6990, но не достига до GTX 590.

Кризис 2

  • Разликата между резултатите от HD 7970 и HD 6970 е почти двойна.
  • HD 7970 забележимо изпреварва и GeForce GTX 580.
  • Без овърклок, HD 7970 е сравнима по производителност с HD 6990, а с овърклок настига GeForce GTX 590.

Извънземни срещу хищници

  • HD 7970 има 25% предимство пред HD 6970.
  • GeForce GTX 580 в режими AA и AF изостава малко дори от Radeon HD 6970.
  • Видеокартите с два чипа са забележимо по-бързи от новостта и дори овърклокът не им позволява да наваксат.

  • HD 6970 се представя добре в този бенчмарк, поради което предимството на HD 7970 пред него е голямо, но не смазващо.
  • GeForce GTX 580 може лесно да се конкурира с HD 7970 при 1920x1080, но изостава при 2560x1440.
  • Двупроцесорните видеокарти са недостъпни за HD 7970 дори при овърклок.

Метро 2033

  • HD 7970 е с поне една трета по-бърз от HD 6970.
  • GeForce GTX 580 все още показва добри резултати и не изостава от новините.
  • SLI и CrossFire работят страхотно, така че дори с овърклок, HD 7970 не може да ги победи, въпреки че се доближава до HD 6990.

Far Cry 2

  • HD 7970 е с 20-25% по-бърз от HD 6970.
  • HD 7970 също е значително по-напред от GeForce GTX 580.
  • GTX 590 и HD 6990 са на недостижима височина за HD 7970, дори след овърклок.

VLIW4 срещу GCN

И накрая, проведохме Radeon HD 7970 чрез тестове за игри при равни честоти с Radeon HD 6970. Диаграмата ясно показва колко предимство предоставя новата GCN архитектура сама по себе си в сравнение с VLIW4.

констатации

AMD създаде графични процесори от нулата, които са коренно различни от всичко, което е пуснато под марката Radeon през последните няколко години. По отношение на мащаба на промените събитието е сравнимо с представянето на VLIW5 унифицираната шейдърна архитектура в чипа R600 (Radeon HD 2900). Но ако си спомните какъв труден път трябваше да премине VLIW5, преди да се разкрият присъщите му възможности, става забележимо, че този път всичко е съвсем различно.

Архитектурата на GCN, представена от чипа Tahiti, вече е зрял и изключително ефективен продукт. Radeon HD 7970 е с 20-50% по-бърз от едночиповия флагман от предишното поколение на AMD и лесно превъзхожда основния си конкурент, GeForce GTX 580. Въпреки че Tahiti е огромен графичен процесор с безпрецедентна сложност, картата не консумира повече енергия от GeForce GTX 580. отколкото HD 6970 и има висок таван за овърклок. А при овърклок производителността вече се доближава до нивото на двупроцесорните адаптери Radeon HD 6990 и GeForce GTX 590.

Имайте предвид, че позициите на архитектурата на Fermi все още са силни при задачи с активно използване на възможностите на DirectX 11. В някои игри GTX 580 е само малко по-ниска от новия продукт на AMD, така че NVIDIA все още има всички шансове да си отмъсти следващата година. Ще бъде също толкова интересно да видим как AMD доближава графичните процесори стъпка по стъпка до процесорите с общо предназначение. CUDA на NVIDIA получи голяма преднина през годините, но сега AMD има също толкова мощна графична архитектура и процесори Fusion, които рано или късно също ще получат вградени GCN ядра.

Методология на изпитване

Настройки на AMD Catalyst Control Center
антиалиасинг Използвайте настройките на приложението
Анизотропно филтриране Използвайте настройките на приложението
Теселация Използвайте настройките на приложението
Catalyst A.I., Качество на филтриране на текстура Качество, активиране на оптимизиране на формата на повърхността
Ниво на детайлност на Mipmap Качество
Изчакайте V-Sync изключено, освен ако приложението не посочва
Режим на заглаждане Мулти проба AA
Настройки на Direct3D, Активиране на инстанциране на геометрия На
Троен буфер Изключено
Настройки на контролния панел на NVIDIA
околна оклузия Изключено
Анизотропно филтриране Управляван от приложението
Antialiasing - Гама корекция На
Antialiasing-Mode Управляван от приложението
Antialiasing - Настройки Управляван от приложението
Antialiasing - прозрачност Изключено
CUDA-GPU всичко
Максимален брой предварително изобразени кадри 3
Ускоряване на мултидисплей/смесено GPU Режим на работа с множество дисплея
режим на управление на захранването Адаптивен
Филтриране на текстура — Оптимизиране на анизитропна проба Изключено
Филтриране на текстура — Отрицателно LOD отклонение позволява
Текстурно филтриране - Качество Качество
Текстурно филтриране - Трилинейна оптимизация На
Оптимизация с нишки Автоматичен
Тройно буфериране Изключено
вертикална синхронизация Използвайте настройките на 3D приложението
Набор от показатели
Програма API Настройки Тестов режим Разрешение
3D Mark 2011 DirectX 11 Профили Performance, Extreme

Unigine Heaven 2 DirectX 11 Макс. качество, DirectX 11, теселация в Extreme режим AF 16x, MSAA 4x 1920x1080 / 2560x1440
Crysis Warhead + Framebuffer Инструмент за сравнителен анализ на Crysis Warhead DirectX 10 Frost flythrough. Макс. настройки, DirectX 10. AF 16x, MSAA 4x 1920x1080 / 2560x1440
Показател за Metro 2033 + Metro 2033 DirectX 11 Макс. настройки, DirectX 11, DOF, теселация, изключен NVIDIA PhysX AF 16x, MSAA 4x 1920x1080 / 2560x1440
DiRT 3 + Adrenaline Racing Benchmark Tool DirectX 11 Аспен, 8 коли. Макс. качество, DirectX 11 AF, AA 4x 1920x1080 / 2560x1440
Crysis 2 + Adrenaline Crysis 2 Benchmark Tool DirectX 11 централен парк. Макс. качество, DirectX 11, текстури с висока разделителна способност AF 16x, Post MSAA + Edge AA 1920x1080 / 2560x1440
Battlefield 3 + FRAPS DirectX 11 Началото на мисията Going Hunting. Макс. качество AF 16x, MSAA 4x 1920x1080 / 2560x1440
Батман: Аркъм Сити. Вграден бенчмарк DirectX 11 Макс. качество AF, MSAA 4x 1920x1080 / 2560x1440
The Elder Scrolls 5: Skyrim + FRAPS DirectX 9 Град Уайтрън. Макс. качество AF 16x, MSAA 4x 1920x1080 / 2560x1440
Call of Duty: Modern Warfare 3 + FRAPS DirectX 9 Мисия Връщане към изпращача. Макс. качество AF, MSAA 4x 1920x1080 / 2560x1440

Следните видеокарти взеха участие в тестването като съперници на Radeon HD 7970 GHz Editon:

  • AMD Radeon HD 7970 (925/5500 MHz, 3 GB)
  • NVIDIA GeForce GTX 680 (1006/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 670 (915/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 590 (607/3414 MHz, 3 GB)
  • AMD Radeon HD 6990 (880/5000 MHz, 4 GB)

За да бъдат и двамата участници в днешната интрига, Radeon HD 7970 GHz Edition и GeForce GTX 680, да бъдат напълно въоръжени, при тестването бяха използвани най-новите бета драйвери на NVIDIA (304.48 Beta) и AMD (Catalyst 12.7 Beta). В допълнение, режимът PCI-E 3.0 беше активиран за GTX 680, който не се поддържа официално на платформата Intel X79.

⇡ Овърклок, температура, консумация на енергия

Тъй като PowerTune не се показва на наблюдаваните тактови честоти, честотата на Boost Clock от 1050 MHz стана отправна точка за овърклок. С напрежението на графичния процесор нещата не са толкова прости. Факт е, че настройката на напрежението в MSI Afterburner (възможно е същото да се случи и с други помощни програми, не сме го пробвали) вече няма никакъв ефект върху наблюдаваното напрежение. За да го увеличите, трябва да опитате да зададете по-високо постояненнапрежение, като използвате подходящата опция. Но колкото и странно да изглежда, това не спира напрежението да се колебае, а просто измества наблюдаваните стойности нагоре. По този начин не можем да фиксираме напрежението, но можем да изместим диапазона, в който то се променя. В резултат на това, ако ръчно зададете напрежението на 1,3 V, тогава диапазонът на трептене ще бъде около 1,227 - 1,252 V.

Трябва да се отбележи, че в някои случаи, когато играете с различни помощни програми за овърклок и наблюдение, напрежението все още беше фиксирано на 1,3 V, но след това, очевидно, Power Tune полудя и на екрана се появиха силни артефакти в 3D, независимо от GPU честота. Не изглежда, че си струва да се опитвате да победите Power Tune, особено след като тя си върши работата толкова добре.

Ако считаме Boost Clock на новия адаптер като стандартна честота на графичния процесор в други Radeon (и по отношение на принципите на Power Tune, това е), HD 7970 GHz Edition овърклокна дори по-добре от обикновения HD 7970: до 1240 MHz за процесора и 7320 (1830) MHz от паметта. Ако извадим обхвата на Power Tune Boost от 50 MHz от 1240 MHz, получаваме честотата, която достигат в много случаи на стандартния HD 7970. Очевидно по-дългата честотна таблица позволява на овърклокнатия графичен процесор да достигне по-високи пикови стойности, докато се връща към предишния по-нисък праг при тежки задачи. Въпреки това, не е факт, че картата всъщност някога достига тези 1240 MHz и не е постоянно в throttling. Докато помощните програми за наблюдение не получат достъп до вътрешностите на Power Tune, това ще остане загадка.

Но фантастичният овърклок на паметта е просто заслуга на отличните контролери на чипа Tahiti и чиповете памет, очевидно малко по-добри от тези, които са оборудвани със стандартния HD 7970.

HD 7970 GHz Edition загрява малко повече от стандартната версия - приблизително същото като GeForce GTX 680. Охладителната система, включена на пълна скорост, ви позволява да поддържате същите температури по време на силен овърклок като в нормален режим, но само с цената на колосален шум. Признаваме, че дори и с автоматично управление на вентилатора, HD 7970 GHz Edition издава много повече шум от GeForce GTX 680.

Максималната записана консумация на енергия на картата, както се очакваше, все още леко се увеличи в сравнение с тази на обикновената HD 7970. Не смятаме, че AMD лъжат, когато твърдят, че TDP и на двете версии на HD 7970 е еднакъв. Очевидно HD 7970 GHz Edition просто го овладява по-активно. По време на овърклок, разбира се, консумацията на енергия се покачва до тавана. Мощно захранване няма да пречи.

⇡ Radeon HD 7970 GHz Edition срещу GeForce GTX 680

Това са резултатите, заради които всичко е започнало. И така, успя ли AMD да си върне загубеното лидерство?

GeForce GTX 680 без овърклок все още се представя по-добре от HD 7970, но сред овърклокнатите Radeon карти е по-бърза.

игритестове+ Unigine Heaven

С разделителна способност от 1920x1080 в три от девет теста за игри (Crysis Warhead, DiRT 3, Metro 2033), Radeon HD 7970 GHz Edition е напред. В останалите три печели GeForce GTX 680 (Unigine Heaven 2, Battlefield 3, Skyrim). В останалите игри няма съществени разлики между противниците. Перфектно теглене. В режим 2560x1440 ситуацията надделява в полза на HD 7970. Само в CoD 3 и Unigine Heaven GTX 680 запазва превъзходството си.

Овърклокът е по-добър за картата AMD, отколкото за GTX 680: печалбата в производителността е забележимо по-висока и в резултат на това HD 7970 GHz Edition си отмъщава дори при 1920x1080.

⇡ Radeon HD 7970 GHz Edition срещу всички

  • Жалко за AMD, но в 3DMark 2011 Radeon HD 7970 GHz Edition отстъпва не само на GeForce GTX 680, но и на GTX 670.
  • Предимството на GHz Edition пред стандартната версия е забележимо.

Unigine Heaven 2

  • GHz Edition добави няколко FPS спрямо обикновения HD 7970.
  • При 2560x1440 GeForce GTX 670 и GTX 680 имат минимално предимство, но при 1920x1080 HD 7970 GHz Edition забележимо изостава.
  • Овърклокната GHz Edition побеждава Radeon HD 6990 и се сравнява с GTX 670 и GTZ 680.

Crysis Warhead (DirectX 10)

  • В този тест дори обикновената HD 7970 лесно изпреварва GeForce GTX 680 поради по-високата си честотна лента на паметта.
  • HD 7970 GHz Edition е дори малко по-лош от GeForce GTX 590, а овърклокната GHz Edition е наравно с Radeon HD 6990.

Metro 2033 (DirectX 11)

  • Предимството на HD 7970 GHz Edition пред обикновената версия е малко.
  • HD 7970 GHz Edition е забележимо по-бърз от GeForce GTX 680.
  • При овърклок, GHz Edition достига нивото на GeForce GTX 590 и Radeon HD 6990.

DiRT 3 (DirectX 11)

  • Изданието HD 7970 GHz е много по-добро от стандартната версия.
  • GHz Edition също е забележимо по-бърз от GTX 680, сравним по производителност с Radeon HD 6990 и GeForce GTX 590.

Crysis 2 (DirectX 11)

  • В режим 2560x1440 има забележимо увеличение на производителността в сравнение с обикновения HD 7970.
  • При 2560x1440 HD 7970 GHz Edition също изпреварва GeForce GTX 680, а овърклокната карта изостави GTX 590 и настигна Radeon HD 6990.
  • В режим 1920x1080 участниците в теста достигат ограничението от 100 FPS, зададено в Crysis 2.

Battlefield 3 (DirectX 11)

  • Още веднъж, HD 7970 GHz Edition има забележимо увеличение на FPS в сравнение със стандартния HD 7970.
  • Новостта е почти наравно с GTX 670 и GTX 680.
  • Овърклокната HD 7970 GHz Edition е твърде трудна дори за GTX 590.

Батман: Arkham City (DirectX 11)

  • Магическата фраза GHz Edition отново дава на HD 7970 приятен тласък на FPS.
  • При 1920x1080 картата е наравно с GTX 680, а при 2560x1440 я превъзхожда.

The Elder Scrolls 5: Skyrim (DirectX 9)

  • Няма значителна разлика между HD 7970, HD 7970 GHz Edition и GeForce GTX 680 в тази игра: след определено ограничение, двигателят на Skyrim вече не може да използва допълнителна изчислителна мощност.

Call of Duty: Modern Warfare 3 (DirectX 9)

  • В сравнение със стандартната версия на HD 7970, GHz Edition има голямо увеличение на честотата на кадрите.
  • Въпреки това само GeForce GTX 670, а не GTX 680, е равностоен съперник на новия продукт.

⇡ Заключения

За AMD, за първи път от отминалите дни на Radeon X1950 XTX, настъпи моментът, в който топ видеокартата е поне толкова добра, колкото флагмана на NVIDIA от същото поколение. HD 7970 GHz Edition е дори малко по-бърз от GeForce GTX 680 в тежки графични режими (като 2560x1440) като цяло благодарение на 384-битовата шина на паметта. Освен това, след фабрично овърклок, той все още има значителен марж на честотите. Обновената технология Power Tune има благоприятен ефект върху потенциала за овърклок на графичния процесор и паметта започна да овърклоква много по-добре. В бъдещите карти от NVIDIA и AMD със сигурност ще видим процъфтяващи технологии за динамично управление на честотата и напрежението, както вече се случи с процесора.

Всъщност в оригиналната версия HD 7970 е много мощна карта и повечето копия лесно достигат такива честоти, при които можете да настигнете и изпреварите GeForce GTX 680. GHz Edition е предимно моден продукт както за собственика, така и за производителят. AMD овърклокна HD 7970 достатъчно, за да съответства на GTX 680 и все още да остане в рамките на същия TDP. Нашите тестове за консумация на енергия ясно показват какво би се случило, ако разработчиците си бяха поставили за цел безусловна победа над флагмана на NVIDIA.

Уви, AMD вече загуби специално предимство пред картите на NVIDIA в High-End сегмента, на което се радваше през последните години – консумация на енергия. Ако по-рано най-високите Radeons не можеха да победят GeForce GTX 480 и GTX 580 по отношение на производителността, но консумираха и загряваха много по-малко, сега има равенство в бенчмарковете, но TDP Radeon HD 7970 GHz Edition е толкова като 55 W по-висока от тази на GTX 680.

И още един въпрос. Наличието на две физически идентични карти с различен софтуер в линията Radeon вече изглежда грозно. За какво плащат купувачите на HD 7970 GHz Edition, ако почти същото може да се постигне чрез лесен овърклок на стандартния HD 7970 и защо собствениците на последния не получиха нов фърмуер? Тъй като BIOS на видеокартата не може да се актуализира толкова лесно, колкото драйверите, би било по-добре, ако HD 7970 GHz Edition напълно замени своя предшественик. Е, чисто от гледна точка на световната хармония.

  • Част 2 - Практическо запознанство
  • Част 3 - Резултати от тестове за игри (производителност)

В тази част, както обикновено, ще проучим самата видеокарта, както и ще се запознаем с резултатите от синтетичните тестове.

Плати

  • графичен процесор: Radeon HD 7970 (Таити)
  • интерфейс: PCI Express x16
  • Работна честота на графичния процесор (ROPs): 925 MHz (925 MHz номинал)
  • Честота на паметта (физическа (ефективна)): 1375 (5500) MHz (номинална - 1375 (5500) MHz)
  • Ширина на шината за обмен на памет: 384 бита
  • Броят на изчислителните единици в графичния процесор / честотата на блоковете: 32/925 MHz (32/925 MHz номинал)
  • Брой операции (ALU) в блок: 64
  • Общ брой операции (ALU): 2048
  • Брой текстурни единици: 128 (BLF/TLF/ANIS)
  • Брой блокове за растеризация (ROP): 32
  • Размери: 285×100×33 mm (последната стойност е максималната дебелина на видеокартата)
  • Цвят на текстолита:червен
  • Консумация на енергия (пикова 3D/2D/спящ режим): 215/70/3 W
  • Изходни жакове: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
  • Поддръжка за многопроцесорна обработка: CrossFire X (хардуер)

AMD Radeon HD 7970 3072MB 384-битова GDDR5 PCI-E

Картата има 3072 MB GDDR5 SDRAM, поставена в 12 чипа от предната страна на печатната платка.

При липсата на нашите собствени синтетични тестове за DirectX 11 отново използвахме примерите от Microsoft и AMD SDK и демонстрацията на Nvidia. Първият е HDRToneMappingCS11.exe и NBodyGravityCS11.exe от DirectX SDK (февруари 2010 г.).

Взехме и приложения от двата производителя: Nvidia и AMD. DetailTessellation11 и PNTriangles11 са взети от ATI Radeon SDK (те също са в DirectX SDK). Допълнително беше използвана демонстрационната програма на Nvidia - Realistic Water Terrain, известна още като Island11 (автор - Тимофей Чеблоков, известен специалист по 3D графика).

Извършени са синтетични тестове на следните видео карти:

  • Radeon HD 7970 HD 7970)
  • Radeon HD 6990със стандартни параметри (по-нататък HD 6990)
  • Radeon HD 6970със стандартни параметри (по-нататък HD 6970)
  • Radeon HD 5870със стандартни параметри (по-нататък HD 5870)
  • Geforce GTX 590със стандартни параметри (по-нататък GTX 590)
  • Geforce GTX 580със стандартни параметри (по-нататък GTX 580)

За да сравним резултатите от най-новата графична карта Radeon HD 7970, тези модели бяха избрани по различни причини. Radeon HD 6970 беше взет като директен предшественик на най-горния сегмент, HD 6990 беше взето като най-силното (макар и двучипово) решение на GPU от предишната архитектура, ние добавихме HD 5870, за да оценим печалбата между две различни актуализации на архитектурата и като GPU точно наполовина по-сложен от Таити.

Избраните решения на Nvidia са взети, защото Geforce GTX 580 е най-бързият едночипов модел на компанията, базиран на последно поколение GPU. Въпреки че не е конкурент на представената AMD видеокарта като цена, резултатите й са интересни като максимални за актуалните едночипови решения на Nvidia. А двучиповият GTX 590 е екстремният вариант на компанията с по-висока цена. В тестовете за DirectX 11 използвахме и Geforce GTX 560 Ti, който е необходим, за да се оцени повишената геометрична производителност на новия AMD GPU.

Direct3D 9: Тестове за запълване на пиксели

Този тест определя пиковата производителност на семплиране на текстура (тексели скорост) в режим FFP за различен брой текстури, приложени на пиксел:

В нашия остарял 32-битов тест за филтриране на текстури от RightMark повечето видеокарти показват числа, които далеч не са теоретично възможни. Така резултатите от синтетичната текстура в случая с видеокартата Radeon HD 7970 не достигнаха пиковата стойност, така че отново ще разгледаме скоростта на текстуриране по числа от теста 3DMark Vantage, при който винаги се получават по-реалистични числа.

В нашия случай се оказа, че HD 7970 избира само до 80 тексела на такт от 32-битови текстури с билинейно филтриране, което е много по-ниско от теоретичната цифра от 128 филтрирани тексела. Иначе всичко се оказа предсказуемо - всички платки на AMD показаха по-висока производителност и изпреварват видеокартите на Nvidia. В края на краищата, дори най-добрият едночипов Geforce GTX 580 има само 64 TMU и следователно е много по-нисък от модела, базиран на чипа Tahiti, който има 128 TMU, работещи на по-висока честота. Следователно разликата е повече от два пъти. Е, двучиповата GTX 590 в този тест показва явно неадекватен резултат.

Версията с два GPU от AMD също очевидно не работи правилно в нашия тест, защото HD 7970 почти винаги превъзхожда дори нея. Е, новият модел изпревари предшественика си с около 30%, което е малко по-лошо от теоретично възможните стойности. Въпреки това, в случаите с малък брой текстури, когато честотната лента на паметта е най-силно засегната, резултатът е още по-нисък – около 25%.

Помислете за същите резултати в теста за запълване:

Числата показват скоростта на запълване и в тях виждаме всичко същото, с изключение на това, че се отчита броят на пикселите, записани в буфера на кадрите. Максималният резултат почти винаги отива при новата видеокарта от най-висок клас от семейството Radeon HD 7900. Тя има рекорден брой TMU, работещи на по-висока честота и по-ефективна в нашия синтетичен тест. Нека да преминем към текстовете на простите пикселни шейдъри.

Direct3D 9: Сравнителни показатели за Pixel Shaders

Първата група пикселни шейдъри, които разглеждаме, е много проста за съвременните видеочипове; включва различни версии на пикселни програми с относително ниска сложност: 1.1, 1.4 и 2.0, намиращи се в старите игри.

Тези тестове са твърде прости за съвременните графични процесори и са най-вече ограничени от производителността на текстуриране и понякога запълване. Следователно те не показват всички възможности на съвременните видеочипове, но са интересни от гледна точка на остарелите приложения за игри. В двата най-прости теста новата Radeon HD 7970 почти изпревари дори двучиповата HD 6990, но при по-трудни тестове зае позиция между HD 6990 и HD 6970. Интересно е как се различават тестовете на GPU с различни архитектури. И тук Tahiti е малко по-близо до GF110, отколкото до своя предшественик. Естествено, не в абсолютно изражение, разликата в тях е много голяма - от един и половина до два пъти.

Производителността в други тестове е най-вече ограничена от скоростта на текстурната единица и скоростта на запълване, така че новата Radeon HD 7970 е с около 30-40% по-бърза от предишната HD 6970, което е в съответствие с теорията. Всички платки на AMD изпреварват и двата топ модела Geforce, с изключение на това, че при сравнението на HD 5870 и GTX 590 всичко не е толкова ясно. Липсата на скорост на текстуриране очевидно е виновна за провалите на Nvidia в тези тестове. Но дори шейдърът с три светлинни пиксела Phong, който е по-зависим от математическата производителност на графичния процесор, когато се стартира на GF110, е много по-нисък от Cayman и още повече от Tahiti.

Нека да разгледаме резултатите от по-сложни пикселни програми на междинни версии:

И този път се оказа почти същото, HD 7970 се намира приблизително между едночиповите и двучиповите модели, базирани на Cayman от серията HD 6900. Тестът на Кук-Торанс е по-интензивен изчислително и разликата в него приблизително съответства на разликата в броя на ALU и тяхната честота. Следователно този тест е по-подходящ за архитектурата на AMD, чиито чипове имат по-голям брой математически единици и Таити не е изключение.

Интересното е, че HD 5870 превъзхожда HD 6970 в този тест и изглежда, че това се е случило поради по-лошата производителност на този шейдър на по-нов чип с VLIW4 архитектура. Така че, въпреки че новата Radeon HD 7970 надмина HD 6970, тя беше само с 20% по-бърза от HD 5870 в този тест.

Вторият тест за процедурно изобразяване на вода „Вода“, който е по-зависим от скоростта на текстуриране, използва зависимо вземане на проби от текстури с големи нива на гнездене, а видеокартите се класират по скорост на текстуриране, коригирана за различна ефективност на използване на TMU. В този тест решенията на AMD винаги се справят добре и HD 7970 осигурява много добър резултат, макар и по-лош от двучиповия HD 6990, но много по-добър от своя предшественик на Cayman. Най-високата едночипова платка на Nvidia изостава повече от 2,5 пъти!

Direct3D 9: Тестове за Pixel Shaders 2.0

Тези тестове на DirectX 9 пикселни шейдъри са по-сложни от предишните, те са близки до това, което виждаме в момента в мултиплатформените игри и попадат в две категории. Нека започнем с по-простата версия 2.0 шейдъри:

  • Паралаксно картографиране- метод за нанасяне на текстури, познат от повечето съвременни игри, описан подробно в статията.
  • Замразено стъкло— сложна процедурна текстура на замразено стъкло с контролирани параметри.

Има два варианта на тези шейдъри: един с фокус върху математическите изчисления и един с предпочитание за извличане на стойности от текстури. Помислете за математически интензивни опции, които са по-обещаващи по отношение на бъдещи приложения:

Това са универсални тестове, които зависят както от скоростта на ALU, така и от скоростта на текстуриране; те се фокусират върху цялостния баланс на чипа, както и върху ефективността при изпълнение на сложни програми. И производителността на новата графична карта AMD в теста Frozen Glass беше не просто добра, а отлична! Това означава повишената ефективност на новия графичен процесор. При първия тест Radeon HD 7970 се оказа забележимо по-бърза дори от двучиповата HD 6990. И дори двучиповата платка Nvidia беше далеч назад, да не говорим за Geforce GTX 580.

Тук, във втория тест на Parallax Mapping, решенията на Nvidia се чувстват малко по-добре и GTX 580 почти достига HD 6970. Но представената днес HD 7970 е много далеч - новата AMD изпреварва най-добрата платка на Nvidia с 80% , което ясно показва влиянието и математическите изчисления и скоростта на текстуриране. Интересното е, че много старият HD 5870 отново е по-бърз от HD 6970. А новият HD 7970 е с 60% по-бърз от своя предшественик, което очевидно не се оправдава със сухи теоретични цифри. Тук се отрази значително по-голямата ефективност на скаларната архитектура в сравнение с VLIW.

В случая с видеокартите AMD обаче всичко е много трудно заради PowerTune. В края на краищата синтетичните тестове „натоварват“ графичния процесор с изчисления и консумацията на енергия на платките с поддръжка на PowerTune в синтетичната материя може да надхвърли зададената граница. Следователно, тактовата честота на графичния процесор също може да намалее, а с това резултатите ще бъдат показани по-ниски от очакваното. Нека разгледаме същите тестове в модификацията с предпочитание на проби от текстури към математически изчисления:

И за двете видеокарти на Nvidia ситуацията стана още по-тъжна, тъй като всички съвременни AMD чипове са много по-добри със скоростта на текстуриране и в тези тестове те само увеличават безспорното си предимство. Дори двучиповата GTX 590 не може да се конкурира с HD 6970 с един чип и в двата теста, фокусирани върху текстурирането, да не говорим за GTX 580. Е, днешната Radeon HD 7900 е най-бързата едночипова карта там, само след HD 6990. Разликата между HD 7970 и HD 6970 се оказа равна на 26-28%, което е добре обяснено теоретично, тъй като разликата в скоростта на текстуриране на новостта е малко по-висока.

Но това бяха остарели задачи, предимно с акцент върху текстурирането, а понякога и върху скоростта на запълване. След това ще разгледаме резултатите от още два теста за пикселни шейдъри - но сега версия 3.0, най-трудният от нашите Direct3D 9 API тестове за пикселни шейдъри. Те са най-показателни по отношение на съвременните компютърни игри, много от които са мултиплатформени. Тестовете се различават по това, че зареждат силно както ALU, така и текстурни единици, и двете програми за шейдъри са сложни и дълги и включват голям брой клонове:

  • Картографиране на стръмния паралакс— много по-„тежък“ вид техника на паралаксно картографиране, описана също в статията Съвременна терминология на 3D графиката.
  • Козина- процедурен шейдър, който изобразява козина.

В най-трудните DX9 тестове от RightMark, видеокартите на Nvidia винаги се представят много добре, за разлика от всички предишни тестове в нашия преглед. Тези тестове не са ограничени от производителността на извличане на текстура, а по-скоро зависят от ефективността на изпълнението на кода на шейдъра. И по-рано Radeon HD 6970 ясно подобри позицията на AMD в този тест, повишавайки ефективността при преминаване от VLIW5 архитектура към VLIW4.

Е, днес видяхме още един скок в производителността на решенията на компанията, Radeon HD 7970 ги издигна на недостижимо ниво – новата едночипова видеокарта превъзхожда дори двучиповата HD 6990 и в двата теста! Тези задачи са чудесен пример за това как реалната производителност на сложните изчисления се подобрява при преминаване от VLIW към скаларно изпълнение.

Така че, в тестовете на сложни пикселни шейдъри версия 3.0, новата видеокарта AMD от най-висок клас успя не само да настигне конкурентите си, но и да я надмине със значителна разлика, което не беше така от много дълго време. Скоростта и в двата PS 3.0 теста е слабо зависима от честотната лента на паметта и текстурирането, но кодът е сложен, с който архитектурата на Nvidia и най-новата скаларна архитектура на AMD се справят много добре. Тези тестове са сред първите, при които забелязваме ясно подобрение в ефективността и най-голямата положителна разлика между предишната и най-новата архитектура на AMD по отношение на скоростта.

Но нека дадем цифрите, за да не бъдем неоснователни. Представеният нов Radeon HD 7970 е повече от два пъти по-бърз от своя предшественик и с 60-70% по-бърз от Geforce GTX 580, за което съвсем наскоро не бихме посмели дори да си помислим. В крайна сметка решенията на Nvidia винаги са били безспорни лидери в тази двойка тестови задачи, но видеокартите, базирани на Cayman, успяха да се доближат до тях и най-бързият Tahiti най-накрая надмина своя конкурент.

Direct3D 10: PS 4.0 пикселни тестове за шейдъри (текстуриране, зацикляне)

Втората версия на RightMark3D включва два познати теста за PS 3.0 под Direct3D 9, които бяха пренаписани за DirectX 10, както и още два нови теста. Първата двойка добави възможността за активиране на самозасенчване и суперсемплиране на шейдъри, което допълнително увеличава натоварването на видеочиповете.

Тези тестове измерват производителността на цикличните пикселни шейдъри с голям брой текстурни проби (до няколкостотин проби на пиксел в най-тежкия режим) и относително малко натоварване на ALU. С други думи, те измерват скоростта на извличане на текстура и ефективността на разклоняването в пикселния шейдър.

Първият тест за пикселни шейдъри ще бъде Fur. При най-ниските настройки той използва 15 до 30 проби за текстура от картата на височината и две проби от основната текстура. Детайлността на ефекта - режим "High" увеличава броя на пробите до 40-80, включването на "shader" supersampling - до 60-120 семпли, а режимът "High" заедно със SSAA се характеризира с максимална "сериозност" - от 160 до 320 проби от височинната карта.

Нека първо проверим режимите без активирано суперсемплиране, те са сравнително прости и съотношението на резултатите в режимите "Ниско" и "Високо" трябва да бъде приблизително еднакво.

Производителността в този тест зависи от броя и ефективността на TMU, както и от ефективността при изпълнение на сложни програми. Във варианта без суперсемплиране, ефективната честота на запълване (ROP производителност) и честотната лента на паметта оказват допълнително влияние върху производителността. Резултатите с ниво на детайлност "Високо" са около един и половина пъти по-ниски, отколкото при "Ниско", както би трябвало да бъде на теория, но при най-бързите решения разликата е малко по-ниска.

Преди това, при тестове на процедурно изобразяване на козината с голям брой извличания на текстури, решенията на Nvidia бяха забележимо по-силни, но като се започне от предишното поколение на AMD, разликата започна да намалява. Какво се случи с Radeon HD 7970? Отличен резултат - новата AMD отново е по-бърза от двучиповата платка от предишното поколение, а едночиповата HD 6970 изостава два пъти, което ясно показва повишаване на ефективността на новата архитектура на Южните острови. Да, и решенията на Nvidia са изоставени, дори двучиповата GTX 590 е по-ниска от представения днес топ модел Radeon HD 7970.

Нека да разгледаме резултата от същия тест, но с включена суперсемплиране на "шейдър", което учетворява работата: може би нещо ще се промени в такава ситуация и честотната лента на паметта с честота на запълване ще има по-малък ефект:

Активирането на суперсемплиране учетворява теоретичното натоварване, а решенията на Nvidia винаги са по-слаби в сравнение с графичните карти на AMD. Сега разликата в ефективността на тази задача е още по-очевидна, а новият HD 7970 е 2,5 пъти по-бърз от HD 6970! Geforce GTX 580 загуби приблизително същото количество от новия продукт Съвсем естествено е, че дори HD 6990 остана далеч назад, а новата платка засили лидерството си, но какво ...

Вторият тест за шейдъри DX10 измерва производителността при изпълнение на сложни зациклени пикселни шейдъри с голям брой извличания на текстура и се нарича стръмно паралаксно картографиране. При ниски настройки той използва 10 до 50 проби за текстури от картата на височината и три проби от основните текстури. Когато включите тежък режим със самозасенчване, броят на пробите се удвоява, а суперсемплирането учетворява този брой. Най-сложният тестов режим със суперсемплиране и самозасенчване избира от 80 до 400 стойности на текстурата, тоест осем пъти повече от обикновения режим. Първо проверяваме прости опции без суперсемплиране:

Вторият Direct3D 10 пикселен шейдър тест е малко по-интересен от практическа гледна точка, тъй като разновидностите на паралаксно картографиране се използват широко в игрите, а тежките варианти, като нашето стръмно паралаксно картографиране, се използват в много проекти, например в Crysis и Игри Lost Planet. Освен това в нашия тест, в допълнение към суперсемплиране, можете да включите самозасенчване, което приблизително удвоява натоварването на видеочипа, този режим се нарича "High".

Тази диаграма е подобна на предишната, без да включва SSAA, но позицията на Nvidia е отслабнала малко повече и Radeon HD 6990 почти настигна модела, представен днес. В актуализираната версия на теста D3D10 без суперсемплиране, HD 7970 показва отличен резултат, като значително превъзхожда HD 6970 и GTX 580 и дори GTX 590. повече от пъти по-бавни от новия модел) изостават. Нека видим какво ще промени включването на суперсемплиране, това може да причини голям спад в производителността на платките на Nvidia.

Когато суперсемплирането и самозасенчването са активирани, задачата става още по-трудна, комбинираното включване на две опции наведнъж увеличава натоварването на картите с почти осем пъти, причинявайки голям спад в производителността. Разликата между индикаторите за скорост на тестваните видео карти се промени, включването на суперсемплиране има ефект, както в предишния случай - картите на AMD подобриха производителността си в сравнение с решенията на Nvidia.

И сега Radeon HD 7970 отново е единственият лидер в сравнението, показвайки резултати по-високи от HD 6990. По-старите едночипови дънни платки на компанията са далеч назад, заедно с Geforce GTX 580. И само по-скъпите опции с два чипа от AMD и Nvidia са способни поне на някои след това да се доближат до новата видеокарта. Като цяло, според два теста за шейдъри D3D10, можем да заключим, че новата архитектура на AMD и нейният представител на чипа Tahiti се справят перфектно със задачите на "шейдъра", дори по-добре от традиционно силните конкуренти на Nvidia.

Direct3D 10: PS 4.0 Pixel Shader Benchmarks (Computing)

Следващите няколко теста за пикселни шейдъри съдържат минималния брой извличания на текстура, за да се намали въздействието на производителността на TMU. Те използват голям брой аритметични операции и измерват точно математическата производителност на видеочиповете, скоростта на изпълнение на аритметични инструкции в пикселния шейдър.

Първият тест по математика е минерал. Това е сложен процедурен тест за текстуриране, който използва само две извадки от данни за текстура и 65 инструкции sin и cos.

Резултатите от екстремни математически тестове обикновено съответстват на разликата в честотите и броя на изпълнителните единици, но с известно влияние на различна ефективност на тяхното използване. Всички най-нови AMD архитектури имат огромно предимство пред конкуриращите се графични карти на Nvidia в такива случаи и това обяснява резултатите от тестовете, при които решенията на AMD отново се оказват значително по-продуктивни.

Решенията са разположени приблизително според теорията, но с някои изключения. На практика са открити някои нюанси, свързани с различна ефективност. Теоретично GeForce GTX 580 би трябвало да е повече от два пъти (2,4 пъти) по-бавна от новия модел Radeon HD 7970, но на практика разликата е само 80%, което е много по-малко. Да, и в сравнение с HD 6970 има въпроси относно оптимизирането на новата архитектура и драйверите за нея за този тест. С теоретично изчислително предимство от 40%, новата платка на AMD е само с 28% по-бърза от предишната HD 6970, а разстоянието между нея и много старата HD 5870, базирана на VLIW5 архитектура, е още по-малко. Или тестът наистина е по-подходящ за VLIW (особено за VLIW5), или необработените драйвери са виновни.

Има и друго обяснение – може би резултатите от платките HD 7970 HD 6970 в този тест са повлияни от технологията PowerTune, която понижава честотите при достигане на границата на консумация на енергия. Всичко това обаче не се променя много в сравнение с конкурент, тъй като дори скъпата двучипова Geforce GTX 590 достигна нивото само на HD 6970 и HD 5870. А едночиповата GTX 580 е далеч назад.

Нека разгледаме втория тест за изчисления на шейдъри, който се нарича Fire. Той е по-тежък за ALU и има само едно извличане на текстура в него, а броят на инструкциите sin и cos е удвоен, до 130. Нека видим какво се промени с увеличаване на натоварването:

Виждаме почти идентично с предишната диаграма, с изключение на абсолютните числа. Този път всички графични процесори останаха приблизително на същите позиции, с изключение на това, че видеокартите, базирани на Cayman и Cypress, смениха местата си - сега по-новият модел е малко по-бърз, но не много. Въпреки че все още няма стриктно съответствие с теоретичните цифри за пикова производителност, техните резултати все още са близки до сухата теория. Разликата между HD 7990 и HD 6970 се е увеличила леко.

Иначе не открихме нищо ново в графиката. Скоростта на изобразяване в този тест е ограничена единствено от производителността на шейдърните модули и тяхната ефективност, така че двучиповата HD 6990 отново стана ясен лидер, а днешният нов продукт на AMD го следва на прилично разстояние. И двете платки Geforce са по-ниски дори от остарелия модел от семейството Radeon HD 5800, но този път предимството на решенията на AMD остава малко по-малко, отколкото при сравняване на теоретични цифри и това отново показва по-лоша оптимизация или влияние на PowerTune.

Direct3D 10: Тестове за геометрични шейдъри

Има два теста за скорост на геометрични шейдъри в RightMark3D 2.0, първата опция се нарича "Galaxy", техниката е подобна на "точковите спрайтове" от предишни версии на Direct3D. Той анимира система от частици на GPU, геометричен шейдър от всяка точка създава четири върха, които образуват частица. Подобни алгоритми трябва да се използват широко в бъдещи DirectX 10 игри.

Промяната на баланса в тестовете за геометрични шейдъри не влияе на крайния резултат от изобразяването, крайното изображение винаги е абсолютно същото, само методите за обработка на сцената се променят. Параметърът "GS load" определя в кой шейдър се извършват изчисленията - във връх или геометрия. Броят на изчисленията винаги е един и същ.

Нека разгледаме първата версия на теста "Galaxy" с изчисления във шейдера на върховете, за три нива на геометрична сложност:

Съотношението на скоростите с различна геометрична сложност на сцените е приблизително еднакво за всички решения, производителността съответства на броя точки, при всяка стъпка спадът на FPS е около два пъти. Задачата за съвременните видеокарти не е твърде трудна, а производителността е ограничена главно от скоростта на обработка на геометрията, но също и от честотната лента/скорост на запълване на паметта (в рамките на решения от един производител).

В този тест трябваше да се покажат подобрените способности за обработка на геометрията на Южните острови и така те се появиха. Новата графична карта на AMD наистина е много по-бърза в геометричните изчисления в сравнение с всички предишни решения на компанията. Въпреки че AMD даде до 4 пъти повече от цифрите за растеж, в този тест геометричната производителност се увеличи с около 1,5-2 пъти. В резултат на това едночиповата видеокарта се оказа приблизително на същото ниво като двучиповия модел Radeon HD 6990 на GPU от предишното поколение.

Такова значително подобрение доведе до факта, че Tahiti почти настигна видеокартата от най-висок клас на Nvidia, въпреки че би трябвало да бъде дори по-ефективна при изпълнение на геометрични шейдъри при някои условия. Преди това графичните карти на Nvidia бяха около два пъти по-бързи от сравнимите конкурентни карти, но сега няма никаква разлика. Нека видим как се променя ситуацията при прехвърляне на част от изчисленията към геометричния шейдър:

Когато натоварването се промени в този тест, числата останаха почти непроменени за решенията на Nvidia и повечето платки на AMD. Само новата видеокарта от семейството HD 7900 в този тест реагира слабо на промяната в параметъра за натоварване на GS, който е отговорен за прехвърлянето на част от изчисленията към геометричния шейдър. Следователно дъската показа малко по-висок резултат от предишната диаграма. Нека видим какво ще се промени в следващия тест, който предполага голямо натоварване на геометричните шейдъри.

„Hyperlight“ е вторият тест на геометрични шейдъри, демонстриращ използването на няколко техники наведнъж: инстанциране, извеждане на поток, натоварване на буфера. Той използва динамично създаване на геометрия чрез рисуване към два буфера, както и нова функция в Direct3D 10 - извеждане на поток. Първият шейдър генерира посоката на лъчите, скоростта и посоката на техния растеж, тези данни се поставят в буфер, който се използва от втория шейдър за изобразяване. За всяка точка от гредата се изграждат 14 върха в кръг, общо до един милион изходни точки.

Нов тип програма за шейдъри се използва за генериране на "лъчи" и с параметър "GS load", зададен на "Heavy" - също и за рисуването им. Тоест в режим „Балансиран“ геометричните шейдъри се използват само за създаване и „отглеждане“ на лъчи, изходът се извършва с помощта на „екземпляр“, а в режим „Тежък“ геометричният шейдър също участва в изхода . Нека първо разгледаме лесния режим:

Относителните резултати в различните режими отново приблизително съответстват на промените в натоварването: във всички случаи производителността се мащабира добре и е близка до теоретичните параметри, според които всяко следващо ниво на броя на полигоните трябва да бъде по-малко от два пъти по-бавно.

В този тест скоростта на изобразяване трябва да бъде ограничена от геометричната производителност, а новата архитектура на AMD се представя отлично, дори леко превъзхождайки конкурента си в лицето на Geforce GTX 580! И двете платки с двоен чип показаха неправилни резултати тук, така че няма да можем да ги сравним с тях. Но HD 7970 е с 40-50% по-бърз от своя предшественик HD 6970, което очевидно се дължи на архитектурни промени в графичния процесор. Отличните резултати на картата на Таити ясно свидетелстват за оптимизациите, извършени в блоковете за обработка на геометрични данни в новия чип.

Числата трябва да се променят много в следващата диаграма, в тест с по-активно използване на геометрични шейдъри. Също така ще бъде интересно да се сравнят помежду си резултатите, получени в режимите "Балансиран" и "Тежък".

Но тук Radeon HD 7970 не успя да постигне рекорд, в края на краищата разликата между чиповете AMD с традиционен графичен конвейер (включително Cayman с Tahiti с два растеризатора) и чиповете с архитектурата на Fermi, която има паралелизирана обработка на геометрията, е ясно забележима . А резултатите на Geforce GTX 580, която е базирана на чипа GF110, са толкова добри, че превъзхожда най-доброто от решенията на AMD (а това е моделът, обявен днес) с 35-40%.

Въпреки че възможностите на новия чип от най-висок клас на AMD по отношение на обработката на геометрията и скоростта на изпълнение на геометричните шейдъри явно са нараснали в сравнение с предишните видеокарти на компанията, първото решение, базирано на чипа Tahiti, показва 22-28% по-високи резултати в тези тестове, отколкото решения, базирани на Cayman. Вероятно инженерите на AMD решиха, че такава оптимизация на триъгълници и блокове за обработка на геометрията ще бъде достатъчна.

Direct3D 10: скорост на извличане на текстура от върхови шейдъри

Тестовете "Извличане на текстура на връх" измерват скоростта на голям брой извличания на текстура от шейдър на върха. Тестовете са сходни по същество, така че съотношението между резултатите от картите в тестовете "Земя" и "Вълни" трябва да бъде приблизително еднакво. И двата теста използват картографиране на изместване, базирано на данни за проби от текстура, единствената съществена разлика е, че тестът "Waves" използва условни скокове, докато тестът "Earth" не го прави.

Помислете за първия тест „Земя“, първо в режим „Ниска детайлност на ефекта“:

Предишни проучвания показват, че много неща влияят на резултатите от този тест наведнъж: както скоростта на текстуриране, така и честотната лента на паметта. А резултатите от видеокартите често са ограничени от някаква бариера – просто погледнете сравнението на двучиповия GTX 590 и едночиповия аналог – между тях почти няма разлика. Въпреки че HD 6990 е два пъти по-бърз от HD 6970.

А новата AMD карта от семейството Radeon HD 7970 показа много добри резултати, почти догонвайки водещата HD 6990. Що се отнася до конкурентите с един чип, тя е най-добрата и в трите режима. Предимството пред HD 6970 варира от 25% до 75%, в зависимост от режима. Нека разгледаме производителността в същия тест с увеличен брой извличания на текстури:

Но този път относителното положение на картите на диаграмата се е променило забележимо и това е особено вярно за твърдия режим. С малък брой полигони скоростта на изобразяване в този тест зависи от честотната лента на паметта, поради което платките на AMD бяха толкова силни в предишната диаграма.

Но в тежки режими разликата между едночиповата карта на Nvidia и новата карта на AMD се стеснява и те се конкурират помежду си в доста тежка борба. По-старата двучипова видеокарта от семейството Radeon HD 6900 превъзхожда всички други решения и е най-добрата в сравнение, въпреки че Geforce GTX 590 се доближава до нея в тежък режим.Новата едночипова HD 7970 превъзхожда своя предшественик отново с до 70 %, което може да показва силно влияние на честотната лента на паметта.

Нека разгледаме резултатите от втория тест за извличане на текстури от върхови шейдъри. Тестът Waves има по-малко проби, но използва условни скокове. Броят на билинейните текстурни проби в този случай е до 14 („Детайл на ефекта Нисък“) или до 24 („Висок детайл на ефекта“) на връх. Сложността на геометрията се променя подобно на предишния тест.

Резултатите от втория тест за текстуриране на върхове "Вълни" са напълно различни от това, което видяхме в предишните диаграми. В този тест видеокартите AMD и Nvidia, с изключение на HD 6990 и HD 7970, показват много близки резултати, което отново може да се отдаде на ограничението на честотната лента на видео паметта, тъй като този индикатор е близък за всички представени видео карти.

Но новият модел от семейството на Южните острови успя да се открои, в трудни условия за сравнение почти настигна двучиповата HD 6990, която стана най-добрата сред всички видеокарти. Разликата между картите, базирани на Cayman и Tahiti GPU, отново беше 25-70% в полза на по-новото решение. Помислете за втората версия на същия тест:

И тогава имаше промени, подобни на тези, които видяхме по-рано - видеокартите на Nvidia "увиснаха" само в светъл режим, а повечето решения на AMD - наведнъж. Това обаче не позволи на платките на калифорнийската компания да настигнат новия продукт от семейството Radeon 7900. Което, между другото, превъзхождаше всички в средни и тежки режими, отстъпвайки само веднъж на двучиповата HD 6990.

В режим на нисък полигон разликата между решенията не е толкова голяма, но в средния и тежкия режим старите решения на AMD са по-ниски, следвани от платките на Nvidia (двучиповата е само малко по-бърза от едночипната чип GTX 580), HD 6990 и HD 7970. Платката от семейството HD 7900 обяви днес в тестове за избор на върхове, тя се оказа отлична, доста изпреварвайки конкуриращите се видеокарти от Nvidia и нейните предшественици от същия производител.

3DMark Vantage: Тестове на функции

Както винаги, синтетичните тестове от пакета 3DMark Vantage могат да ни покажат нещо, което сме пропуснали по-рано. Тестовете за функции в този тестов пакет са с активиран DirectX 10 и са интересни с това, че се различават от нашите. Когато анализираме резултатите от новата видеокарта Radeon HD 7970 в този пакет, ще можем да направим някои нови и полезни изводи, които са ни убягнали в тестовете на семейството RightMark.

Тест на характеристиките 1: Запълване на текстура

Първият тест е тестът за скорост на извличане на текстура. Използва се за запълване на правоъгълник със стойности, прочетени от малка текстура, използвайки множество текстурни координати, които променят всеки кадър.

Въпреки че тестът на Futuremark все още не показва теоретично възможното ниво на скорост на извличане на текстури, ефективността на видеокартите AMD и Nvidia все още е забележимо по-висока в него, отколкото в нашата от RightMark. Следователно в този тест за текстура се получава малко по-различно съотношение на резултатите, което е по-близо до истината.

Първата видеокарта от новото семейство на AMD показва резултат, близък до съответния теоретичен параметър, и се справя с работата по-ефективно от предишното поколение. Radeon HD 7970 превъзхожда HD 6970 с повече от 50%, въпреки че теоретичната разлика е само 40%. Най-вероятно текстурните единици на Tahiti се използват по-ефективно поради подобрения в паметта и системата за кеширане, което доведе до увеличения резултат.

Разбира се, новият модел с един чип се откъсна от лидера - двучиповия HD 6990, но това не се очакваше. И все пак, ясно се вижда, че производителността на текстурата на графичния чип Tahiti се е увеличила значително в сравнение с Cayman. Е, GTX 580 губи от новия продукт по отношение на скоростта на текстуриране с цели 2,3 пъти. Дори картата Nvidia с два GPU настига само HD 6970.

Тест на функциите 2: Цветно запълване

Това е тест за скорост на запълване. Той използва много прост пикселен шейдър, който не ограничава производителността. Интерполираната стойност на цвета се записва в буфер извън екрана (цел за изобразяване) с помощта на алфа смесване. Той използва 16-битов FP16 буфер извън екрана, най-често използван в игри, които използват HDR изобразяване, така че този тест е доста навременен.

Ситуацията в теста за производителност на ROP единица е много различна от теста за текстуриране. Числата за този подтест от 3DMark Vantage показват производителността на ROP единиците, но с влиянието на размера на честотната лента на видео паметта (т.нар. „ефективна скорост на запълване“). И тук новият модел HD 7970 показва отличен резултат, изоставайки само от двете топ видео карти AMD и Nvidia от предишни поколения, които имат два графични процесора на борда.

Но какво да кажем за ефективността на използването на ROP блокове, с които AMD се похвали? Всъщност само 32 ROPs в новия чип Tahiti изобщо не ограничават скоростта на изобразяване, дори в специализиран тест. И ние отбелязваме малко по-висока ефективност на ROP и по-бърза скорост на запълване в новата графична карта на AMD в сравнение с по-старите модели. Разликата между HD 7970 и HD 6970 е повече от 50%, което ясно показва по-голямо влияние на честотната лента, а не чистото представяне на ROP модулите.

Що се отнася до сравнението с Nvidia, тук отново разликата в скоростта (35%) съответства на теоретичната разлика в честотната лента на паметта (36%), а не на чистата скорост на ROP блоковете. Оказва се, че 32 такива блока в Каймана са били просто излишни и техните възможности никога не са били използвани напълно.

Тест на характеристиките 3: Картиране на паралаксната оклузия

Един от най-интересните тестове за функции, тъй като тази техника вече се използва в игрите. Начертава един четириъгълник (по-точно два триъгълника) с помощта на специалната техника Parallax Occlusion Mapping, която имитира сложна геометрия. Използват се по-скоро ресурсоемки операции за проследяване на лъчи и карта на дълбочината с висока разделителна способност. Тази повърхност също е засенчена с помощта на тежкия алгоритъм на Strauss. Това е тест на много сложен и тежък пикселен шейдър за видеочип, съдържащ множество извличания на текстури по време на проследяване на лъчи, динамично разклоняване и сложни изчисления на Strauss осветление.

Този тест се различава от други подобни по това, че резултатите в него зависят не само от скоростта на математическите изчисления, ефективността на изпълнение на клонове или скоростта на извличане на текстура, но и от всичко по малко. За постигане на висока скорост балансът на GPU блоковете е важен тук, той също има много забележим ефект върху скоростта и ефективността на разклоняването в шейдърите.

Сравнителните резултати на видеокартите на AMD в диаграмата като цяло са подобни на това, което видяхме в теста за производителност на текстури от 3DMark Vantage, с изключение на това, че новата Radeon HD 7970 е очевидно по-ефективна и в тази задача, защото отново почти настигна Dual-GPU HD 6990 - отличен резултат! В този случай платките на Nvidia получиха известно повишаване на производителността, което потвърждава заключението, че не само производителността на текстурата влияе върху резултатите от този тест.

И така, новият модел на AMD се представя добре, като отстъпва доста на двучиповата платка, базирана на два Cayman. Той изпревари своя предшественик с един чип с 66%. Тази цифра не съответства на ускорението от Кайман до Таити по нито един от теоретичните параметри и може да показва подобрение в ефективността при извършване на сложни изчисления на разклонения. Дори смятаният преди за добър резултат на Geforce GTX 580 е два пъти по-лош от този на новата AMD. Всъщност всички видеокарти от този производител се оказаха по-бързи от топ модела на линията Geforce GTX 500, базиран на един чип.

Тест на функциите 4: GPU плат

Тестът е интересен с това, че изчислява физическите взаимодействия (имитация на плат) с помощта на видеочип. Използва се симулация на върхове, като се използва комбинираната операция на шейдерите на върховете и геометрията, с няколко преминавания. Използвайте stream out за прехвърляне на върхове от един симулационен проход към друг. По този начин се тества производителността на изпълнението на шейдъри на върхови и геометрични елементи и скоростта на изходящ поток.

Скоростта на изобразяване в този тест също зависи от много други параметри. Основните фактори тук са производителността на обработката на геометрията и ефективността на геометричните шейдъри. Така че е съвсем логично видеокартите на Nvidia да се чувстват страхотно в това приложение, доста изпреварвайки своите конкуренти.

И дори представената днес Radeon HD 7970, въпреки ясното подобрение на производителността в сравнение с HD 6970, не можеше да се конкурира тук с едночиповата Geforce GTX 580 и беше малко по-ниска от нея. Това е един от онези тестове за геометрия, който показва предимството на последните HD 6900 видеокарти пред предишните линии, в които те увеличиха скоростта на обработка на геометрията и геометричните шейдъри. Radeon HD 7970 подобри резултата с още 35%, но това не беше достатъчно - решенията на Nvidia продължават да водят в този тест. Въпреки че отбелязваме, че новият модел все пак значително подобри позицията на AMD в геометричните тестове.

Тест на функциите 5: GPU частици

Тест за физическа симулация на ефекти, базирани на системи от частици, изчислени с помощта на видеочип. Използва се и симулация на връх, всеки връх представлява една частица. Stream out се използва за същата цел, както в предишния тест. Изчисляват се няколкостотин хиляди частици, всички са анимирани поотделно, изчисляват се и техните сблъсъци с картата на височината.

Подобно на един от нашите тестове RightMark3D 2.0, частиците се рисуват с помощта на геометричен шейдър, който създава четири върха от всяка точка, за да образува частицата. Но тестът зарежда преди всичко блокове на шейдъри с изчисления на върхове, тества се и stream out.

Резултатите от следващия тест от пакета 3DMark Vantage са подобни на тези, които видяхме в предишната диаграма, но скоростта на обработка на геометрията в нея стана още по-важна. И така видеокартите на Nvidia тласнаха още повече, оставяйки зад гърба си дори чудовището с два чипа – Radeon HD 6990. Уви, факт е – дори GTX 580 изпревари всички платки на AMD, включително чисто новия модел, базиран на Tahiti GPU.

Уви, въпреки че платката, базирана на новия чип, показа по-силен резултат в сравнение с решения, базирани на Cayman и Cypress, Geforce изостава. Разликата между HD 7970 и HD 6970 в това сравнение беше малко над 30%, което показва ясен ефект от скоростта на ALU. В синтетичните тестове на 3DMark Vantage за симулация на плат и частици, които активно използват геометрични шейдъри, решенията на AMD продължават да изостават от конкурентните видеокарти с много висока скорост на обработка на геометрията.

Тест на характеристиките 6: Шум на Перлин

Последният тест за функции на пакета Vantage е математически интензивен тест на видеочипа, той изчислява няколко октави от алгоритъма на шума на Perlin в пикселния шейдър. Всеки цветен канал използва собствена шумова функция, за да увеличи натоварването на видеочипа. Шумът на Perlin е стандартен алгоритъм, често използван при процедурно текстуриране и използва много математика.

Интересното е, че в математическия тест от пакета Futuremark, който показва пиковата производителност на видеочиповете при ограничени задачи, видяхме съвсем различна картина в сравнение с подобни тестове от нашия тестов пакет. Производителността на решенията, показани на диаграмата, съответства само много грубо на това, което трябва да се получи според теорията, а също така се различава от това, което видяхме по-рано в математическите тестове от пакета RightMark 2.0. Например, ясно се вижда, че новата видеокарта в този тест се доближи много по-близо до теоретичната скорост в сравнение с GPU карти с VLIW архитектура.

Нека да разгледаме причините. По едно време HD 6970 не повиши пиковата математическа производителност на HD 5870, но това само по себе си не обяснява изоставането на Cayman. Причината може да е както по-ниската ефективност на архитектурата VLIW4, така и интелигентната система за управление на захранването, която „уби“ тактовата честота и производителността на решенията при достигане на зададения праг на консумация на енергия.

Но това не повлия на HD 7970. Най-вероятно причината е само в скаларната архитектура на новия чип. Защото съотношението на показателите за ефективност в теста и теоретичните ясно показва това. Теоретично HD 6970 има 0,7 от математическата мощност на новата карта, но при този тест се оказа само 0,56. Приблизително същата разлика е получена за други платки на AMD. Но когато се сравняват GTX 580 и HD 7970, които имат скаларна архитектура, теоретичното съотношение е 0,42 (Таити е повече от два пъти по-бързо), а практическото съотношение също е 0,42. Тоест ефективността от използването на наличните ALU за тези чипове от различни производители е абсолютно еднаква! За разлика от Cayman и Cypress, които имат VLIW архитектура.

Във всеки случай, новата платка на AMD превъзхожда и двамата си конкуренти от Nvidia с огромна разлика и Nvidia очевидно трябва драстично да увеличи математическата си мощ в бъдещи решения. Междувременно се очертава обичайната картина – видеокартите Geforce показват лоши резултати в случаите, когато простата и интензивна математика се извършва много по-бързо на Radeon карти. А излизането на Южния остров само влоши ситуацията.

Direct3D 11: Компютърни шейдъри

За да тестваме новите решения на AMD в приложения, които използват нови функции на DirectX 11, като например теселация и изчислителни шейдъри, използвахме проби от SDK и демонстрации от Microsoft, Nvidia и AMD.

Първо, нека разгледаме тестовете, които използват Compute шейдъри. Техният външен вид е една от най-важните иновации в най-новите версии на DX API, те вече се използват в съвременните игри за изпълнение на различни задачи: последваща обработка, симулации и т.н. Първият тест показва пример за HDR рендериране с тонално картографиране от DirectX SDK, с последваща обработка, която използва пикселни и изчислителни шейдъри.

Това може да не е най-добрият пример за компютърни шейдъри, но показва доста ясно разликата в производителността. Почти няма разлика между изчисленията в изчисленията и пикселните шейдъри за видеокартите на AMD, а при Nvidia пикселният е малко по-бърз.

AMD Radeon HD 6970 се оказа по-бърза от своя предшественик HD 5870 и се представи на нивото на Geforce GTX 580, но представената днес HD 7970 е далеч пред всички тях и става лидер (решихме да не използваме двучипове видеокарти в тази синтетична). GTX 560 Ti е взета основно за геометрични тестове, а също и за оценка на разликата между решенията от различни ценови сегменти.

Така обявената платка, базирана на новия чип Tahiti, е с 40% пред аналоговата базирана на Cayman, което напълно съответства на разликата в теоретичната производителност на изчислителните единици. От своя страна предимството пред конкурентния GTX 580 е 30-40% (в зависимост от вида на програмата за шейдъри), което е очевидно по-ниско от теоретично възможното. GTX 560 Ti изостава много назад, повече от два пъти.

Вторият тест за изчислителни шейдъри също е взет от Microsoft DirectX SDK и показва гравитационен изчислителен проблем с N-тяло (N-тяло), симулация на динамична система от частици, която е подложена на физически сили като гравитацията.

Резултатите в този тест са много необичайни, за остарели решения на AMD са подобни на числата от математическия тест 3DMark Vantage - Cypress се оказа по-бърз от Cayman. Въпреки голямото теоретично превъзходство в пиковите числа, най-бързата графична карта на AMD - новата Radeon HD 7970, представена днес - е само с 21% пред най-доброто решение на Nvidia. И дори GTX 560 Ti не изостава. Старите модели на семействата HD 6900 и HD 5800 показват резултати, близки до тези на Geforce GTX 580.

Най-вече ни интересува разликата между резултатите от решенията за Кайман и Таити, като в този случай виждаме предимство на новия модел, равно на 36%. Това е малко по-малко от теоретичната разлика между тези модели, но все пак е близо до нея. Защо и двете карти не се откроиха на фона на много старата HD 5870? Може би за това е виновна намалената честота на PowerTune или липсата на оптимизация на драйверите за новата архитектура. Нека видим дали Таити най-накрая ще покаже значително ускорение в тестовете за теселация.

Direct3D 11: Производителност на теселация

Компютърните шейдъри са много важни, но основната иновация в Direct3D 11 все още е хардуерната теселация. Разгледахме го много подробно в нашата теоретична статия за Nvidia GF100. Tessellation се използва в DX11 игри от доста време, като STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и други. Някои от тях използват теселация за модели на герои, други за симулиране на реалистична водна повърхност или пейзаж.

Има няколко различни схеми за разделяне на графични примитиви (теселация). Например теселация на фонг, PN триъгълници, подразделение на Catmull-Clark. И така, схемата за плочки PN Triangles се използва в STALKER: Call of Pripyat, а в Metro 2033 - теселация на Phong. Тези методи са относително бързи и лесни за прилагане в процеса на разработка на играта и съществуващите двигатели, поради което са станали популярни.

Първият тест за теселация ще бъде примерът за детайлна теселация от ATI Radeon SDK. Той прилага не само теселация, но и две различни техники за обработка пиксел по пиксел: просто наслагване на нормални карти и паралаксно картографиране на оклузия. Е, нека сравним DX11 решения от AMD и Nvidia в различни условия:

Интересното е, че картографирането на паралаксната оклузия (средните ленти на диаграмата) на видеокартите и от двата производителя е много по-малко ефективно от теселацията (долните ленти), а умерената теселация не дава голям спад в производителността - сравнете горната и долната лента. Тоест, висококачествената геометрична симулация с помощта на пикселни изчисления осигурява дори по-ниска производителност от геометрията с мозайка с картографиране на изместване.

Що се отнася до производителността на видеокартите една спрямо друга, нека първо разгледаме техниките пиксел по пиксел. В простия bumpmapping тест новата графична карта на AMD е водеща, побеждавайки HD 6970 и GTX 580 съответно с 27% и 36%. Но в сложния подтест за изчисления пиксел по пиксел (запомнете тестовете за паралаксно картографиране по-горе), преди пускането на Cayman, видеокартите на Geforce бяха по-бързи от решенията на AMD, както и с активирана теселация. С пускането на Radeon HD 6970, в подтеста за теселация, той се оказа забележимо по-бърз от HD 5870, а в теста с малък коефициент на триъгълно разделяне, HD 6970 изпревари дори GTX 580.

Много по-интересно е това, което видяхме на графиката с надпис Radeon HD 7970. Теселацията тук не е твърде сложна, така че новата видеокарта не надмина много предишния модел – около 30%. Друго нещо е POM тестът. В този подтест новият HD 7970 просто разкъса всички други решения на парчета. Предимството пред HD 6970 и GTX 580 е малко по-малко от двойно. Още един супер резултат в теста за съпоставяне на паралакс, който говори за високата ефективност при изпълнение на сложни шейдърни програми.

Вторият тест за производителност на теселация ще бъде друг пример за 3D разработчиците от ATI Radeon SDK - PN Triangles. Всъщност и двата примера също са включени в DX SDK, така че сме сигурни, че разработчиците на игри създават свой собствен код, базиран на тях. Тествахме този пример с различен коефициент на теселация, за да видим колко много влияе върху цялостната производителност.

Но в този пример вече виждаме пълноценно сравнение на геометричната мощност на решенията на AMD и Nvidia в различни условия. И се оказа много интересно според нас. Графичната архитектура на Fermi се откроява силно, а чипът на новата архитектура Tahiti от AMD. Разбира се, това е чисто синтетичен тест и екстремни фактори на разделяне е малко вероятно да бъдат използвани в игрите в близко бъдеще, особено като се има предвид пълната мултиплатформа. Интересуваме се от архитектурния потенциал, поради което имаме нужда от "синтетика".

Ако при светлинни условия новата Radeon HD 7970 успешно се конкурира с Geforce GTX 580, превъзхождайки го в най-леките режими и е на ниво в трети, но в най-трудни условия с много голям брой триъгълници с видео Nvidia Geforce карта, базирана на чипа GF110, просто е невъзможно да се конкурира - в задачи с екстремна теселация, тя е много по-бърза от дори многократно подобрени чипове AMD. Новият графичен процесор, въпреки че за пореден път намалява разликата от своя конкурент в задачите за обработка на геометрията, все още е много далеч от паралелната работа на 16 теселационни блока в GF110. И дори GF114 при максимално съотношение на разделяне се оказа по-бърз от Tahiti.

Въпреки това, въпреки че загуби в най-тежките условия с най-висок коефициент на разделяне, базираният на Таити HD 7970 иначе се представи отлично, особено в сравнение с Cayman и Cypress. Новият модел на AMD в режим на леко и средно натоварване показва впечатляващо увеличение на скоростта, а разликата спрямо вече бавния HD 6970 достига 2,8 пъти. Но виждаме такова увеличение само в краен случай и най-често се оказва от 30 до 70%. Не сме видели обещаната четирикратна разлика, поне не още.

Но максималната разлика между решенията на компаниите се постига в условия на екстремна теселация, която няма да бъде в близки до тях игри и бенчмаркове. Поради това очакваме Tahiti значително да подобри производителността на AMD в съществуващите тестове за теселация като 3DMark11 и Heaven.

Нека да разгледаме друг бенчмарк, демонстрационната програма Nvidia Realistic Water Terrain, известна още като Island. Тази демонстрация използва теселация и картографиране на изместване, за да представи реалистично изглеждаща океанска повърхност и терен. Тя изглежда просто страхотно, това е, което липсва в настоящите игри:

Island не е чисто синтетичен тест за геометрична производителност, той съдържа както сложни пикселни, така и изчислителни шейдъри и такова натоварване е по-близо до реалните игри, които използват всички GPU модули наведнъж, а не само геометрични, както в предишния бенчмарк.

Тествахме също програмата с четири различни фактора на теселация, тази настройка се нарича Dynamic Tessellation LOD. И ако при най-ниския коефициент на разделяне всички AMD видеокарти са напред, тогава когато работата стане по-сложна, платките, базирани на чипове на Nvidia, започват да заемат водеща позиция. И с увеличаване на коефициента на разделяне и сложността на сцената, производителността на абсолютно всички Radeons пада драстично, за разлика от конкурентните решения.

Интересно е поведението на Radeon HD 7970 в теста. Веднага става ясно, че не са направени кардинални промени в геометричния тръбопровод (по принцип това не беше обещано, така че няма оплаквания). Ако в най-лекия режим новата карта е по-бърза от HD 6970 с 35%, а GTX 580 с 64%, то дори когато LOD е настроен на 25, производителността на новата карта пада до нивото на скоростта на GTX 560 Ti. Освен това. При максималното LOD съотношение разликата между скоростта на Geforce GTX 580 и Radeon HD 7970 достигна 3,5 пъти!

Нека проверим дали сме получили обещаната четири пъти разлика между HD 7970 и HD 6970. Не, максималното забавяне на Cayman GPU беше по-малко от два пъти. И по-често само един и половина. Като цяло не ни е много ясно къде да търсим четирикратно ускорение на теселацията, остава да вярваме на думата, че е някъде. Междувременно констатираме още една победа за видеочипове от Nvidia – те са много добри в геометричните тестове.

Заключения по синтетични тестове

Въз основа на резултатите от нашите синтетични тестове на най-новата видеокарта Radeon HD 7970, базирана на графичния процесор Tahiti от семейството на Южните острови, както и резултатите от други модели видеокарти, произведени от двата производителя на дискретни видеочипове, можем да заключават, че новият продукт определено ще стане лидер сред предлаганите на пазара едночипови решения. Това е просто страхотно продължение на успешните линии Radeon HD 5800 и HD 6900, които трябва сериозно да затвърдят позициите на AMD през следващите месеци.

Графичният процесор Tahiti е базиран на нова архитектура, използваща най-новата 28nm технология и е много различен от всички предишни чипове на компанията. Въпреки че броят на някои изпълнителни единици в него не е нараснал толкова много (изчислителни блокове ALU и ROPs), новият GPU включва важни архитектурни промени, насочени към повишаване на ефективността на изчисленията на GPU, както и подобряване на позициите в производителността на геометричните обработка на данни. Много от нашите синтетични тестове показаха, че изчислителната ефективност при сложни проблеми и скоростта на изпълнение на теселацията и геометричния шейдър се подобряват значително, макар и не винаги толкова, колкото очаквахме.

С видеочиповете на AMD се случи нещо, което трябваше да се случи. Същото нещо, което Nvidia вече мина малко по-рано. С изместване на акцента от графични изчисления към изчисления с общо предназначение и съответно преминаване от VLIW към скаларни архитектури, както и добавяне на други важни функции на GPGPU, като усъвършенствано кеширане и добавяне на планировчици към всяка изчислителна единица, увеличаването на сложността на чипа със сигурност ще надхвърли увеличението на пиковата производителност. Тоест, чисто всъщност се оказва, че предишните решения могат да бъдат по-ефективни - въпреки че са по-малко продуктивни, това се постига с по-малко усилия (под формата на сложност на чипа).

Нека обясним това с пример. Предимството на Radeon HD 7970 пред същата Radeon HD 5870 в някои синтетични тестове беше далеч от разликата в сложността на графичния процесор - в края на краищата Cypress има точно наполовина по-малко транзистори (2,15 срещу 4,3 милиарда), а при тестовете много рядко изостава зад толкова. Оказва се, че старият чип е по-ефективен от новия? Да, но само за остарели чисто графични задачи! В случай на неграфични изчисления и много сложни 3D изчисления, Таити се оказа дори повече от два пъти по-мощен от Cypress и това се потвърждава от съответната синтетика. GPGPU е бъдещето, а задачите на видеочиповете ще продължат да стават все по-сложни, така че AMD просто нямаше друг начин.

Но благодарение на архитектурните промени и нейните характеристики, видеокартата от новата серия в много синтетични тестове, която преди беше "ахилесовата пета" на решенията на AMD, стана повече от конкурентна, особено в сравнение с прекия конкурент Geforce GTX 580 , дори като се има предвид по-високата цена. Това се вижда ясно в почти всички синтетични тестове на пакетите RightMark, Vantage и примери от различни SDK.

Но имаше и потенциално... е, не толкова слаби, но не достатъчно силни страни на новия GPU. Те включват не твърде голямо увеличение на производителността при някои математически тестове и възникват геометрични въпроси (например къде е обещаното четирикратно ускорение?). Въпреки по-голямата сложност и площ на чипа в сравнение със същия Cayman, резултатите от модела HD 7970 понякога са по-ниски от очакваните, което не винаги е лесно за обяснение. Предполагаме, че може да е виновна липсата на оптимизация на драйвери, тъй като за AMD тази архитектура е напълно нова и изисква внимателно и продължително полиране. При някои тестове системата за управление на захранването PowerTune също може да се провали, което би могло да намали тактовата честота при достигане на максимална консумация на енергия в най-взискателните синтетични тестове, като попречи на картата да покаже очакваната производителност въз основа на броя на изпълнителните модули и тяхната тактова честота.

Въпреки че като цяло резултатите при синтетиката се оказаха доста добри, и е особено приятно, че инженерите на AMD затегнаха някои от слабите си места. За съжаление, в настоящите игри ще бъде много по-трудно да се постигнат толкова впечатляващи печалби в сравнение с усъвършенстваната синтетика. Веднага по няколко причини. Дори само защото производителността в приложенията за игри рядко е ограничена от някоя характеристика на видеокартата, за разлика от синтетичната, и с такава радикална промяна в графичната архитектура, драйверите все още трябва да бъдат оптимизирани и оптимизирани. Освен това дори съвременните игри рядко използват пълните възможности на графичните карти за компютър от най-висок клас. Те често са ограничени от скоростта на извличане на текстура и ефективната честота на запълване (честотна лента на видео паметта) и при такива условия такива сложни чипове не могат да се отворят напълно. Ще трябва да изчакаме или мощни ексклузивни компютри или следващото поколение игрови конзоли.

Предполагаме, че резултатите на Radeon HD 7970 в синтетичните тестове ще бъдат потвърдени от съответните цифри в "игровата" част на нашия материал. В игрите новата HD 7970 трябва да превъзхожда всички конкуренти и да превъзхожда Geforce GTX 580 с поне 30% или дори повече. Вероятно ще се получи както обикновено - в някои тестове ще има по-голямо предимство, а в други няма да има почти никакво предимство. Във всеки случай HD 7970 трябва да е най-добрият сред всички едночипови модели на AMD и Nvidia, поне ние открихме всички предпоставки за това. Така че нека да преминем към следващата част от материала – изучаването на скоростта в игрите.