7970 استهلاك. بطاقات الفيديو

دعنا ننتقل إلى نتائج القياس:

استهلاك الطاقة للنظام بأكمله في وضع الخمول ، W.

بفضل تحسينات العملية وتقليل الجهد الخامل ، انخفض استهلاك الطاقة بنحو ثلاثة واط مقارنة بالإصدار الأول من Radeon HD 7970. ومع ذلك ، لم نتوقع أي تغييرات ثورية هنا. لطالما نجحت بطاقات رسومات AMD مع تقنية ZeroCore Power.

استهلاك الطاقة للنظام بأكمله تحت الحمل ، W.

تحت الحمل ، تستهلك Radeon HD 7970 GHz Edition طاقة أكثر قليلاً من سابقتها. كما يمكنك أن تتخيل ، يرجع هذا إلى سرعات الساعة العالية ، حيث أرادت AMD بوضوح الضغط على أقصى أداء من تحسينات الرقاقة الجديدة. ومع ذلك ، من غير المحتمل أن تؤثر الزيادة في استهلاك الطاقة بمقدار ستة واط على فاتورة الكهرباء الإجمالية.

درجة حرارة الخمول ، درجة مئوية.

لقد انتظرنا بفارغ الصبر نتائج اختبار درجة الحرارة. بسبب الجهد المنخفض ، من المتوقع حدوث انخفاض في درجات حرارة الخمول. لكن ، للأسف ، لم نصلح التغييرات.

درجة الحرارة تحت الحمل ، درجة مئوية.

ومن المثير للاهتمام ، أننا حصلنا على الفرق بين بطاقتي الفيديو تحت التحميل. وصل طراز Radeon HD 7970 إلى 74 درجة مئوية ، لكن إصدار GHz وصل إلى 72 درجة مئوية في نفس الظروف. ربما أصبحت هذه الإمكانية ممكنة بسبب التحسينات التي تم إجراؤها أثناء إنتاج وحدة معالجة الرسومات.

مستوى الضوضاء في وضع الخمول ، ديسيبل (أ).

في وضع الخمول ، لا يوجد فرق تقريبًا في مستوى الضوضاء. نظرًا لأن درجات الحرارة متماثلة ، فلا داعي لأن تدور المروحة بشكل أسرع أو أبطأ.

مستوى الضوضاء تحت الحمل ، ديسيبل (أ).

تحت الحمل ، أصبح الفرق في مستوى الضوضاء أكثر أهمية. يعمل Radeon HD 7970 "القديم" بصوت أعلى بأكثر من ديسيبل من إصدار GHz. ربما يرجع ذلك إلى انخفاض درجة حرارة وحدة معالجة الرسومات ، مما يسمح للمروحة بالدوران بشكل أبطأ قليلاً.

منهجية الاختبار
إعدادات برنامج تشغيل AMD Catalyst - افتراضي
الحواف إعدادات التطبيق
الترشيح متباين الخواص إعدادات التطبيق
بالفسيفساء AMD الأمثل
محفز A.I. جودة مرشح النسيج الجودة ، تمكين تحسين تنسيق السطح
انتظر V-Sync تعطيل ما لم يحدد التطبيق
وضع AA متعدد العينات
الثلاثي بوفيرنيج إبطال
إعدادات برنامج تشغيل NVIDIA
وحدات معالجة الرسومات CUDA الجميع
الترشيح متباين الخواص الإدارة التطبيقية
تزامن عمودي استخدم إعداد التطبيق ثلاثي الأبعاد
تظليل إضاءة الخلفية عن
أقصى عدد من الإطارات المدربة مسبقًا 3
تدفق الأمثل آلي
وضع إدارة الطاقة تكيف
التنعيم - تصحيح جاما عن
تجانس - الوضع التحكم في التطبيق
تخزين ثلاثي عن
تسريع متعدد الشاشات وضع أداء العرض المتعدد
ترشيح الملمس - تحسين متباين الخواص عن
ترشيح القوام - الجودة جودة
ترشيح الملمس - انحراف سلبي عن دائرة اليود السماح
ترشيح الملمس - تحسين ثلاثي الخطوط تشغيل
برنامجAPIإعداداتأوضاع الاختبارإذن
3D مارك فانتاج برنامج DirectX 10 أداء الملامح ، مرتفع ، متطرف
3D مارك 11 برنامج DirectX 11 أداء الملامح المتطرفة
Unigine Heaven 2 برنامج DirectX 11 أقصى قدر من التفاصيل ، DirectX 11 ، التغطية بالفسيفساء في الوضع المتطرف بدون AA و AF / AA 4x ، AF 16x 1920 × 1080/2560 × 1440
أداة قياس الأداء Crysis 2 + Adrenaline Crysis 2 برنامج DirectX 11 وسط المدينة / الأدرينالين الخريطة. الأعلى. التفاصيل ، مواد عالية الدقة ، DirectX 11 حافة AA 1920 × 1080/2560 × 1440
لعبة Far Cry 2 + Far Cry 2 Benchmark Tool برنامج DirectX 10 خريطة مزرعة صغيرة. الأعلى. تفصيل بدون AA / AA 4x 1920 × 1080/2560 × 1440
مترو 2033 + مترو 2033 المعيار المرجعي برنامج DirectX 11 أقصى قدر من التفاصيل ، DirectX 11 ، DOF ، التغطية بالفسيفساء ، إيقاف تشغيل NVIDIA PhysX تحليلي AA ، AF 4x / MSAA 4x ، AF 16x 1920 × 1080/2560 × 1440
الكائنات الفضائية مقابل المفترس + أداة القياس الفضائي مقابل المفترس برنامج DirectX 11 أقصى قدر من التفاصيل ، DirectX 11 بدون AA و AF / AA 4x ، AF 16x 1920 × 1080/2560 × 1440
الأوساخ 3 برنامج DirectX 11 أقصى قدر من التفاصيل بدون AA و AF / AA 4x ، AF 16x 1920 × 1080/2560 × 1440
المافيا 2 برنامج DirectX 11 أقصى قدر من التفاصيل ، إيقاف تشغيل NVIDIA PhysX. بدون AA ، AF 1x / AA قيد التشغيل ، AF 16x 1920 × 1080/2560 × 1440
فقط السبب 2 برنامج DirectX 10 الحد الأقصى من التفاصيل ، مرشح خوخه مغلق ، تفاصيل المياه المحسّنة غير مفعّلة بدون AA ، AF 2x / AA 4x ، AF 16x 1920 × 1080/2560 × 1440

شاركت بطاقات الفيديو التالية في الاختبار كمنافسين لـ Radeon HD 7970:

  • AMD Radeon HD 6970 (880/5500)
  • راديون HD 6990 (880/5000)
  • NVIDIA GeForce GTX 580
  • نفيديا جي فورس جي تي اكس 590

رفع تردد التشغيل ودرجة الحرارة واستهلاك الطاقة

لقد وعدت AMD بأن المعالج HD 7970 سيرفع تردد التشغيل إلى 1 جيجاهرتز وأعلى دون أي مشاكل ، وهو أمر يسهل تصديقه ، حيث إن 75 ميجاهرتز مع تقنية المعالجة الجديدة لا يعد إنجازًا كبيرًا. لكن عينة الاختبار الخاصة بنا أضافت بسهولة 200 ميجاهرتز (!) فوق التردد الاسمي لوحدة معالجة الرسومات ، وزادت الذاكرة من 5500 إلى 6300 ميجاهرتز فعالة ، كل ذلك دون زيادة الجهد. واجه المزيد من عمليات رفع تردد التشغيل قيودًا على وظيفة Overdrive ، ولم يكن من الممكن التغلب عليها بمساعدة الحيل المعروفة باستخدام مفاتيح التسجيل وأدوات رفع تردد التشغيل التابعة لجهات خارجية. لا يستطيع HD 7970 قراءة BIOS باستخدام البرامج الحالية ، لذا لم تأت السجلات الحقيقية بعد.

يبدو أن Radeon HD 7970 لا يختلف حقًا عن HD 6970 من حيث TDP. استهلاك الطاقة للنظام تحت الحمل هو نفسه تمامًا ، وفي الوضع ثنائي الأبعاد يكون HD 6970 أكثر شرًا. أضافت زيادة تردد التشغيل قليلاً إلى استهلاك الطاقة ، لكن النتيجة لا تزال أقل بكثير من تلك الخاصة بالمنافسين الآخرين - مسرعات HD 6990 و GeForce "ثنائية الرأس".

بالإضافة إلى ذلك ، تبين أن HD 7970 هي أبرد بطاقة من بين جميع المشاركين في الاختبار. حتى عند رفع تردد التشغيل بحد أقصى ، فإنه يسخن أقل من HD 6970. وبما أن استهلاك الطاقة للبطاقات هو نفسه ، يجب أن نقول بفضل نظام التبريد الجديد. يكون التأثير واضحًا بشكل خاص إذا خفضت تردد معالج HD 7970 إلى مستوى HD 6970.

الأداء والمعايير الاصطناعية

  • يتفوق Radeon HD 7970 على كل من HD 6970 و GeForce GTX 580 بهامش كبير في جميع الأوضاع. تعمل بطاقات الفيديو "ذات الرأسين" فقط بشكل أسرع.
  • يمكن مقارنة HD 7970 فيركلوكيد في الأداء مع GeForce GTX 590 ، على الرغم من أن HD 6990 لا يزال في المقدمة. هذا الأخير عمومًا له نتائج عالية للغاية ، مما يثير مرة أخرى مسألة صحة الخوارزميات التي يحسب بها برنامج 3DMark Vantage النقاط. هذه ليست المرة الأولى التي نواجه فيها قطعًا أثرية غير مفسرة في هذا الاختبار.

  • يتفوق HD 7970 على جميع المنافسين باستثناء HD 6990 حتى بدون رفع تردد التشغيل.
  • عند رفع تردد التشغيل ، يتقلص الفرق بين HD 7970 والرائد القديم المكون من شريحتين بشكل خطير.

الأداء ومعايير الألعاب

Unigine Heaven 2

  • يتمتع HD 7970 بميزة هائلة ، تقريبًا مزدوجة على HD 6970. يمكن ملاحظة أن AMD قامت بعمل رائع في التغطية بالفسيفساء.
  • أداء مشابه له GeForce GTX 580.
  • فيركلوكيد ، يتساوى HD 7970 مع HD 6990 ، لكنه لا يرقى إلى مستوى GTX 590.

كرايسس 2

  • الفرق بين نتائج HD 7970 و HD 6970 مزدوج تقريبًا.
  • يتفوق HD 7970 بشكل ملحوظ على GeForce GTX 580 أيضًا.
  • بدون رفع تردد التشغيل ، يمكن مقارنة أداء HD 7970 في الأداء مع HD 6990 ، ومع رفع تردد التشغيل ، فإنه يلحق بـ GeForce GTX 590.

الأجانب مقابل المفترسون

  • يتميز HD 7970 بميزة 25٪ عن HD 6970.
  • إن GeForce GTX 580 في أوضاع AA و AF متأخرة قليلاً حتى عن Radeon HD 6970.
  • تعد بطاقات الفيديو ثنائية الشريحة أسرع بشكل ملحوظ من المنتجات الجديدة ، وحتى رفع تردد التشغيل لا يسمح لها باللحاق بالركب.

  • يعمل HD 6970 بشكل جيد في هذا المعيار ، وهذا هو السبب في أن ميزة HD 7970 عليه كبيرة ، ولكنها ليست ساحقة.
  • يمكن أن تتنافس GeForce GTX 580 بسهولة مع HD 7970 بدقة 1920 × 1080 ، ولكنها تتخلف عند 2560 × 1440.
  • بطاقات الفيديو ثنائية المعالجات بعيدة المنال بالنسبة لكاميرا HD 7970 حتى عند رفع تردد التشغيل.

قطار الانفاق رقم 2033

  • HD 7970 أسرع بمقدار الثلث على الأقل من HD 6970.
  • لا تزال GeForce GTX 580 تظهر نتائج جيدة وليست بعيدة عن الأخبار.
  • تعمل SLI و CrossFire بشكل رائع ، لذا حتى مع رفع تردد التشغيل ، فإن HD 7970 لا يمكنها التغلب عليها ، على الرغم من أنها تقترب من HD 6990.

بعيدة كل البعد 2

  • HD 7970 أسرع بنسبة 20-25٪ من HD 6970.
  • يتفوق HD 7970 أيضًا بشكل كبير على GeForce GTX 580.
  • تعتبر كل من GTX 590 و HD 6990 على ارتفاع يتعذر الوصول إليه بالنسبة إلى HD 7970 ، حتى بعد رفع تردد التشغيل.

VLIW4 مقابل GCN

أخيرًا ، قمنا بتشغيل Radeon HD 7970 من خلال اختبارات الألعاب بترددات متساوية مع Radeon HD 6970. يوضح الرسم التخطيطي بوضوح مدى الميزة التي توفرها بنية GCN الجديدة بمفردها مقارنة بـ VLIW4.

الموجودات

أنشأت AMD وحدات معالجة الرسومات من الصفر والتي تختلف اختلافًا جذريًا عن أي شيء تم إصداره تحت علامة Radeon التجارية على مدار السنوات القليلة الماضية. من حيث حجم التغييرات ، يمكن مقارنة الحدث بإدخال هندسة تظليل موحدة VLIW5 في شريحة R600 (Radeon HD 2900). ولكن إذا كنت تتذكر المسار الصعب الذي كان على VLIW5 أن يمر به قبل الكشف عن الاحتمالات الكامنة فيه ، يصبح من الملاحظ أن كل شيء مختلف تمامًا هذه المرة.

إن بنية GCN التي تمثلها شريحة تاهيتي هي بالفعل منتج ناضج وفعال للغاية. يعتبر Radeon HD 7970 أسرع بنسبة 20-50٪ من الجيل السابق من AMD ذو الرقاقة الواحدة ويتفوق بسهولة على منافسه الرئيسي GeForce GTX 580. على الرغم من أن Tahiti وحدة معالجة رسومات ضخمة ذات تعقيد غير مسبوق ، إلا أن البطاقة لا تستهلك طاقة أكثر من البطاقة GeForce GTX 580. من HD 6970 ولها سقف مرتفع لرفع تردد التشغيل. وعند زيادة سرعة التشغيل ، يقترب الأداء بالفعل من مستوى محولات المعالجات المزدوجة Radeon HD 6990 و GeForce GTX 590.

لاحظ أن مواقع بنية Fermi لا تزال قوية في المهام مع الاستخدام النشط لقدرات DirectX 11. في بعض الألعاب ، يكون GTX 580 أقل شأناً قليلاً من المنتج الجديد من AMD ، لذلك لا يزال أمام NVIDIA فرصة للانتقام بعد ذلك عام. سيكون من المثير للاهتمام أيضًا أن نرى كيف تقرب AMD وحدات معالجة الرسومات خطوة بخطوة من معالجات الأغراض العامة. حصلت CUDA من NVIDIA على بداية كبيرة على مر السنين ، ولكن AMD لديها الآن بنية رسومات قوية ومعالجات Fusion ، والتي ستحصل عاجلاً أم آجلاً على نوى GCN مضمنة.

منهجية الاختبار

إعدادات AMD Catalyst Control Center
الحواف استخدم إعدادات التطبيق
الترشيح متباين الخواص استخدم إعدادات التطبيق
بالفسيفساء استخدم إعدادات التطبيق
محفز الذكاء الاصطناعي ، جودة ترشيح الملمس الجودة ، تمكين تحسين تنسيق السطح
مستوى تفاصيل خريطة Mipmap جودة
انتظر V-Sync إيقاف ، ما لم يحدد التطبيق
وضع الحواف متعدد العينات AA
إعدادات Direct3D ، تمكين مثيل الهندسة تشغيل
الثلاثي بوفيرنيج عن
إعدادات لوحة تحكم NVIDIA
الانسداد المحيط عن
الترشيح متباين الخواص التحكم في التطبيق
مضاد الحواف - تصحيح جاما تشغيل
وضع الحواف التحكم في التطبيق
حماية الحواف - الإعدادات التحكم في التطبيق
منع الحواف - الشفافية عن
وحدات معالجة الرسومات CUDA الجميع
الحد الأقصى للأطر المقدمة مسبقا 3
متعدد الشاشات / تسريع GPU المختلط وضع أداء العرض المتعدد
وضع إدارة الطاقة تكيف
ترشيح الملمس - تحسين عينة متباين الخواص عن
ترشيح الملمس - تحيز سلبي في مستوى اللد السماح
ترشيح القوام - الجودة جودة
ترشيح الملمس - تحسين ثلاثي الخطوط تشغيل
التحسين المترابطة آلي
تخزين ثلاثي عن
تزامن عمودي استخدم إعدادات التطبيق ثلاثي الأبعاد
مجموعة من المعايير
برنامج API إعدادات وضع الاختبار إذن
3D مارك 2011 برنامج DirectX 11 أداء الملامح المتطرفة

Unigine Heaven 2 برنامج DirectX 11 الأعلى. الجودة ، DirectX 11 ، التغطية بالفسيفساء في الوضع المتطرف AF 16x ، MSAA 4x 1920 × 1080/2560 × 1440
Crysis Warhead + أداة قياس الرؤوس الحربية Framebuffer Crysis برنامج DirectX 10 ذبابة الصقيع. الأعلى. الإعدادات ، DirectX 10. AF 16x ، MSAA 4x 1920 × 1080/2560 × 1440
مترو 2033 + مترو 2033 المعيار المرجعي برنامج DirectX 11 الأعلى. الإعدادات ، DirectX 11 ، DOF ، التغطية بالفسيفساء ، إيقاف تشغيل NVIDIA PhysX AF 16x ، MSAA 4x 1920 × 1080/2560 × 1440
DiRT 3 + Adrenaline Racing Benchmark Tool برنامج DirectX 11 أسبن ، 8 سيارات. الأعلى. الجودة ، DirectX 11 AF، AA 4x 1920 × 1080/2560 × 1440
أداة قياس الأداء Crysis 2 + Adrenaline Crysis 2 برنامج DirectX 11 سنترال بارك. الأعلى. الجودة ، DirectX 11 ، مواد عالية الدقة AF 16x ، Post MSAA + Edge AA 1920 × 1080/2560 × 1440
باتلفيلد 3 + فرابس برنامج DirectX 11 بداية مهمة Going Hunting. الأعلى. جودة AF 16x ، MSAA 4x 1920 × 1080/2560 × 1440
مدينه الراجل الوطواط. المعيار المدمج برنامج DirectX 11 الأعلى. جودة AF ، MSAA 4x 1920 × 1080/2560 × 1440
The Elder Scrolls 5: Skyrim + FRAPS دايركت 9 مدينة ويترين. الأعلى. جودة AF 16x ، MSAA 4x 1920 × 1080/2560 × 1440
Call of Duty: Modern Warfare 3 + FRAPS دايركت 9 مهمة العودة إلى المرسل. الأعلى. جودة AF ، MSAA 4x 1920 × 1080/2560 × 1440

شاركت بطاقات الفيديو التالية في الاختبار كمنافسين لـ Radeon HD 7970 GHz Editon:

  • AMD Radeon HD 7970 (925/5500 ميجا هرتز ، 3 جيجا بايت)
  • NVIDIA GeForce GTX 680 (1006/6008 ميجاهرتز ، 2 جيجابايت)
  • NVIDIA GeForce GTX 670 (915/6008 ميجا هرتز ، 2 جيجا بايت)
  • NVIDIA GeForce GTX 590 (607/3414 ميجا هرتز ، 3 جيجا بايت)
  • AMD Radeon HD 6990 (880/5000 ميجا هرتز ، 4 جيجا بايت)

لكي يكون كل من المشاركين في مؤامرة اليوم ، Radeon HD 7970 GHz Edition و GeForce GTX 680 ، مسلحين بالكامل ، تم استخدام أحدث برامج التشغيل التجريبية من NVIDIA (304.48 Beta) و AMD (Catalyst 12.7 Beta) في الاختبار. بالإضافة إلى ذلك ، تم تنشيط وضع PCI-E 3.0 لـ GTX 680 ، وهو غير مدعوم رسميًا على منصة Intel X79.

⇡ رفع تردد التشغيل ودرجة الحرارة واستهلاك الطاقة

نظرًا لأن PowerTune لا يظهر نفسه عند ترددات الساعة المرصودة ، فإن تردد Boost Clock البالغ 1050 ميجاهرتز أصبح نقطة البداية لرفع تردد التشغيل. مع جهد وحدة معالجة الرسومات ، الأمور ليست بهذه البساطة. الحقيقة هي أن إعداد الجهد في MSI Afterburner (من الممكن أن يحدث نفس الشيء مع المرافق الأخرى ، لم نقم بتجربته) لم يعد له أي تأثير على الجهد المرصود. لزيادة ذلك ، تحتاج إلى محاولة تعيين أعلى دائمالجهد باستخدام الخيار المناسب. ولكن ، كما قد يبدو غريبًا ، فإن هذا لا يمنع تذبذب الجهد ، بل يغير القيم المرصودة إلى الأعلى. وبالتالي ، لا يمكننا إصلاح الجهد ، لكن يمكننا تغيير النطاق الذي يتغير فيه. نتيجة لذلك ، إذا قمت بضبط الجهد يدويًا على 1.3 فولت ، فسيكون نطاق التذبذب حوالي 1.227 - 1.252 فولت.

وتجدر الإشارة إلى أنه في بعض الحالات ، عند اللعب بمختلف أدوات رفع تردد التشغيل والمراقبة ، كان الجهد لا يزال ثابتًا عند 1.3 فولت ، ولكن بعد ذلك ، على ما يبدو ، أصبح Power Tune مجنونًا ، وظهرت عيوب قوية على الشاشة ثلاثية الأبعاد بغض النظر عن وحدة معالجة الرسومات تردد. لا يبدو أنه من المجدي محاولة التغلب على Power Tune ، خاصة أنها تؤدي وظيفتها بشكل جيد.

إذا اعتبرنا أن Boost Clock للمحول الجديد هو تردد GPU القياسي في Radeons الأخرى (ومن حيث مبادئ Power Tune ، فهو كذلك) ، فإن إصدار HD 7970 GHz قد تم رفع تردد التشغيل بشكل أفضل من HD 7970 العادي: حتى 1240 ميغاهيرتز للمعالج و 7320 (1830) ميغاهيرتز من الذاكرة. إذا طرحنا نطاق 50 MHz Power Tune Boost من 1240 ميجاهرتز ، فسنحصل على التردد الذي تصل إليه العديد من مثيلات HD 7970 القياسي. على ما يبدو ، يسمح جدول التردد الأطول لوحدة معالجة الرسومات فيركلوكيد بالوصول إلى قيم ذروة أعلى ، مع الرجوع إلى السابق الحد الأدنى في المهام الثقيلة. ومع ذلك ، ليست حقيقة أن البطاقة تصل فعليًا إلى 1240 ميجاهرتز ، ولا يتم اختناقها باستمرار. حتى تتمكن أدوات المراقبة من الوصول إلى الأجزاء الداخلية من Power Tune ، سيظل هذا لغزًا.

لكن زيادة سرعة تشغيل الذاكرة الرائعة هي فقط ميزة وحدات التحكم الممتازة لشريحة تاهيتي ورقائق الذاكرة ، والتي تبدو أفضل قليلاً من تلك المزودة بـ HD 7970 القياسي.

تسخن نسخة HD 7970 GHz أكثر قليلاً من الإصدار القياسي - تقريبًا مثل GeForce GTX 680. يسمح لك نظام التبريد ، الذي يتم تشغيله بأقصى سرعة ، بالحفاظ على نفس درجات الحرارة أثناء رفع تردد التشغيل القوي كما هو الحال في الوضع العادي ، ولكن فقط على حساب ضجيج هائل. نعترف أنه حتى مع التحكم التلقائي في المروحة ، فإن إصدار HD 7970 GHz يصدر ضوضاء أكثر بكثير من GeForce GTX 680.

لا يزال الحد الأقصى لاستهلاك الطاقة المسجل للبطاقة ، كما هو متوقع ، يرتفع قليلاً مقارنةً مع HD 7970 العادي. لا نعتقد أن AMD تكذب عندما يزعمون أن TDP لكلا الإصدارين من HD 7970 هو نفسه. على ما يبدو ، فإن إصدار HD 7970 GHz هو ببساطة إتقانه بشكل أكثر نشاطًا. أثناء رفع تردد التشغيل ، بالطبع ، يرتفع استهلاك الطاقة عند السقف. لن يتدخل مصدر طاقة قوي.

⇡ Radeon HD 7970 GHz Edition vs GeForce GTX 680

هذه هي النتائج التي من أجلها بدأ كل شيء. لذا ، هل تمكنت AMD من استعادة القيادة المفقودة؟

لا تزال GeForce GTX 680 بدون رفع تردد التشغيل تعمل بشكل أفضل من HD 7970 ، لكنها أسرع من بين بطاقات Radeon التي تم رفع تردد تشغيلها.

الألعابالاختبارات+ Unigine الجنة

بدقة 1920 × 1080 في ثلاثة من تسعة معايير للألعاب (Crysis Warhead و DiRT 3 و Metro 2033) ، فإن Radeon HD 7970 GHz Edition تتقدم. في الثلاثة الأخرى ، فازت GeForce GTX 680 (Unigine Heaven 2 ، Battlefield 3 ، Skyrim). في الألعاب الأخرى ، لا توجد فروق ذات دلالة إحصائية بين الخصوم. رسم مثالي. في وضع 2560x1440 ، يفوق الموقف لصالح HD 7970. فقط في CoD 3 و Unigine Heaven يحتفظ GTX 680 بتفوقه.

رفع تردد التشغيل أفضل لبطاقة AMD منه لبطاقة GTX 680: زيادة الأداء أعلى بشكل ملحوظ ، ونتيجة لذلك ، فإن إصدار HD 7970 GHz ينتقم حتى عند 1920x1080.

⇡ Radeon HD 7970 GHz Edition ضد الكل

  • إنه أمر مؤسف بالنسبة لـ AMD ، ولكن في برنامج 3DMark 2011 ، فإن إصدار Radeon HD 7970 GHz أقل شأناً ليس فقط من GeForce GTX 680 ، ولكن أيضًا من GTX 670.
  • إن ميزة إصدار GHz على الإصدار القياسي ملحوظة.

Unigine Heaven 2

  • أضاف إصدار GHz عددًا قليلاً من FPS على HD 7970 العادي.
  • عند 2560 × 1440 ، تتمتع كل من GeForce GTX 670 و GTX 680 بميزة بسيطة ، ولكن في 1920 × 1080 ، يكون إصدار HD 7970 جيجاهرتز متأخراً بشكل ملحوظ.
  • يتفوق إصدار GHz فيركلوكيد على Radeon HD 6990 ويقارن بـ GTX 670 و GTZ 680.

الرأس الحربي Crysis (DirectX 10)

  • في هذا الاختبار ، حتى HD 7970 العادي يتفوق بسهولة على GeForce GTX 680 نظرًا لعرض النطاق الترددي العالي للذاكرة.
  • يعد إصدار HD 7970 جيجاهرتز أسوأ قليلاً من GeForce GTX 590 ، كما أن إصدار GHz فيركلوكيد يتساوى مع Radeon HD 6990.

مترو 2033 (DirectX 11)

  • ميزة HD 7970 GHz Edition مقارنة بالإصدار العادي صغيرة.
  • يعد إصدار HD 7970 GHz أسرع بشكل ملحوظ من GeForce GTX 680.
  • عند رفع تردد التشغيل ، يصل إصدار GHz إلى مستوى GeForce GTX 590 و Radeon HD 6990.

DiRT 3 (DirectX 11)

  • يعتبر إصدار HD 7970 GHz أفضل بكثير من الإصدار القياسي.
  • يعد إصدار GHz أيضًا أسرع بشكل ملحوظ من GTX 680 ، ويمكن مقارنته في الأداء بـ Radeon HD 6990 و GeForce GTX 590.

Crysis 2 (DirectX 11)

  • في وضع 2560x1440 ، هناك زيادة ملحوظة في الأداء مقارنةً بـ HD 7970 العادي.
  • عند 2560x1440 ، تتقدم HD 7970 GHz Edition أيضًا على GeForce GTX 680 ، وقد تركت البطاقة فيركلوكيد GTX 590 وراءها وتلتحق بـ Radeon HD 6990.
  • في وضع 1920 × 1080 ، وصل المشاركون في الاختبار إلى حد 100 إطار في الثانية المحدد في Crysis 2.

Battlefield 3 (DirectX 11)

  • مرة أخرى ، يتمتع إصدار HD 7970 GHz تعزيزًا ملحوظًا في FPS مقارنةً بـ HD 7970 القياسي.
  • الجدة على قدم المساواة مع GTX 670 و GTX 680.
  • يعد إصدار HD 7970 GHz الذي تم رفع تردد تشغيله صعبًا للغاية حتى بالنسبة إلى GTX 590.

باتمان: Arkham City (DirectX 11)

  • تعطي العبارة السحرية GHz Edition مرة أخرى HD 7970 دفعة رائعة من FPS.
  • في 1920 × 1080 ، تكون البطاقة على قدم المساواة مع GTX 680 ، وتتفوق عليها في الأداء عند 2560 × 1440.

The Elder Scrolls 5: Skyrim (DirectX 9)

  • لا يوجد فرق كبير بين HD 7970 و HD 7970 GHz Edition و GeForce GTX 680 في هذه اللعبة: بعد حد معين ، لم يعد بإمكان محرك Skyrim استخدام قوة حوسبة إضافية.

Call of Duty: Modern Warfare 3 (DirectX 9)

  • مقارنةً بإصدار الأسهم من HD 7970 ، فإن إصدار GHz لديه زيادة كبيرة في معدل الإطارات.
  • ومع ذلك ، فإن GeForce GTX 670 فقط ، وليس GTX 680 ، هو منافس مساوٍ للمنتج الجديد.

⇡ الاستنتاجات

بالنسبة إلى AMD ، ولأول مرة منذ الأيام الماضية لـ Radeon X1950 XTX ، حان الوقت عندما تكون بطاقة الفيديو العليا على الأقل جيدة مثل NVIDIA الرائد من الجيل نفسه. تعد HD 7970 GHz Edition أسرع قليلاً من GeForce GTX 680 في أوضاع الرسومات الثقيلة (مثل 2560x1440) بشكل عام بفضل ناقل الذاكرة 384 بت. بالإضافة إلى ذلك ، بعد رفع تردد التشغيل في المصنع ، لا يزال لديه هامش تردد كبير. لتقنية Power Tune المحدثة تأثير مفيد على إمكانية رفع تردد التشغيل لوحدة معالجة الرسومات ، وبدأت الذاكرة في رفع تردد التشغيل بشكل أفضل. في البطاقات المستقبلية من كل من NVIDIA و AMD ، نحن على يقين من رؤية تقنيات التحكم في التردد والجهد الديناميكي المزدهرة ، كما حدث بالفعل مع وحدة المعالجة المركزية.

في الواقع ، في الإصدار الأصلي ، تعد HD 7970 بطاقة قوية للغاية ، وتصل معظم النسخ بسهولة إلى مثل هذه الترددات التي يمكنك من خلالها اللحاق بالركب GeForce GTX 680 وتجاوزه. إصدار GHz هو في الغالب منتج عصري لكل من المالك و الشركة المصنعة. قامت AMD برفع تردد التشغيل عن HD 7970 بما يكفي لمطابقة GTX 680 ولا تزال في نفس TDP. تُظهر اختبارات استهلاك الطاقة الخاصة بنا بوضوح ما كان سيحدث إذا كان المطورون قد حددوا هدفهم بانتصار غير مشروط على الرائد NVIDIA.

للأسف ، فقدت AMD بالفعل ميزة خاصة على بطاقات NVIDIA في الجزء المتطور ، والتي تمتعت بها في السنوات الأخيرة - استهلاك الطاقة. إذا لم تستطع Radeons الراقية سابقًا التغلب على GeForce GTX 480 و GTX 580 من حيث الأداء ، لكنها استهلكت وتسخنت أقل بكثير ، فهناك الآن تعادل في المعايير ، لكن إصدار TDP Radeon HD 7970 GHz هو نفس القدر أعلى بمقدار 55 وات من GTX 680.

وسؤال آخر. إن وجود بطاقتين متطابقتين ماديًا مع برامج مختلفة في خط Radeon يبدو قبيحًا بالفعل. ما الذي يدفعه مشترو إصدار HD 7970 GHz ، إذا كان بالإمكان تحقيق نفس الشيء تقريبًا عن طريق رفع تردد التشغيل بسهولة عن HD 7970 القياسي ، ولماذا لم يحصل مالكو هذا الأخير على برنامج ثابت جديد؟ نظرًا لأنه لا يمكن تحديث BIOS لبطاقة الفيديو بسهولة مثل برامج التشغيل ، فسيكون من الأفضل إذا حلت HD 7970 GHz Edition محل سابقتها تمامًا. حسنًا ، تمامًا من وجهة نظر الانسجام العالمي.

  • الجزء 2 - التعارف العملي
  • الجزء 3 - نتائج اختبار الألعاب (الأداء)

في هذا الجزء كالعادة سوف ندرس بطاقة الفيديو نفسها ، وكذلك نتعرف على نتائج الاختبارات التركيبية.

دفع

  • وحدة معالجة الرسومات:راديون HD 7970 (تاهيتي)
  • واجهه المستخدم: PCI Express x16
  • تردد تشغيل وحدة معالجة الرسومات (ROPs): 925 ميجاهرتز (925 ميجاهرتز اسمي)
  • تردد الذاكرة (المادية (الفعالة)): 1375 (5500) ميجاهرتز (اسمي - 1375 (5500) ميجاهرتز)
  • عرض ناقل تبادل الذاكرة: 384 بت
  • عدد وحدات الحوسبة في GPU / تردد الكتل: 32/925 ميجاهرتز (32/925 ميجاهرتز اسمي)
  • عدد العمليات (ALU) في الكتلة: 64
  • العدد الإجمالي للعمليات (ALU): 2048
  • عدد وحدات النسيج: 128 (BLF / TLF / ANIS)
  • عدد كتل التنقيط (ROP): 32
  • أبعاد: 285 × 100 × 33 مم (القيمة الأخيرة هي أقصى سمك لبطاقة الفيديو)
  • لون النسيج:أحمر
  • استهلاك الطاقة (ذروة ثلاثية الأبعاد / ثنائية الأبعاد / سكون): 215/70/3 واط
  • مقابس الإخراج: 1 × DVI (Dual-Link / VGA) ، 1 × HDMI 1.4a ، 2 × Mini-DisplayPort 1.2
  • دعم المعالجة المتعددة: CrossFire X (جهاز)

AMD Radeon HD 7970 3072 ميجابايت 384 بت GDDR5 PCI-E

تحتوي البطاقة على 3072 ميجابايت من GDDR5 SDRAM موضوعة في 12 شريحة على الجانب الأمامي من PCB.

في غياب اختبارات DirectX 11 الاصطناعية الخاصة بنا ، استخدمنا مرة أخرى الأمثلة من Microsoft و AMD SDKs وعرض Nvidia. الأول هو HDRToneMappingCS11.exe و NBodyGravityCS11.exe من DirectX SDK (فبراير 2010).

لقد أخذنا أيضًا طلبات من كلا المصنعين: Nvidia و AMD. تم أخذ DetailTessellation11 و PNTriangles11 من ATI Radeon SDK (وهي موجودة أيضًا في DirectX SDK). بالإضافة إلى ذلك ، تم استخدام برنامج Nvidia التجريبي - Realistic Water Terrain ، والمعروف أيضًا باسم Island11 (المؤلف - Timofey Cheblokov ، وهو متخصص معروف في الرسومات ثلاثية الأبعاد).

تم إجراء الاختبارات التركيبية على بطاقات الفيديو التالية:

  • راديون HD 7970 HD 7970)
  • راديون HD 6990مع المعلمات القياسية (المشار إليها فيما يلي HD 6990)
  • راديون HD 6970مع المعلمات القياسية (المشار إليها فيما يلي HD 6970)
  • راديون HD 5870مع المعلمات القياسية (المشار إليها فيما يلي HD 5870)
  • جيفورس جي تي اكس 590مع المعلمات القياسية (المشار إليها فيما يلي جى تى اكس 590)
  • جيفورس جي تي اكس 580مع المعلمات القياسية (المشار إليها فيما يلي جى تى اكس 580)

لمقارنة نتائج أحدث بطاقة رسومات Radeon HD 7970 ، تم اختيار هذه الطرز لأسباب مختلفة. تم أخذ Radeon HD 6970 كسابق مباشر للجزء العلوي ، تم اعتبار HD 6990 أقوى حل (وإن كان ثنائي الشريحة) على وحدة معالجة الرسومات في البنية السابقة ، أضفنا HD 5870 لتقييم الكسب بين اثنين مختلفين تحديثات معمارية وباعتبارها وحدة معالجة رسومات نصف معقدة تمامًا مثل تاهيتي.

يتم أخذ حلول Nvidia المحددة لأن Geforce GTX 580 هو أسرع طراز أحادي الشريحة للشركة يعتمد على أحدث جيل من GPU. على الرغم من أنها ليست منافسًا لبطاقة الفيديو AMD المقدمة من حيث السعر ، إلا أن نتائجها مثيرة للاهتمام مثل الحد الأقصى للحلول الحالية أحادية الشريحة من Nvidia. و GTX 590 ثنائي الشريحة هو البديل الأعلى سعراً للشركة. في اختبارات DirectX 11 ، استخدمنا أيضًا Geforce GTX 560 Ti ، وهو أمر ضروري لتقييم الأداء الهندسي المتزايد لوحدة معالجة الرسومات AMD الجديدة.

Direct3D 9: اختبارات ملء البكسل

يحدد هذا الاختبار أقصى أداء لأخذ عينات النسيج (معدل texel) في وضع FFP لعدد مختلف من الأنسجة المطبقة لكل بكسل:

في اختبار ترشيح النسيج القديم 32 بت من RightMark ، تعرض معظم بطاقات الفيديو أرقامًا بعيدة عن أن تكون ممكنة من الناحية النظرية. لذا فإن نتائج المواد التركيبية في حالة بطاقة الفيديو Radeon HD 7970 لم تصل إلى قيمة الذروة ، لذلك سننظر مرة أخرى في سرعة التركيب بالأرقام من اختبار 3DMark Vantage ، حيث يتم الحصول على أرقام أكثر واقعية دائمًا.

في حالتنا ، اتضح أن HD 7970 يختار فقط ما يصل إلى 80 تكسيلًا لكل ساعة من مواد 32 بت مع ترشيح ثنائي ، وهو أقل بكثير من الشكل النظري لـ 128 تكسيلًا مصفيًا. بخلاف ذلك ، تحول كل شيء بشكل متوقع - أظهرت جميع لوحات AMD أداءً أعلى وتتقدم على بطاقات الفيديو Nvidia. بعد كل شيء ، حتى أفضل شريحة واحدة Geforce GTX 580 بها 64 وحدة TMU فقط ، وبالتالي فهي أدنى بكثير من الطراز الذي يعتمد على شريحة تاهيتي ، التي تحتوي على 128 وحدة TMU تعمل بتردد أعلى. لذلك ، يكون الاختلاف أكثر من شقين. حسنًا ، تُظهر بطاقة GTX 590 ثنائية الشريحة في هذا الاختبار نتيجة غير كافية بشكل واضح.

من الواضح أيضًا أن إصدار GPU المزدوج من AMD لا يعمل بشكل صحيح في اختبارنا ، لأن HD 7970 دائمًا ما يتفوق حتى عليه. حسنًا ، تجاوز النموذج الجديد سابقه بنحو 30٪ ، وهو أسوأ قليلاً من القيم الممكنة نظريًا. ومع ذلك ، في الحالات التي تحتوي على عدد قليل من القوام ، عندما يكون عرض النطاق الترددي للذاكرة هو الأكثر تأثراً ، تكون النتيجة أقل - حوالي 25٪.

ضع في اعتبارك نفس النتائج في اختبار التعبئة:

تُظهر الأرقام معدل التعبئة ، وفيها نرى كل شيء متشابهًا ، باستثناء ذلك مع مراعاة عدد البكسل المكتوب في المخزن المؤقت للإطار. غالبًا ما تذهب النتيجة القصوى إلى بطاقة الفيديو الجديدة المتطورة من عائلة Radeon HD 7900. لديها عدد قياسي من TMUs تعمل بتردد أعلى وأكثر كفاءة في اختبارنا التركيبي. دعنا ننتقل إلى نصوص تظليل البكسل البسيط.

Direct3D 9: معايير Pixel Shaders

تعتبر المجموعة الأولى من تظليل البكسل التي ندرسها بسيطة جدًا لرقائق الفيديو الحديثة ؛ فهي تتضمن إصدارات مختلفة من برامج البكسل منخفضة التعقيد نسبيًا: 1.1 و 1.4 و 2.0 الموجودة في الألعاب القديمة.

هذه الاختبارات بسيطة للغاية بالنسبة لوحدات معالجة الرسومات الحديثة وهي محدودة في الغالب بأداء التركيب وأحيانًا التعبئة. لذلك ، فهي لا تظهر جميع إمكانيات شرائح الفيديو الحديثة ، لكنها مثيرة للاهتمام من وجهة نظر تطبيقات الألعاب التي عفا عليها الزمن. في أبسط اختبارين ، تجاوز Radeon HD 7970 الجديد تقريبًا حتى HD 6990 ثنائي الشريحة ، ولكن في الاختبارات الأكثر صعوبة ، اتخذ موقعًا بين HD 6990 و HD 6970. من المثير للاهتمام كيف تختلف الاختبارات على وحدات معالجة الرسومات ذات البنى المختلفة. وهنا تاهيتي أقرب إلى حد ما إلى GF110 من سابقتها. بطبيعة الحال ، ليس من حيث القيمة المطلقة ، الفرق بينهما كبير جدًا - من مرة ونصف إلى مرتين.

يقتصر الأداء في الاختبارات الأخرى في الغالب على سرعة وحدة النسيج ومعدل التعبئة ، لذا فإن Radeon HD 7970 الجديد أسرع بحوالي 30-40٪ من HD 6970 السابق ، وهو ما يتماشى مع النظرية. تتفوق جميع لوحات AMD على كلا الطرازين من Geforce ، باستثناء أنه عند مقارنة HD 5870 و GTX 590 ، كل شيء ليس واضحًا جدًا. من الواضح أن الافتقار إلى سرعة التركيب هو المسؤول عن فشل Nvidia في هذه الاختبارات. ولكن حتى تظليل Phong ثلاثي البكسل ، والذي يعتمد بشكل أكبر على الأداء الرياضي لوحدة معالجة الرسومات ، عند إطلاقه على GF110 ، يكون أدنى بكثير من كايمان ، وحتى أكثر من تاهيتي.

لنلقِ نظرة على نتائج برامج البكسل الأكثر تعقيدًا للإصدارات الوسيطة:

وهذه المرة تبين أنها متشابهة تقريبًا ، يقع HD 7970 تقريبًا بين الطرازين أحادي الشريحة والثنائي الشريحة استنادًا إلى كايمان من سلسلة HD 6900. اختبار Cook-Torrance هو أكثر كثافة من الناحية الحسابية ، والفرق فيه يتوافق تقريبًا مع الاختلاف في عدد ALUs وترددها. لذلك ، يعد هذا الاختبار مناسبًا بشكل أفضل لمعمارية AMD ، التي تحتوي شرائحها على عدد أكبر من وحدات الرياضيات ، وتاهيتي ليست استثناءً.

ومن المثير للاهتمام ، أن HD 5870 يتفوق على HD 6970 في هذا الاختبار ، ويبدو أن هذا حدث بسبب الأداء الضعيف لهذا التظليل على شريحة أحدث بهندسة VLIW4. لذلك ، على الرغم من أن Radeon HD 7970 الجديد تفوق في الأداء على HD 6970 ، إلا أنه كان أسرع بنسبة 20٪ فقط من HD 5870 في هذا الاختبار.

يستخدم الاختبار الثاني لتصيير المياه الإجرائي "الماء" ، والذي يعتمد بشكل أكبر على سرعة التركيب ، أخذ عينات معتمدة من مواد ذات مستويات متداخلة كبيرة ، ويتم تصنيف بطاقات الفيديو حسب سرعة التركيب ، ومعدلة لكفاءة استخدام TMU المختلفة. في هذا الاختبار ، تعمل حلول AMD دائمًا بشكل جيد ، وتوفر HD 7970 نتيجة جيدة جدًا ، على الرغم من أنها أسوأ من HD 6990 ثنائي الشريحة ، ولكنها أفضل بكثير من سابقتها في كايمان. أعلى لوحة Nvidia أحادية الشريحة متأخرة أكثر من 2.5 مرة!

Direct3D 9: اختبارات Pixel Shaders 2.0

تعد اختبارات تظليل DirectX 9 بكسل أكثر تعقيدًا من الاختبارات السابقة ، فهي قريبة مما نراه حاليًا في الألعاب متعددة المنصات ، وتنقسم إلى فئتين. لنبدأ بإصدار أبسط من تظليل 2.0:

  • رسم الخرائط المنظر- طريقة لرسم خرائط النسيج مألوفة في معظم الألعاب الحديثة ، موصوفة بالتفصيل في المقالة.
  • زجاج مجمد- نسيج إجرائي معقد للزجاج المجمد مع معلمات مضبوطة.

هناك نوعان مختلفان من هذه الظلال: أحدهما يركز على العمليات الحسابية والآخر مع تفضيل لجلب القيم من الأنسجة. ضع في اعتبارك الخيارات الرياضية المكثفة والتي تعد واعدة أكثر من حيث التطبيقات المستقبلية:

هذه اختبارات عالمية تعتمد على سرعة ALUs وسرعة التركيب ؛ فهي تركز على التوازن الكلي للرقاقة ، فضلاً عن كفاءة تنفيذ البرامج المعقدة. وأداء بطاقة رسومات AMD الجديدة في اختبار Frozen Glass لم يكن جيدًا فحسب ، بل كان ممتازًا! هذا ما تعنيه الكفاءة المتزايدة لوحدة معالجة الرسومات الجديدة. في الاختبار الأول ، تبين أن Radeon HD 7970 أسرع بشكل ملحوظ حتى من HD 6990 ثنائي الشريحة. وحتى لوحة Nvidia ثنائية الشريحة كانت متأخرة جدًا ، ناهيك عن Geforce GTX 580.

هنا ، في اختبار Parallax Mapping الثاني ، تبدو حلول Nvidia أفضل قليلاً ، وتصل GTX 580 تقريبًا إلى HD 6970. لكن HD 7970 المقدم اليوم بعيد جدًا - AMD الجديد يتقدم على أفضل لوحة Nvidia بنسبة 80٪ ، والتي تشير بوضوح إلى التأثير والحسابات الرياضية وسرعة التركيب. ومن المثير للاهتمام أن HD 5870 القديم هو أسرع مرة أخرى من HD 6970. و HD 7970 الجديد أسرع بنسبة 60٪ من سابقه ، وهو أمر لا تبرره الأرقام النظرية الجافة بوضوح. هنا ، تأثرت الكفاءة الأكبر بشكل ملحوظ للبنية العددية ، مقارنةً بـ VLIW.

ومع ذلك ، في حالة بطاقات الفيديو AMD ، يكون كل شيء صعبًا للغاية بسبب PowerTune. بعد كل شيء ، تقوم الاختبارات التركيبية "بتحميل" وحدة معالجة الرسومات بشكل كبير بالحسابات ، وقد يتجاوز استهلاك الطاقة للوحات بدعم PowerTune في المواد التركيبية الحد المعين. وبالتالي ، قد تنخفض أيضًا سرعة ساعة وحدة معالجة الرسومات ، ومعها ستظهر النتائج أقل من المتوقع. دعنا نفكر في نفس الاختبارات في تعديل مع تفضيل عينات من الزخارف إلى الحسابات الرياضية:

بالنسبة إلى كل من بطاقات الفيديو Nvidia ، أصبح الوضع أكثر حزنًا ، نظرًا لأن جميع شرائح AMD الحديثة أفضل بكثير مع سرعة التركيب ، وفي هذه الاختبارات تزيد فقط من ميزتها التي لا جدال فيها. حتى بطاقة GTX 590 ذات الرقاقة المزدوجة لا يمكنها منافسة HD 6970 أحادية الشريحة في كلا الاختبارين اللذين يركزان على التركيب ، ناهيك عن GTX 580. حسنًا ، Radeon HD 7900 اليوم هي أسرع بطاقة أحادية الشريحة ، خلفها فقط HD 6990. اتضح أن الفرق بين HD 7970 و HD 6970 يساوي 26-28٪ ، وهو ما تم شرحه جيدًا من الناحية النظرية ، نظرًا لأن الاختلاف في سرعة التركيب للجدة أعلى قليلاً.

لكن هذه كانت مهام قديمة ، مع التركيز في الغالب على التركيب ، وفي بعض الأحيان على التعبئة. بعد ذلك ، سنلقي نظرة على نتائج اختبارين آخرين لتظليل البكسل - ولكن الآن الإصدار 3.0 ، وهو أصعب اختبارات تظليل البكسل Direct3D 9 API. إنها أكثر ما تكشف من حيث ألعاب الكمبيوتر الحديثة ، والعديد منها متعدد المنصات. تختلف الاختبارات من حيث أنها تحمل بشكل كبير كلاً من وحدات ALU ووحدات النسيج ، وكلاهما من برامج التظليل معقد وطويل ، ويتضمن عددًا كبيرًا من الفروع:

  • رسم خرائط المنظر الحاد- نوع أكثر "ثقيلًا" من تقنية رسم خرائط المنظر ، موصوف أيضًا في مقالة المصطلحات الحديثة للرسومات ثلاثية الأبعاد.
  • الفراء- تظليل إجرائي يجعل الفراء.

في أصعب اختبارات DX9 من RightMark ، تعمل بطاقات الفيديو من Nvidia دائمًا بقوة كبيرة ، على عكس جميع الاختبارات السابقة في مراجعتنا. لا تقتصر هذه الاختبارات على أداء جلب النسيج ، بل تعتمد على كفاءة تنفيذ كود تظليل. وفي وقت سابق ، قام Radeon HD 6970 بتحسين موقع AMD بشكل واضح في هذا الاختبار ، مما أدى إلى زيادة الكفاءة عند الانتقال من بنية VLIW5 إلى VLIW4.

حسنًا ، شهدنا اليوم قفزة أخرى في أداء حلول الشركة ، رفعتها Radeon HD 7970 إلى مستوى بعيد المنال - تفوقت بطاقة الفيديو الجديدة أحادية الشريحة حتى على HD 6990 ثنائي الشريحة في كلا الاختبارين! تعد هذه المهام مثالاً رائعًا على كيفية تحسين أداء العمليات الحسابية المعقدة في العالم الحقيقي عند الانتقال من VLIW إلى التنفيذ القياسي.

لذلك ، في اختبارات تظليل البكسل المعقد الإصدار 3.0 ، لم تكن بطاقة الفيديو AMD المتطورة الجديدة قادرة على اللحاق بمنافسيها فحسب ، بل تفوقت عليها أيضًا بهامش كبير ، وهو ما لم يكن الحال لفترة طويلة جدًا. تعتمد السرعة في كلا اختباري PS 3.0 بشكل ضعيف على عرض النطاق الترددي للذاكرة والتركيب ، لكن الكود معقد ، والذي يتعامل معه كل من بنية Nvidia وأحدث بنية AMD العددية بشكل جيد للغاية. هذه الاختبارات هي من بين أولى الاختبارات التي نلاحظ فيها تحسنًا واضحًا في الكفاءة وأكبر فرق إيجابي بين معمارية AMD السابقة والأحدث من حيث السرعة.

لكن دعونا نعطي الأرقام حتى لا تكون بلا أساس. إن Radeon HD 7970 الجديد المقدم هو أسرع بمرتين من سابقه ، وأسرع بنسبة 60-70٪ من Geforce GTX 580 ، والذي لم نكن حتى نجرؤ على التفكير فيه مؤخرًا. بعد كل شيء ، لطالما كانت حلول Nvidia رائدة لا يمكن إنكارها في هذا الزوج من مهام الاختبار ، لكن بطاقات الفيديو المستندة إلى جزيرة كايمان كانت قادرة على الاقتراب منها ، وأخيرًا تفوقت أسرع شركة تاهيتي على منافستها.

Direct3D 10: اختبارات تظليل PS 4.0 بكسل (التركيب والتكرار)

تضمن الإصدار الثاني من RightMark3D اختبارين مألوفين لـ PS 3.0 تحت Direct3D 9 ، والتي تمت إعادة كتابتها لـ DirectX 10 ، بالإضافة إلى اختبارين جديدين آخرين. أضاف الزوج الأول القدرة على تمكين التظليل الذاتي والتظليل الفائق ، مما يزيد أيضًا من الحمل على شرائح الفيديو.

تقيس هذه الاختبارات أداء حلقات تظليل البكسل بعدد كبير من عينات النسيج (تصل إلى عدة مئات من العينات لكل بكسل في الوضع الأثقل) وحمل ALU صغير نسبيًا. بمعنى آخر ، يقيسون سرعة عمليات جلب النسيج وكفاءة التفرع في تظليل البكسل.

سيكون أول اختبار تظليل البكسل هو Fur. في أدنى الإعدادات ، يستخدم من 15 إلى 30 عينة نسيج من خريطة الارتفاع وعينتين من النسيج الرئيسي. تفاصيل التأثير - وضع "مرتفع" يزيد من عدد العينات إلى 40-80 ، وإدراج "تظليل" supersampling - ما يصل إلى 60-120 عينة ، ويتسم الوضع "عالي" مع SSAA بأقصى "خطورة" - من 160 إلى 320 عينة من خريطة الارتفاع.

دعنا أولاً نتحقق من الأوضاع بدون تمكين الاختزال الفائق ، فهي بسيطة نسبيًا ، ويجب أن تكون نسبة النتائج في الوضعين "منخفض" و "مرتفع" متماثلة تقريبًا.

يعتمد الأداء في هذا الاختبار على عدد وكفاءة TMUs ، وعلى كفاءة تنفيذ البرامج المعقدة. في المتغير الذي لا يحتوي على عينات فائقة ، يكون للتعبئة الفعالة (أداء ROP) وعرض النطاق الترددي للذاكرة تأثير إضافي على الأداء. النتائج ذات المستوى "العالي" من التفاصيل أقل بنحو مرة ونصف من النتائج مع "منخفضة" ، كما ينبغي أن تكون من الناحية النظرية ، ولكن بالنسبة للحلول الأسرع يكون الفرق أقل إلى حد ما.

في السابق ، في اختبارات تجسيد الفراء الإجرائي مع عدد كبير من عمليات جلب النسيج ، كانت حلول Nvidia أقوى بشكل ملحوظ ، ولكن بدءًا من الجيل السابق من AMD ، بدأ الاختلاف في التقلص. ماذا حدث لـ Radeon HD 7970؟ نتيجة ممتازة - أصبحت AMD الجديدة أسرع مرة أخرى من اللوحة المكونة من شريحتين للجيل السابق ، وتأخر HD 6970 أحادية الشريحة مرتين ، مما يشير بوضوح إلى زيادة كفاءة هندسة الجزر الجنوبية الجديدة. نعم ، وقد تم ترك حلول Nvidia في الخلف ، حتى أن GTX 590 ثنائي الشريحة أدنى من الطراز الأعلى Radeon HD 7970 الذي تم تقديمه اليوم.

دعونا نلقي نظرة على نتيجة نفس الاختبار ، ولكن مع تشغيل "التظليل" الفائق ، والذي يضاعف العمل أربع مرات: ربما يتغير شيء ما في مثل هذه الحالة ، وسيكون لعرض النطاق الترددي للذاكرة مع معدل التعبئة تأثير أقل:

يؤدي تمكين الاختزال الفائق إلى مضاعفة الحمل النظري أربع مرات ، ودائمًا ما تكون حلول Nvidia ضعيفة الأداء مقارنة ببطاقات رسومات AMD. أصبح الفارق الآن في كفاءة هذه المهمة أكثر وضوحًا ، وأصبح HD 7970 الجديد أسرع 2.5 مرة من HD 6970! لقد خسر Geforce GTX 580 نفس المبلغ تقريبًا مقابل المنتج الجديد.من الطبيعي تمامًا أنه حتى HD 6990 تم تركه بعيدًا ، وعزز المجلس الجديد ريادته ، ولكن ماذا ...

يقيس اختبار shader DX10 الثاني أداء تنفيذ تظليل البكسل الحلقي المعقد مع عدد كبير من عمليات جلب النسيج ويسمى Steep Parallax Mapping. في الإعدادات المنخفضة ، يستخدم من 10 إلى 50 عينة نسيج من مخطط الارتفاع وثلاث عينات من الأنسجة الرئيسية. عند تشغيل الوضع الثقيل مع التظليل الذاتي ، يتضاعف عدد العينات ، ويضاعف هذا الرقم أربع مرات. يحدد وضع الاختبار الأكثر تعقيدًا مع الاختزال الفائق والتظليل الذاتي من 80 إلى 400 قيمة نسيج ، أي ثماني مرات أكثر من الوضع البسيط. نتحقق أولاً من الخيارات البسيطة دون أخذ عينات فائقة:

يعد اختبار تظليل Direct3D 10 بكسل الثاني أكثر إثارة للاهتمام إلى حد ما من وجهة نظر عملية ، نظرًا لأن أنواع رسم خرائط المنظر تستخدم على نطاق واسع في الألعاب ، وتستخدم المتغيرات الثقيلة ، مثل رسم خرائط المنظر الحاد ، في العديد من المشاريع ، على سبيل المثال ، في ألعاب سلسلة Crysis و Lost Planet. بالإضافة إلى ذلك ، في اختبارنا ، بالإضافة إلى الاختزال الفائق ، يمكنك تشغيل التظليل الذاتي ، والذي يضاعف الحمل على شريحة الفيديو تقريبًا ، ويسمى هذا الوضع "عالي".

يشبه هذا المخطط الرسم البياني السابق دون تضمين SSAA ، لكن وضع Nvidia ضعيف أكثر من ذلك بقليل ، وكاد Radeon HD 6990 اللحاق بالنموذج المعروض اليوم. في إصدار D3D10 المحدث للاختبار بدون أخذ عينات فائقة ، يُظهر HD 7970 نتيجة ممتازة ، حيث تفوق بشكل كبير على كل من HD 6970 و GTX 580 وحتى GTX 590. أبطأ من الطراز الجديد أكثر من المرات). دعونا نرى ما الذي سيغير تضمين supersampling ، يمكن أن يتسبب في انخفاض كبير في الأداء على لوحات Nvidia.

عند تمكين الاختزال الفائق والتظليل الذاتي ، تصبح المهمة أكثر صعوبة ، حيث يؤدي التضمين المشترك لخيارين في وقت واحد إلى زيادة الحمل على البطاقات بحوالي ثماني مرات ، مما يتسبب في انخفاض كبير في الأداء. لقد تغير الاختلاف بين مؤشرات السرعة لبطاقات الفيديو المختبرة ، ولإدراج عينات فائقة التأثير ، كما في الحالة السابقة - حسنت بطاقات AMD من أدائها مقارنة بحلول Nvidia.

والآن أصبح Radeon HD 7970 هو الرائد الوحيد في المقارنة ، حيث أظهر نتائج أعلى من HD 6990. وتتخلف اللوحات الرئيسية الأقدم للشركة ذات الشريحة الواحدة كثيرًا ، جنبًا إلى جنب مع Geforce GTX 580. وفقط الخيارات ذات الشريحة المزدوجة الأكثر تكلفة من AMD و Nvidia قادرون على الأقل على الاقتراب من بطاقة الفيديو الجديدة. بشكل عام ، وفقًا لاثنين من اختبارات التظليل D3D10 ، يمكننا أن نستنتج أن بنية AMD الجديدة وممثلها على شريحة تاهيتي تتواءم تمامًا مع مهام "التظليل" ، حتى أفضل من المنافسين الأقوياء تقليديًا من Nvidia.

Direct3D 10: PS 4.0 Pixel Shader Benchmarks (الحوسبة)

يحتوي الاختباران التاليان من اختبارات تظليل البكسل على الحد الأدنى لعدد عمليات جلب النسيج لتقليل تأثير أداء TMU. يستخدمون عددًا كبيرًا من العمليات الحسابية ، ويقيسون بدقة الأداء الرياضي لرقائق الفيديو ، وسرعة تنفيذ التعليمات الحسابية في تظليل البكسل.

اختبار الرياضيات الأول هو اختبار المعادن. هذا اختبار تركيب إجرائي معقد يستخدم فقط عينتين من بيانات النسيج و 65 من تعليمات الخطيئة وجيب التمام.

عادةً ما تتوافق نتائج الاختبارات الرياضية المتطرفة مع الاختلاف في الترددات وعدد وحدات التنفيذ ، ولكن مع بعض التأثير من اختلاف كفاءة استخدامها. تتمتع جميع أبنية AMD الحديثة بميزة ساحقة على بطاقات رسومات Nvidia المنافسة في مثل هذه الحالات ، وهذا ما يفسر نتائج الاختبار ، حيث تصبح حلول AMD أكثر إنتاجية بشكل ملحوظ.

توجد الحلول وفقًا للنظرية تقريبًا ، ولكن مع بعض الاستثناءات. في الممارسة العملية ، تم اكتشاف بعض الفروق الدقيقة المرتبطة بكفاءة مختلفة. نظريًا ، يجب أن تكون GeForce GTX 580 أبطأ بأكثر من مرتين (2.4 مرة) من طراز Radeon HD 7970 الجديد ، ولكن من الناحية العملية يكون الفرق 80٪ فقط ، وهو أقل بكثير. نعم ، وبالمقارنة مع HD 6970 ، هناك أسئلة حول تحسين البنية وبرامج التشغيل الجديدة لهذا الاختبار. مع ميزة حسابية نظرية تبلغ 40٪ ، فإن لوحة AMD الجديدة أسرع بنسبة 28٪ فقط من HD 6970 السابقة ، وحتى مسافة أقل بينها وبين HD 5870 القديم جدًا المستند إلى بنية VLIW5. إما أن يكون الاختبار مناسبًا بشكل أفضل لـ VLIW (خاصة بالنسبة لـ VLIW5) ، أو يتم إلقاء اللوم على السائقين الخام.

هناك تفسير آخر - ربما تكون نتائج لوحات HD 7970 HD 6970 في هذا الاختبار متأثرة بتقنية PowerTune ، التي خفضت الترددات عند الوصول إلى حد استهلاك الطاقة. ومع ذلك ، كل هذا لا يتغير كثيرًا عند مقارنته بالمنافس ، لأنه حتى بطاقة Geforce GTX 590 ذات الرقاقة المزدوجة باهظة الثمن وصلت فقط إلى مستوى HD 6970 و HD 5870. والشريحة الواحدة GTX 580 متخلفة كثيرًا.

دعنا نفكر في الاختبار الثاني لحسابات التظليل ، والذي يسمى Fire. إنه أثقل بالنسبة لـ ALU ، ويوجد فيه نسيج واحد فقط ، وقد تمت مضاعفة عدد تعليمات الخطيئة وجيب التمام ، حتى 130. دعونا نرى ما الذي تغير مع زيادة الحمل:

نرى تقريبًا مطابقًا للرسم البياني السابق ، باستثناء الأرقام المطلقة. هذه المرة ، بقيت جميع وحدات معالجة الرسومات في نفس المواضع تقريبًا ، باستثناء أن بطاقات الفيديو المستندة إلى Cayman و Cypress قد غيرت أماكنها - والآن أصبح الطراز الأحدث أسرع قليلاً ، ولكن ليس كثيرًا. على الرغم من عدم وجود تطابق صارم مع الأرقام النظرية لأداء الذروة ، إلا أن نتائجها لا تزال قريبة من النظرية الجافة. زاد الفرق بين HD 7990 و HD 6970 قليلاً.

خلاف ذلك ، لم نجد أي شيء جديد على الرسم البياني. سرعة العرض في هذا الاختبار محدودة فقط بأداء وحدات التظليل وكفاءتها ، لذا أصبح HD 6990 ثنائي الشريحة مرة أخرى رائدًا واضحًا ، ويتبعه منتج اليوم الجديد من AMD على مسافة مناسبة. تعد كلتا لوحتا Geforce أقل شأناً حتى من الطراز القديم من عائلة Radeon HD 5800 ، ولكن هذه المرة تظل ميزة حلول AMD أصغر إلى حد ما مقارنةً بمقارنة الأرقام النظرية ، وهذا يشير مرة أخرى إلى تحسين أسوأ أو تأثير PowerTune.

Direct3D 10: اختبارات شادر الهندسية

هناك نوعان من اختبارات سرعة التظليل الهندسي في RightMark3D 2.0 ، الخيار الأول يسمى "Galaxy" ، والتقنية مشابهة لـ "النقطة العفاريت" من الإصدارات السابقة من Direct3D. يقوم بتحريك نظام الجسيمات في وحدة معالجة الرسومات (GPU) ، يقوم تظليل هندسي من كل نقطة بإنشاء أربعة رؤوس تشكل جسيمًا. يجب استخدام خوارزميات مماثلة على نطاق واسع في ألعاب DirectX 10 المستقبلية.

لا يؤثر تغيير التوازن في اختبارات التظليل الهندسي على نتيجة العرض النهائية ، فالصورة النهائية هي نفسها دائمًا تمامًا ، فقط طرق معالجة المشهد تتغير. تحدد معلمة "تحميل GS" في أي تظليل يتم إجراء الحسابات - في الرأس أو في الهندسة. عدد العمليات الحسابية هو نفسه دائمًا.

دعنا نفكر في الإصدار الأول من اختبار "المجرة" ، مع الحسابات في تظليل قمة الرأس ، لثلاثة مستويات من التعقيد الهندسي:

نسبة السرعات ذات التعقيد الهندسي المختلف للمشاهد هي نفسها تقريبًا لجميع الحلول ، يتوافق الأداء مع عدد النقاط ، مع كل خطوة يكون انخفاض معدل الإطارات في الثانية حوالي مرتين. مهمة بطاقات الفيديو الحديثة ليست صعبة للغاية ، والأداء مقيد بشكل أساسي بسرعة المعالجة الهندسية ، ولكن أيضًا من خلال عرض النطاق الترددي / معدل الذاكرة (ضمن حلول شركة مصنعة واحدة).

في هذا الاختبار ، كان من المفترض أن تظهر قدرات المعالجة الهندسية المحسنة للجزر الجنوبية ، ولذا ظهرت. تعد بطاقة رسومات AMD الجديدة بالفعل أسرع بكثير في الحسابات الهندسية مقارنة بجميع الحلول السابقة من الشركة. على الرغم من أن AMD أعطت ما يصل إلى 4 أضعاف أرقام النمو ، فقد زاد الأداء الهندسي في هذا الاختبار بنحو 1.5-2 مرة. نتيجة لذلك ، أصبحت بطاقة الفيديو أحادية الشريحة على نفس مستوى طراز Radeon HD 6990 ثنائي الشريحة تقريبًا في الجيل السابق من وحدة معالجة الرسومات.

أدى هذا التحسن الكبير إلى حقيقة أن تاهيتي قد استوعبت تقريبًا بطاقة الرسومات المتطورة من Nvidia ، على الرغم من أنها يجب أن تكون أكثر كفاءة في أداء التظليل الهندسي في بعض الظروف. في السابق ، كانت بطاقات رسومات Nvidia أسرع بنحو ضعف سرعة بطاقات المنافسين المماثلة ، ولكن الآن لا يوجد فرق على الإطلاق. دعونا نرى كيف يتغير الموقف عند نقل جزء من العمليات الحسابية إلى التظليل الهندسي:

عندما تغير الحمل في هذا الاختبار ، ظلت الأرقام دون تغيير تقريبًا بالنسبة إلى حلول Nvidia ومعظم لوحات AMD. فقط بطاقة الفيديو الجديدة من عائلة HD 7900 في هذا الاختبار استجابت بشكل سيئ للتغيير في معلمة تحميل GS ، المسؤولة عن نقل جزء من الحسابات إلى التظليل الهندسي. لذلك ، أظهرت اللوحة نتيجة أعلى قليلاً مما كانت عليه في الرسم التخطيطي السابق. دعونا نرى ما سيتغير في الاختبار التالي ، والذي يفترض وجود عبء ثقيل على التظليل الهندسي.

"Hyperlight" هو الاختبار الثاني للتظليل الهندسي ، حيث يوضح استخدام عدة تقنيات في وقت واحد: التثبيت ، إخراج التدفق ، تحميل المخزن المؤقت. يستخدم إنشاء الهندسة الديناميكية من خلال الرسم على مخازن مؤقتة ، بالإضافة إلى ميزة جديدة في Direct3D 10 - إخراج الدفق. يولد التظليل الأول اتجاه الأشعة وسرعة واتجاه نموها ، ويتم وضع هذه البيانات في مخزن مؤقت يستخدمه التظليل الثاني للعرض. لكل نقطة في الحزمة ، 14 رأسًا مبنية في دائرة ، يصل مجموعها إلى مليون نقطة إخراج.

يتم استخدام نوع جديد من برنامج تظليل لتوليد "أشعة" ، ومع ضبط معلمة "تحميل GS" على "ثقيل" - أيضًا لرسمها. أي ، في الوضع "المتوازن" ، يتم استخدام التظليل الهندسي فقط لإنشاء الأشعة و "نموها" ، ويتم تنفيذ الإخراج باستخدام "التثبيت" ، وفي الوضع "الثقيل" ، يشارك التظليل الهندسي أيضًا في الإخراج . لنلقِ نظرة على الوضع السهل أولاً:

النتائج النسبية في أوضاع مختلفة تتوافق تقريبًا مع تغييرات الحمل: في جميع الحالات ، مقاييس الأداء جيدة وقريبة من المعلمات النظرية ، وفقًا لذلك يجب أن يكون كل مستوى تعداد مضلع أقل من الضعف.

في هذا الاختبار ، يجب أن تكون سرعة العرض محدودة بالأداء الهندسي ، كما أن الهيكل الجديد من AMD يعمل بشكل جيد ، بل إنه يتفوق قليلاً على منافسه في مواجهة Geforce GTX 580! أظهرت كلتا اللوحتين ذات الرقاقة المزدوجة نتائج غير صحيحة هنا ، لذا لن نتمكن من مقارنتها بهما. لكن HD 7970 أسرع بنسبة 40-50٪ من سابقه ، HD 6970 ، والذي يرجع بوضوح إلى التغييرات المعمارية في وحدة معالجة الرسومات. النتائج الممتازة للخريطة على تاهيتي تشهد بوضوح على التحسينات التي تم إجراؤها في وحدات معالجة البيانات الهندسية في الشريحة الجديدة.

يجب أن تتغير الأرقام كثيرًا في الرسم التخطيطي التالي ، في اختبار مع استخدام أكثر نشاطًا للتظليل الهندسي. سيكون من المثير للاهتمام أيضًا مقارنة النتائج التي تم الحصول عليها في وضعي "متوازن" و "ثقيل" مع بعضها البعض.

ولكن هنا فشل Radeon HD 7970 في تحقيق رقم قياسي ، بعد كل شيء ، فإن الفرق بين رقائق AMD مع خط أنابيب رسومات تقليدي (بما في ذلك كايمان مع تاهيتي مع اثنين من النقطيات) والرقائق مع بنية Fermi ، والتي لديها معالجة هندسية متوازية ، يمكن ملاحظته بوضوح . ونتائج Geforce GTX 580 ، المبنية على شريحة GF110 ، جيدة جدًا لدرجة أنها تجاوزت أفضل حلول AMD (وهذا هو النموذج المعلن اليوم) بنسبة 35-40٪.

على الرغم من أن قدرات شريحة AMD الجديدة المتطورة من حيث المعالجة الهندسية وسرعة تنفيذ التظليل الهندسي قد نمت بوضوح مقارنة ببطاقات الفيديو السابقة للشركة ، فإن الحل الأول القائم على شريحة Tahiti يظهر نتائج أعلى بنسبة 22-28٪ في هذه الاختبارات من الحلول القائمة على جزر كايمان. على الأرجح ، قرر مهندسو AMD أن مثل هذا التحسين لوحدات معالجة المثلثات والهندسة سيكون كافيًا.

Direct3D 10: معدل إحضار النسيج من تظليل الرأس

تقيس اختبارات "Vertex Texture Fetch" سرعة عدد كبير من عمليات جلب النسيج من تظليل قمة الرأس. الاختبارات متشابهة من حيث الجوهر ، لذا يجب أن تكون النسبة بين نتائج البطاقات في اختبارات "Earth" و "Waves" هي نفسها تقريبًا. يستخدم كلا الاختبارين تخطيط الإزاحة بناءً على بيانات أخذ عينات النسيج ، والفرق الوحيد المهم هو أن اختبار "الموجات" يستخدم قفزات شرطية ، بينما لا يستخدم اختبار "الأرض".

ضع في اعتبارك الاختبار الأول "Earth" ، أولاً في وضع "تفاصيل التأثير منخفض":

أظهرت الدراسات السابقة أن العديد من الأشياء تؤثر على نتائج هذا الاختبار في وقت واحد: سرعة التركيب وعرض النطاق الترددي للذاكرة. وغالبًا ما تكون نتائج بطاقات الفيديو محدودة بنوع من العوائق - ما عليك سوى إلقاء نظرة على مقارنة بطاقة GTX 590 ثنائية الشريحة والتناظرية أحادية الشريحة - فلا يوجد فرق بينهما تقريبًا. على الرغم من أن HD 6990 أسرع مرتين من HD 6970.

وأظهرت بطاقة AMD الجديدة من عائلة Radeon HD 7970 نتائج جيدة للغاية ، حيث اقتربت من اللحاق بـ HD 6990 الرائد. أما بالنسبة للمنافسين أحادي الشريحة ، فهي الأفضل في جميع الأوضاع الثلاثة. تراوحت الميزة على HD 6970 من 25٪ إلى 75٪ ، اعتمادًا على الوضع. لنلقِ نظرة على الأداء في نفس الاختبار مع زيادة عدد عمليات جلب النسيج:

لكن هذه المرة ، تغير الوضع النسبي للبطاقات على الرسم التخطيطي بشكل ملحوظ ، وهذا ينطبق بشكل خاص على الوضع الصعب. مع وجود عدد صغير من المضلعات ، فإن سرعة العرض في هذا الاختبار تعتمد على عرض النطاق الترددي للذاكرة ، ولهذا السبب كانت لوحات AMD قوية جدًا في الرسم التخطيطي السابق.

ولكن في الأوضاع الثقيلة ، تقلص الفرق بين بطاقة Nvidia أحادية الشريحة وبطاقة AMD الجديدة ، ويتنافسان مع بعضهما البعض في معركة ضيقة إلى حد ما. تتفوق بطاقة الفيديو الأقدم ثنائية الشريحة لعائلة Radeon HD 6900 على جميع الحلول الأخرى وهي الأفضل بالمقارنة ، على الرغم من أن Geforce GTX 590 تقترب منها في الوضع الثقيل.يتفوق HD 7970 الجديد ذو الشريحة الواحدة على سابقه مرة أخرى بما يصل إلى 70 ٪ ، مما قد يشير إلى تأثير قوي لعرض النطاق الترددي للذاكرة.

دعنا نفكر في نتائج الاختبار الثاني لجلب النسيج من تظليل قمة الرأس. يحتوي اختبار الموجات على عدد أقل من العينات ، ولكنه يستخدم قفزات شرطية. يصل عدد عينات النسيج ثنائي الخطوط في هذه الحالة إلى 14 ("تفاصيل التأثير منخفض") أو يصل إلى 24 ("تفاصيل التأثير مرتفع") لكل رأس. يتغير تعقيد الهندسة بشكل مشابه للاختبار السابق.

النتائج في اختبار بنية الرأس "الموجات" الثاني مختلفة تمامًا عما رأيناه في الرسوم البيانية السابقة. في هذا الاختبار ، تُظهر بطاقات الفيديو AMD و Nvidia ، باستثناء HD 6990 و HD 7970 ، نتائج قريبة جدًا ، والتي يمكن أن تُعزى مرة أخرى إلى الحد من عرض النطاق الترددي لذاكرة الفيديو ، نظرًا لأن هذا المؤشر قريب من جميع بطاقات الفيديو المقدمة.

لكن النموذج الجديد من عائلة الجزر الجنوبية نجح في التميز ، في ظروف المقارنة الصعبة ، كاد أن يلحق بشريحة HD 6990 ثنائية الشريحة ، والتي أصبحت الأفضل بين جميع بطاقات الفيديو. كان الفرق بين البطاقات القائمة على وحدات معالجة الرسومات كايمان وتاهيتي مرة أخرى 25-70 ٪ لصالح الحل الأحدث. ضع في اعتبارك الإصدار الثاني من نفس الاختبار:

ثم كانت هناك تغييرات مشابهة لتلك التي رأيناها سابقًا - بطاقات فيديو Nvidia "تراجعت" فقط في وضع الإضاءة ، ومعظم حلول AMD - دفعة واحدة. ومع ذلك ، فإن هذا لم يسمح لمجالس إدارة شركة كاليفورنيا باللحاق بالمنتج الجديد لعائلة Radeon 7900. والذي ، بالمناسبة ، تفوق على الجميع في الوضعين المتوسط ​​والثقيل ، مما أدى إلى الاستسلام للشريحة المزدوجة HD 6990 مرة واحدة فقط.

في وضع المضلع المنخفض ، لا يكون الاختلاف بين الحلول كبيرًا جدًا ، ولكن في الوضعين المتوسط ​​والثقيل ، تكون حلول AMD القديمة أقل شأناً ، تليها لوحات Nvidia (تكون الشريحة ذات الشريحتين أسرع قليلاً فقط من أحادية- رقاقة GTX 580) و HD 6990 و HD 7970. أعلنت لوحة عائلة HD 7900 اليوم في اختبارات تحديد قمة الرأس ، أنها أثبتت أنها ممتازة ، متفوقة على بطاقات الفيديو المنافسة من Nvidia وسابقاتها من نفس الشركة المصنعة.

برنامج 3DMark Vantage: اختبارات الميزات

كما هو الحال دائمًا ، يمكن أن تظهر لنا الاختبارات التركيبية من حزمة 3DMark Vantage شيئًا فقدناه سابقًا. اختبارات الميزات في مجموعة الاختبار هذه تدعم DirectX 10 وهي مثيرة للاهتمام من حيث أنها تختلف عن اختباراتنا. عند تحليل نتائج بطاقة الفيديو Radeon HD 7970 الجديدة في هذه الحزمة ، سنتمكن من استخلاص بعض الاستنتاجات الجديدة والمفيدة التي استعصت علينا في اختبارات عائلة RightMark.

اختبار الميزة 1: ملء الملمس

الاختبار الأول هو اختبار سرعة جلب النسيج. يستخدم ملء مستطيل بقيم مقروءة من نسيج صغير باستخدام إحداثيات نسيج متعددة تغير كل إطار.

على الرغم من أن اختبار Futuremark لا يزال لا يُظهر المستوى الممكن نظريًا لسرعة جلب النسيج ، إلا أن كفاءة كل من بطاقات الفيديو AMD و Nvidia لا تزال أعلى بشكل ملحوظ منها في اختبارنا من RightMark. لذلك ، في اختبار النسيج هذا ، يتم الحصول على نسبة نتائج مختلفة قليلاً ، وهي أقرب إلى الحقيقة.

تُظهر بطاقة الفيديو الأولى من عائلة AMD الجديدة نتيجة قريبة من المعلمة النظرية المقابلة ، وتتواءم مع العمل بشكل أكثر كفاءة من الجيل السابق. يتفوق Radeon HD 7970 على HD 6970 بأكثر من 50٪ ، على الرغم من أن الفرق النظري هو 40٪ فقط. على الأرجح ، يتم استخدام وحدات نسيج تاهيتي بكفاءة أكبر بسبب التحسينات في الذاكرة ونظام التخزين المؤقت ، مما أدى إلى زيادة النتيجة.

بالطبع ، لم يرق النموذج الجديد ذو الشريحة الواحدة إلى المستوى الرائد - HD 6990 ثنائي الشريحة ، لكن هذا لم يكن متوقعًا. ومع ذلك ، من الواضح أن أداء الملمس لشريحة رسومات تاهيتي قد زاد بشكل ملحوظ مقارنةً بكايمان. حسنًا ، خسر GTX 580 للمنتج الجديد من حيث سرعة التركيب بقدر 2.3 مرة. حتى بطاقة Nvidia ذات وحدة معالجة الرسومات المزدوجة تتوافق فقط مع HD 6970.

اختبار الميزة 2: تعبئة اللون

هذا هو اختبار معدل الملء. يستخدم تظليل بكسل بسيط للغاية لا يحد من الأداء. تتم كتابة قيمة اللون المحرف إلى مخزن مؤقت خارج الشاشة (هدف التجسيد) باستخدام مزج ألفا. إنه يستخدم مخزنًا مؤقتًا خارج الشاشة FP16 16 بت ، وهو الأكثر استخدامًا في الألعاب التي تستخدم عرض HDR ، لذا فإن هذا الاختبار يأتي في الوقت المناسب تمامًا.

يختلف الوضع في اختبار أداء وحدة شرطة عمان السلطانية اختلافًا كبيرًا عن اختبار التركيب. توضح الأرقام الخاصة بهذا الاختبار الفرعي من برنامج 3DMark Vantage أداء وحدات شرطة عمان السلطانية ، ولكن مع تأثير مقدار عرض النطاق الترددي لذاكرة الفيديو (ما يسمى ب "التعبئة الفعالة"). وهنا يظهر الطراز الجديد HD 7970 نتيجة ممتازة ، متخلفًا فقط عن أفضل بطاقتي فيديو AMD و Nvidia من الأجيال السابقة ، والتي تحتوي على وحدتي معالجة رسومات.

ولكن ماذا عن كفاءة استخدام كتل ROP ، التي تفاخرت بها AMD؟ في الواقع ، 32 فقط من ROPs في شريحة تاهيتي الجديدة لا تحد من سرعة العرض على الإطلاق ، حتى في الاختبار المتخصص. ونلاحظ كفاءة ROP أعلى قليلاً ومعدل تعبئة أسرع في بطاقة رسومات AMD الجديدة مقارنة بالموديلات القديمة. الفرق بين HD 7970 و HD 6970 هو أكثر من 50٪ ، مما يشير بوضوح إلى تأثير أكبر لعرض النطاق الترددي ، بدلاً من الأداء الخالص لوحدات شرطة عمان السلطانية.

بالنسبة للمقارنة مع Nvidia ، هنا مرة أخرى الفرق في السرعة (35٪) يتوافق مع الاختلاف النظري في عرض النطاق الترددي للذاكرة (36٪) ، وليس السرعة الخالصة لكتل ​​ROP. اتضح أن 32 من هذه الكتل في كايمان كانت ببساطة غير ضرورية ولم يتم استخدام قدراتها بالكامل.

اختبار الميزة 3: رسم خرائط انسداد المنظر

أحد أكثر اختبارات الميزات إثارة للاهتمام ، حيث أن هذه التقنية مستخدمة بالفعل في الألعاب. يرسم رباعي الأضلاع (بتعبير أدق ، مثلثين) باستخدام تقنية Parallax Occlusion Mapping الخاصة ، والتي تحاكي الهندسة المعقدة. بدلاً من ذلك ، يتم استخدام عمليات تتبع أشعة كثيفة الاستخدام للموارد وخريطة عمق عالية الدقة. هذا السطح مظلل أيضًا باستخدام خوارزمية شتراوس الثقيلة. هذا اختبار لتظليل بكسل شديد التعقيد وثقيل لشريحة فيديو ، يحتوي على العديد من عمليات جلب النسيج أثناء تتبع الشعاع ، والتفرع الديناميكي ، وحسابات إضاءة شتراوس المعقدة.

يختلف هذا الاختبار عن الاختبارات الأخرى المماثلة من حيث أن النتائج فيه لا تعتمد فقط على سرعة الحسابات الرياضية ، أو كفاءة تنفيذ الفرع ، أو سرعة عمليات جلب النسيج ، ولكن على القليل من كل شيء. لتحقيق سرعة عالية ، فإن توازن كتل GPU مهم هنا ، وله أيضًا تأثير ملحوظ جدًا على سرعة وكفاءة التفرع في التظليل.

تتشابه النتائج المقارنة لبطاقات فيديو AMD في الرسم التخطيطي بشكل عام مع ما رأيناه في اختبار أداء الملمس من برنامج 3DMark Vantage ، باستثناء أن Radeon HD 7970 الجديد أكثر كفاءة في هذه المهمة أيضًا ، لأنه كاد أن يلحق به مرة أخرى ثنائية GPU HD 6990 - نتيجة ممتازة! حصلت لوحات Nvidia على بعض التعزيز في الأداء في هذه الحالة ، مما يؤكد الاستنتاج بأن أداء النسيج لا يؤثر فقط على نتائج هذا الاختبار.

لذلك ، يعمل نموذج AMD الجديد بشكل جيد ، حيث ينتج عنه القليل جدًا من اللوحة المكونة من شريحتين على أساس اثنين من جزر كايمان. تفوقت على سابقتها أحادية الشريحة بنسبة 66٪. لا يتوافق هذا الرقم مع التسارع من كايمان إلى تاهيتي في أي من المعلمات النظرية وقد يشير إلى تحسن في كفاءة تنفيذ حسابات التفريع المعقدة. حتى النتيجة الجيدة التي تم اعتبارها سابقًا لـ Geforce GTX 580 ضعف ضعف تلك الخاصة بـ AMD الجديدة. في الواقع ، تبين أن جميع بطاقات الفيديو من هذه الشركة المصنعة كانت أسرع من الطراز الأعلى لخط Geforce GTX 500 المستند إلى شريحة واحدة.

اختبار الميزة 4: قماش GPU

الاختبار مثير للاهتمام لأنه يحسب التفاعلات الفيزيائية (تقليد القماش) باستخدام شريحة فيديو. يتم استخدام محاكاة Vertex ، باستخدام العملية المشتركة بين تظليل الرأس والهندسة ، مع عدة تمريرات. استخدم الدفق الخارج لنقل الرؤوس من ممر محاكاة إلى آخر. وبالتالي ، يتم اختبار أداء تنفيذ التظليل الرأسي والهندسي وسرعة التدفق الخارج.

تعتمد سرعة العرض في هذا الاختبار أيضًا على العديد من المعلمات الأخرى. العوامل الرئيسية هنا هي أداء المعالجة الهندسية وكفاءة التظليل الهندسي. لذلك فمن المنطقي تمامًا أن تشعر بطاقات الفيديو Nvidia بشعور رائع في هذا التطبيق ، متقدمًا على منافسيها.

وحتى Radeon HD 7970 الذي تم تقديمه اليوم ، على الرغم من التحسن الواضح في الأداء مقارنةً بـ HD 6970 ، لم يستطع التنافس هنا مع شريحة واحدة Geforce GTX 580 وكان أدنى منه قليلاً. هذا أحد اختبارات الهندسة التي تُظهر ميزة بطاقات الفيديو HD 6900 الحديثة على الخطوط السابقة ، حيث زادت من سرعة المعالجة الهندسية والتظليل الهندسي. حسّن Radeon HD 7970 النتيجة بنسبة 35٪ أخرى ، لكن هذا لم يكن كافيًا - تستمر حلول Nvidia في الريادة في هذا الاختبار. على الرغم من أننا نلاحظ أن النموذج الجديد لا يزال يحسن بشكل كبير موقع AMD في الاختبارات الهندسية.

اختبار الميزة 5: جزيئات وحدة معالجة الرسومات

اختبار للمحاكاة الفيزيائية للتأثيرات بناءً على أنظمة الجسيمات المحسوبة باستخدام شريحة فيديو. تُستخدم محاكاة الرأس أيضًا ، حيث يمثل كل رأس جسيمًا واحدًا. يستخدم Stream out للغرض نفسه كما في الاختبار السابق. تم حساب مئات الآلاف من الجسيمات ، وكلها متحركة بشكل منفصل ، كما تم حساب تصادمها مع خريطة الارتفاع.

على غرار أحد اختبارات RightMark3D 2.0 الخاصة بنا ، يتم رسم الجسيمات باستخدام تظليل هندسي يُنشئ أربعة رؤوس من كل نقطة لتشكيل الجسيم. لكن الاختبار يحمّل كتل تظليل مع حسابات الرأس الأهم من ذلك كله ، يتم أيضًا اختبار التدفق الخارج.

نتائج الاختبار التالي من حزمة برنامج 3DMark Vantage مشابهة لتلك التي رأيناها في الرسم التخطيطي السابق ، لكن سرعة المعالجة الهندسية فيها أصبحت أكثر أهمية. وهكذا تقدمت بطاقات الفيديو Nvidia للأمام أكثر ، تاركة وراءها حتى الوحش ثنائي الشريحة - Radeon HD 6990. للأسف ، إنها حقيقة - حتى GTX 580 تفوقت على جميع لوحات AMD ، بما في ذلك الطراز الجديد المعتمد على وحدة معالجة الرسومات تاهيتي.

للأسف ، على الرغم من أن اللوحة المستندة إلى الشريحة الجديدة أظهرت نتيجة أقوى مقارنة بالحلول القائمة على Cayman و Cypress ، إلا أن Geforce تخلفت عن الركب. كان الفرق بين HD 7970 و HD 6970 في هذه المقارنة يزيد قليلاً عن 30٪ ، مما يشير إلى تأثير واضح لسرعة ALU. في الاختبارات التركيبية لبرنامج 3DMark Vantage لمحاكاة القماش والجسيمات ، والتي تستخدم التظليل الهندسي بنشاط ، تستمر حلول AMD في التأخر عن بطاقات الفيديو المنافسة مع سرعة معالجة هندسية عالية جدًا.

اختبار الميزة 6: ضوضاء بيرلين

آخر اختبار للميزات لحزمة Vantage هو اختبار رياضي مكثف لشريحة الفيديو ، حيث يحسب عدة أوكتافات من خوارزمية ضوضاء Perlin في تظليل البكسل. تستخدم كل قناة ألوان وظيفة الضوضاء الخاصة بها لزيادة الحمل على شريحة الفيديو. ضوضاء بيرلين هي خوارزمية قياسية تستخدم غالبًا في التركيب الإجرائي وتستخدم الكثير من الرياضيات.

ومن المثير للاهتمام ، أنه في الاختبار الرياضي من حزمة Futuremark ، والذي يُظهر أعلى أداء لشرائح الفيديو في المهام المحددة ، رأينا صورة مختلفة تمامًا مقارنة بالاختبارات المماثلة من حزمة الاختبار الخاصة بنا. يتوافق أداء الحلول الموضحة في الرسم البياني تقريبًا جدًا مع ما يجب الحصول عليه وفقًا للنظرية ، ويختلف أيضًا عما رأيناه سابقًا في الاختبارات الرياضية من حزمة RightMark 2.0. على سبيل المثال ، من الواضح أن بطاقة الفيديو الجديدة في هذا الاختبار اقتربت كثيرًا من السرعة النظرية ، مقارنة ببطاقات GPU ذات بنية VLIW.

دعونا نلقي نظرة على الأسباب. في وقت من الأوقات ، لم يعزز HD 6970 ذروة أداء الرياضيات في HD 5870 ، لكن هذا وحده لا يفسر تأخر كايمان. يمكن أن يكون السبب هو انخفاض كفاءة بنية VLIW4 ونظام إدارة الطاقة الذكية ، والذي "قضى" على تردد الساعة وأداء الحلول عند الوصول إلى عتبة استهلاك الطاقة المحددة.

لكنها لم تؤثر على HD 7970. على الأرجح ، السبب هو فقط في البنية العددية للرقاقة الجديدة. لأن نسبة أرقام الأداء في الاختبار والنظرية تشير بوضوح إلى ذلك. من الناحية النظرية ، تمتلك HD 6970 0.7 من القوة الرياضية للبطاقة الجديدة ، ولكن في هذا الاختبار تبين أنها 0.56 فقط. تم الحصول على نفس الاختلاف تقريبًا للوحات AMD الأخرى. ولكن عند مقارنة GTX 580 و HD 7970 ، اللذين لهما معماريات عددية ، فإن النسبة النظرية هي 0.42 (تاهيتي أسرع مرتين) ، والنسبة العملية هي أيضًا 0.42. أي أن كفاءة استخدام ALUs المتاحة لهذه الرقائق من جهات تصنيع مختلفة هي نفسها تمامًا! على عكس جزر كايمان والسرو اللتين تتمتعان بهندسة معمارية VLIW.

على أي حال ، يتفوق مجلس AMD الجديد على كل من منافسيه من Nvidia بهامش ضخم ، ومن الواضح أن Nvidia بحاجة إلى زيادة قوتها الرياضية بشكل حاد في الحلول المستقبلية. في غضون ذلك ، تظهر الصورة المعتادة - تظهر بطاقات فيديو Geforce نتائج سيئة في الحالات التي يتم فيها تنفيذ الرياضيات البسيطة والمكثفة بشكل أسرع على بطاقات Radeon. ولم يؤد خروج الجزيرة الجنوبية إلا إلى تفاقم الوضع.

Direct3D 11: حساب تظليل

لاختبار حلول AMD الجديدة في التطبيقات التي تستخدم ميزات DirectX 11 الجديدة مثل التغطية بالفسيفساء وتظليل الحوسبة ، استخدمنا عينات من حزم SDK وعروض توضيحية من Microsoft و Nvidia و AMD.

أولاً ، دعنا نلقي نظرة على الاختبارات التي تستخدم حساب التظليل. مظهرهم هو أحد أهم الابتكارات في أحدث إصدارات DX API ، وهم مستخدمون بالفعل في الألعاب الحديثة لأداء مهام مختلفة: ما بعد المعالجة ، والمحاكاة ، وما إلى ذلك. يُظهر الاختبار الأول مثالاً على عرض HDR مع تعيين النغمة من DirectX SDK ، مع المعالجة اللاحقة ، والتي تستخدم وحدات البكسل وحساب التظليل.

قد لا يكون هذا أفضل مثال على التظليل الحسابي ، لكنه يظهر الفرق في الأداء بوضوح تام. لا يوجد فرق تقريبًا بين الحسابات في الحوسبة وتظليل البكسل لبطاقات فيديو AMD ، وفي Nvidia يكون البكسل أسرع قليلاً.

تبين أن AMD Radeon HD 6970 أسرع من سابقتها HD 5870 ، وأداءها على مستوى Geforce GTX 580 ، لكن HD 7970 المقدم اليوم يتفوق عليهم جميعًا ويصبح الرائد (قررنا عدم استخدام شريحتين بطاقات الفيديو في هذه التركيبية). تم أخذ GTX 560 Ti بشكل أساسي لاختبارات الهندسة ، وأيضًا لتقييم الفرق بين الحلول من شرائح الأسعار المختلفة.

لذا ، فإن اللوحة المعلنة القائمة على شريحة تاهيتي الجديدة تتقدم بنسبة 40٪ على التناظرية القائمة على كايمان ، وهو ما يتوافق تمامًا مع الاختلاف في الأداء النظري لوحدات الحوسبة. في المقابل ، فإن الميزة على GTX 580 المنافسة هي 30-40٪ (اعتمادًا على نوع برنامج shader) ، وهو أقل بشكل واضح من الممكن نظريًا. تتخلف GTX 560 Ti كثيرًا ، أكثر من الضعف.

تم أخذ اختبار تظليل الحوسبة الثاني أيضًا من Microsoft DirectX SDK ويظهر مشكلة حسابية للجاذبية N-body (N-body) ، وهي محاكاة لنظام جسيم ديناميكي يخضع لقوى فيزيائية مثل الجاذبية.

النتائج في هذا الاختبار غير عادية للغاية ، بالنسبة لحلول AMD القديمة فهي مشابهة للأرقام من اختبار 3DMark Vantage الرياضي - تبين أن Cypress أسرع من كايمان. على الرغم من التفوق النظري الكبير في أرقام الذروة ، فإن أسرع بطاقة رسومات AMD - Radeon HD 7970 الجديد الذي تم طرحه اليوم - تتقدم بنسبة 21٪ فقط عن أفضل حلول Nvidia. وحتى GTX 560 Ti ليس بعيدًا عن الركب. تُظهر الموديلات القديمة لعائلات HD 6900 و HD 5800 نتائج قريبة من تلك الموجودة في Geforce GTX 580.

الأهم من ذلك كله ، نحن مهتمون بالفرق بين نتائج القرارات المتعلقة بجزيرة كايمان وتاهيتي ، وفي هذه الحالة نرى ميزة للنموذج الجديد ، تساوي 36٪. هذا أقل قليلاً من الاختلاف النظري بين هذه النماذج ، لكنه لا يزال قريبًا منه. لماذا لم تبرز كلتا البطاقتين على خلفية HD 5870 القديمة جدًا؟ ربما يكون السبب هو التردد المنخفض لـ PowerTune أو الافتقار إلى تحسين برامج التشغيل للبنية الجديدة. دعونا نرى ما إذا كانت تاهيتي ستُظهر أخيرًا تسارعًا كبيرًا في اختبارات التغطية بالفسيفساء.

Direct3D 11: أداء التغطية بالفسيفساء

تظليل الحساب مهم جدًا ، ولكن الابتكار الرئيسي في Direct3D 11 لا يزال بالفسيفساء للأجهزة. لقد نظرنا في الأمر بتفصيل كبير في مقالتنا النظرية حول Nvidia GF100. تم استخدام Tessellation في ألعاب DX11 لفترة طويلة ، مثل STALKER: Call of Pripyat و DiRT 2 و Aliens vs Predator و Metro 2033 و Civilization V و Crysis 2 و Battlefield 3 وغيرها. يستخدم البعض منهم التغطية بالفسيفساء لنماذج الشخصيات ، والبعض الآخر لمحاكاة سطح مائي أو منظر طبيعي واقعي.

هناك العديد من المخططات المختلفة لتقسيم الرسوم الأولية (التغطية بالفسيفساء). على سبيل المثال ، التغطية بالفسيفساء phong ، مثلثات PN ، تقسيم Catmull-Clark. لذلك ، يتم استخدام مخطط تبليط المثلثات PN في STALKER: Call of Pripyat ، وفي Metro 2033 - Phong بالفسيفساء. هذه الأساليب سريعة نسبيًا وسهلة التنفيذ في عملية تطوير اللعبة والمحركات الحالية ، ولهذا أصبحت شائعة.

سيكون أول اختبار للفسيفساء هو مثال تفاصيل التغطية بالفسيفساء من ATI Radeon SDK. إنه لا ينفذ التغطية بالفسيفساء فحسب ، بل أيضًا طريقتين مختلفتين لمعالجة البكسل بالبكسل: تراكب بسيط للخرائط العادية ورسم خرائط انسداد اختلاف المنظر. حسنًا ، دعنا نقارن حلول DX11 من AMD و Nvidia في ظروف مختلفة:

ومن المثير للاهتمام ، أن رسم خرائط انسداد المنظر (الأشرطة الوسطى في الرسم التخطيطي) على بطاقات الفيديو من كلا المصنّعين أقل كفاءة بكثير من التغطية بالفسيفساء (الأعمدة السفلية) ، والفسيفساء المعتدلة لا تعطي انخفاضًا كبيرًا في الأداء - قارن بين القضبان العلوية والسفلية. أي أن محاكاة الهندسة عالية الجودة باستخدام حسابات البكسل توفر أداءً أقل حتى من الهندسة المكسوة بالفسيفساء مع تعيين الإزاحة.

بالنسبة لأداء بطاقات الفيديو بالنسبة لبعضها البعض ، فلنلقِ نظرة أولاً على تقنيات البكسل بالبكسل. في اختبار رسم الخرائط البسيط ، تتصدر بطاقة الرسومات الجديدة من AMD الطريق ، متفوقة على كل من HD 6970 و GTX 580 بنسبة 27٪ و 36٪ على التوالي. ولكن في الاختبار الفرعي للحسابات المعقدة لكل بكسل على حدة (تذكر اختبارات رسم خرائط المنظر أعلاه) ، قبل إصدار كايمان ، كانت بطاقات الفيديو Geforce أسرع من حلول AMD ، وكذلك مع تمكين التغطية بالفسيفساء. مع إصدار Radeon HD 6970 ، تبين أن اختبار التغطية بالفسيفساء كان أسرع بشكل ملحوظ من HD 5870 ، وفي الاختبار باستخدام عامل تقسيم مثلث صغير ، تفوقت HD 6970 حتى على GTX 580.

الأمر الأكثر إثارة للاهتمام هو ما رأيناه على الرسم البياني المسمى Radeon HD 7970. التغطية بالفسيفساء هنا ليست معقدة للغاية ، لذا لم تتفوق بطاقة الفيديو الجديدة على النموذج السابق كثيرًا - حوالي 30٪. شيء آخر هو اختبار POM. في هذا الاختبار الفرعي ، مزق HD 7970 الجديد جميع الحلول الأخرى لأجزاء صغيرة. الميزة على HD 6970 و GTX 580 أقل بقليل من الضعف. نتيجة أخرى رائعة في اختبار رسم خرائط المنظر ، والذي يتحدث عن الكفاءة العالية لتنفيذ برامج تظليل معقدة.

سيكون اختبار أداء التغطية بالفسيفساء الثاني مثالاً آخر للمطورين ثلاثي الأبعاد من ATI Radeon SDK - PN Triangles. في الواقع ، يتم تضمين كلا المثالين أيضًا في DX SDK ، لذلك نحن على يقين من أن مطوري الألعاب ينشئون الكود الخاص بهم بناءً على ذلك. اختبرنا هذا المثال بعامل فسيفساء مختلف لمعرفة مدى تأثيره على الأداء العام.

لكن في هذا المثال ، نرى بالفعل مقارنة كاملة للقوة الهندسية لحلول AMD و Nvidia في ظروف مختلفة. واتضح أنه مثير جدًا للاهتمام ، في رأينا. تبرز بنية رسومات Fermi بقوة ، وهي شريحة معمارية تاهيتي الجديدة من AMD. بالطبع ، هذا اختبار اصطناعي بحت ومن غير المرجح استخدام عوامل الانقسام الشديد في الألعاب في المستقبل القريب ، لا سيما بالنظر إلى إجمالي المنصات المتعددة. نحن مهتمون بالإمكانيات المعمارية ، ولهذا نحتاج إلى "مواد تركيبية".

إذا كان Radeon HD 7970 الجديد يتنافس بنجاح في ظروف الإضاءة مع Geforce GTX 580 ، متفوقًا عليه في أخف الأوضاع وعلى قدم المساواة في الوضع الثالث ، ولكن في أصعب الظروف مع وجود عدد كبير جدًا من المثلثات مع بطاقة الفيديو Nvidia Geforce استنادًا إلى شريحة GF110 ، من المستحيل التنافس - في المهام القصوى بالفسيفساء ، يكون أسرع بكثير حتى من رقائق AMD المحسّنة بشكل متكرر. على الرغم من أن وحدة معالجة الرسومات الجديدة قلصت الفجوة مرة أخرى عن منافستها في مهام المعالجة الهندسية ، إلا أن كتل التغطية بالفسيفساء الـ 16 في GF110 لا تزال بعيدة جدًا عن الموازاة. وحتى GF114 عند الحد الأقصى لنسبة الانقسام تبين أنه أسرع من تاهيتي.

ومع ذلك ، على الرغم من الخسارة في أقسى الظروف مع أعلى نسبة انقسام ، فإن أداء HD 7970 القائم على تاهيتي كان جيدًا ، لا سيما عند مقارنته بكايمان والسرو. يُظهر طراز AMD الجديد في أوضاع التحميل الخفيف والمتوسط ​​زيادة مذهلة في السرعة ، ويصل الاختلاف مقارنةً بالموديل HD 6970 البطيء بالفعل إلى 2.8 مرة. لكننا نرى مثل هذه الزيادة فقط في الحالة القصوى ، وغالبًا ما تتحول من 30 إلى 70 ٪. لم نر الفارق الرباعي الموعود ، على الأقل حتى الآن.

لكن الحد الأقصى للاختلاف بين حلول الشركات يتحقق في ظروف التغطية بالفسيفساء الشديدة ، والتي لن تكون في الألعاب والمعايير القريبة منها. لذلك ، نتوقع أن تقوم تاهيتي بتحسين أداء AMD بشكل كبير في معايير التغطية بالفسيفساء الحالية مثل 3DMark11 و Heaven.

دعنا نلقي نظرة على معيار آخر ، برنامج Nvidia Realistic Water Terrain التجريبي ، المعروف أيضًا باسم Island. يستخدم هذا العرض التوضيحي خرائط التغطية بالفسيفساء والإزاحة لتقديم سطح محيط وتضاريس ذات مظهر واقعي. إنها تبدو رائعة فقط ، وهذا ما ينقص الألعاب الحالية:

Island ليس اختبارًا اصطناعيًا بحتًا للأداء الهندسي ، فهو يحتوي على وحدات بكسل معقدة وتظليل حسابي ، وهذا الحمل أقرب إلى الألعاب الحقيقية التي تستخدم جميع وحدات معالجة الرسومات في وقت واحد ، وليس فقط الوحدات الهندسية ، كما في المعيار السابق.

اختبرنا البرنامج أيضًا باستخدام أربعة عوامل مختلفة للفسيفساء ، ويسمى هذا الإعداد Dynamic Tessellation LOD. وإذا كانت جميع بطاقات فيديو AMD متقدّمة عند أدنى عامل تقسيم ، فعندئذٍ مع تعقيد العمل ، تبدأ اللوحات القائمة على رقائق Nvidia في أخذ زمام المبادرة. ومع زيادة عامل التقسيم وتعقيد المشهد ، ينخفض ​​أداء جميع Radeons تمامًا ، على عكس الحلول المنافسة.

سلوك Radeon HD 7970 في الاختبار مثير للاهتمام. من الواضح على الفور أنه لم يتم إجراء تغييرات أساسية في خط الأنابيب الهندسي (بشكل عام ، لم يتم الوعد بهذا ، لذلك لا توجد شكاوى). إذا كانت البطاقة الجديدة في الوضع الأخف أسرع من HD 6970 بنسبة 35٪ ، و GTX 580 بنسبة 64٪ ، فحتى عند ضبط LOD على 25 ، ينخفض ​​أداء البطاقة الجديدة إلى مستوى سرعة بطاقة GTX 560 Ti. بالإضافة إلى. عند الحد الأقصى لنسبة LOD ، بلغ الفرق بين سرعة Geforce GTX 580 و Radeon HD 7970 3.5 مرة!

دعنا نتحقق مما إذا كنا قد حصلنا على فارق أربعة أضعاف الموعود بين HD 7970 و HD 6970. لا ، كان الحد الأقصى للتأخر في GPU في كايمان أقل من مرتين. وفي كثير من الأحيان ، واحد ونصف فقط. بشكل عام ، ليس من الواضح جدًا بالنسبة لنا أين نبحث عن تسارع رباعي للفسيفساء ، يبقى أن نؤمن بالكلمة أنه في مكان ما. في غضون ذلك ، نعلن انتصارًا آخر لشرائح الفيديو من Nvidia - فهي جيدة جدًا في الاختبارات الهندسية.

استنتاجات بشأن الاختبارات التركيبية

استنادًا إلى نتائج اختباراتنا التركيبية لأحدث بطاقة فيديو Radeon HD 7970 ، استنادًا إلى وحدة معالجة الرسومات Tahiti من عائلة الجزر الجنوبية ، بالإضافة إلى نتائج النماذج الأخرى لبطاقات الفيديو التي تنتجها كل من الشركات المصنعة لرقائق الفيديو المنفصلة ، يمكننا نستنتج أن المنتج الجديد سيصبح بالتأكيد الرائد بين الحلول أحادية الشريحة المتوفرة في السوق. هذا مجرد استمرار رائع لخطوط Radeon HD 5800 و HD 6900 الناجحة ، والتي من المفترض أن تعزز مكانة AMD بشكل جدي في الأشهر المقبلة.

تعتمد وحدة معالجة الرسومات تاهيتي على بنية جديدة باستخدام أحدث تقنية معالجة 28 نانومتر ، وهي مختلفة تمامًا عن جميع الشرائح السابقة من الشركة. على الرغم من أن عدد بعض وحدات التنفيذ فيه لم ينمو كثيرًا (حساب ALUs و ROPs) ، يتميز GPU الجديد بتغييرات معمارية مهمة تهدف إلى زيادة كفاءة حوسبة GPU ، وكذلك تحسين المواقف في أداء معالجة البيانات الهندسية. أظهرت العديد من اختباراتنا التركيبية أن الكفاءة الحسابية في المشكلات المعقدة وسرعة تنفيذ التظليل الهندسي والفسيفساء قد تحسنت بشكل ملحوظ ، على الرغم من أنها لم تكن دائمًا بالقدر الذي توقعناه.

مع رقائق فيديو AMD ، حدث شيء لا بد أن يحدث. نفس الشيء الذي مرت به Nvidia بالفعل قبل ذلك بقليل. مع التحول في التركيز من حوسبة الرسومات إلى حوسبة الأغراض العامة ، والتحول المقابل من VLIW إلى البنى العددية ، بالإضافة إلى إضافة ميزات GPGPU المهمة الأخرى مثل التخزين المؤقت المتقدم وإضافة المبرمجين إلى كل وحدة حسابية ، وزيادة تعقيد الرقاقة من المؤكد أن يتجاوز الزيادة في ذروة الأداء. وهذا يعني ، في الحقيقة البحتة ، أن الحلول السابقة يمكن أن تكون أكثر كفاءة - على الرغم من أنها أقل إنتاجية ، إلا أنه يتم تحقيق ذلك بجهد أقل (في شكل تعقيد رقاقة).

دعنا نشرح هذا بمثال. كانت ميزة Radeon HD 7970 على نفس Radeon HD 5870 في بعض الاختبارات التركيبية بعيدة كل البعد عن الاختلاف في تعقيد GPU - بعد كل شيء ، يحتوي Cypress بالضبط على نصف عدد الترانزستورات (2.15 مقابل 4.3 مليار) ، وفي الاختبارات نادرًا ما يتأخر وراء ذلك القدر. اتضح أن الشريحة القديمة أكثر كفاءة من الجديدة؟ نعم ، ولكن فقط للمهام الرسومية البحتة التي عفا عليها الزمن! في حالة الحسابات غير الرسومية ، والعديد من الحسابات ثلاثية الأبعاد المعقدة ، تبين أن تاهيتي أقوى من ضعف قوة السرو ، وهذا ما تؤكده المواد التركيبية المقابلة. GPGPU هو المستقبل ، وستستمر مهام رقائق الفيديو في أن تصبح أكثر تعقيدًا ، لذلك لم يكن لدى AMD طريقة أخرى.

ولكن بفضل التغييرات المعمارية وخصائصها ، أصبحت بطاقة الفيديو الخاصة بالسلسلة الجديدة في العديد من الاختبارات التركيبية ، والتي كانت في السابق "كعب أخيل" من حلول AMD ، أكثر من تنافسية ، لا سيما بالمقارنة مع المنافس المباشر Geforce GTX 580 ، حتى مع مراعاة السعر الأعلى. يظهر هذا بوضوح في جميع الاختبارات التركيبية تقريبًا لحزم RightMark و Vantage وأمثلة من SDKs المختلفة.

ولكن كانت هناك أيضًا جوانب محتملة ... حسنًا ، ليست ضعيفة ، ولكن ليست قوية بما يكفي لوحدة معالجة الرسومات الجديدة. وتشمل هذه زيادة غير كبيرة في الأداء في بعض الاختبارات الرياضية ، وتبرز أسئلة هندسية (على سبيل المثال ، أين التسارع الموعود بأربعة أضعاف؟). على الرغم من التعقيد والمساحة الأكبر للشريحة مقارنة بنفس كايمان ، فإن نتائج طراز HD 7970 تكون في بعض الأحيان أقل من المتوقع ، وهو ليس من السهل شرحه دائمًا. نفترض أن عدم وجود تحسين للسائق قد يكون السبب في ذلك ، لأن هذه البنية بالنسبة لـ AMD جديدة تمامًا وتتطلب تلميعًا دقيقًا وطويلًا. في بعض الاختبارات ، قد يفشل أيضًا نظام إدارة الطاقة PowerTune ، مما قد يخفض سرعات الساعة عند الوصول إلى أقصى استهلاك للطاقة في الاختبارات الاصطناعية الأكثر تطلبًا ، مما يمنع البطاقة من إظهار الأداء المتوقع بناءً على عدد وحدات التنفيذ وسرعة الساعة.

على الرغم من أن النتائج في المواد التركيبية كانت جيدة بشكل عام ، إلا أنه من دواعي السرور بشكل خاص أن مهندسي AMD شددوا بعض نقاط ضعفهم. لسوء الحظ ، سيكون تحقيق مثل هذه المكاسب الرائعة في الألعاب الحالية أكثر صعوبة مقارنة بالمواد التركيبية المتقدمة. على الفور لعدة أسباب. حتى لمجرد أن الأداء في تطبيقات الألعاب نادرًا ما يكون مقيدًا بأي خاصية واحدة لبطاقة الفيديو ، على عكس المواد التركيبية ، ومع مثل هذا التغيير الجذري في بنية الرسومات ، لا يزال السائقون بحاجة إلى التحسين والتحسين. بالإضافة إلى ذلك ، نادرًا ما تستخدم الألعاب الحديثة الإمكانات الكاملة لبطاقات رسومات الكمبيوتر الشخصي المتطورة. غالبًا ما تكون محدودة بسبب سرعة عمليات جلب النسيج والتعبئة الفعالة (عرض نطاق ذاكرة الفيديو) ، وفي مثل هذه الظروف لا يمكن فتح مثل هذه الرقائق المعقدة بالكامل. سيتعين علينا الانتظار أو الحصول على حصريات قوية للكمبيوتر الشخصي أو الجيل التالي من وحدات التحكم في الألعاب.

نفترض أن نتائج Radeon HD 7970 في الاختبارات التركيبية سيتم تأكيدها من خلال الأرقام المقابلة في جزء "اللعبة" من مادتنا. في الألعاب ، يجب أن يتفوق HD 7970 الجديد على جميع المنافسين ويتفوق على Geforce GTX 580 بنسبة 30٪ على الأقل أو أكثر. من المحتمل أن تنجح كالمعتاد - في بعض الاختبارات ستكون هناك ميزة أكبر ، وفي حالات أخرى لن تكون هناك أي ميزة تقريبًا. على أي حال ، يجب أن يكون HD 7970 هو الأفضل بين جميع طرز AMD و Nvidia أحادية الشريحة ، على الأقل وجدنا جميع المتطلبات المسبقة لذلك. لذا دعنا ننتقل إلى الجزء التالي من المادة - دراسة السرعة في الألعاب.