Поиск по сайту

up
::>Видеокарты >2009 > GIGABYTE GV-R587D5-1GD-B

Обзор видеокарты GIGABYTE Radeon HD 5870 на новом GPU ATI RV870

11-11-2009

AMD ATI RV870 – новое поколение графических чипов

Кажется, что совсем недавно была представлена новая версия API DirectX 10 и вместе с ней представлены революционные графические адаптеры с новой архитектурой. Но развитие технологий никогда не застаивается и спустя несколько лет мир увидел DirectX 11. А вместе с новой API разработчики графических процессоров представляют совершенно новые видеокарты с полной поддержкой новейших технологий включенных в состав Microsoft DirectX 11. Первыми, кто представил свои новые графические процессоры с полной поддержкой  DirectX11, стала компания AMD, выпустившая видеокарту Radeon HD 5870, построенную на чипе ATI RV870. Давайте рассмотрим, какие же изменения AMD внесла в новое поколение графических процессоров RV870 и насколько они отличаются от своих предшественников Radeon HD 4870, которые построены на чипе ATI RV770.

AMD ATI RV870 (Radeon HD 5870)

Чип AMD ATI RV870 (Radeon HD 5870)

Начиная с самого низкого уровня SPU, добавились несколько новейших аппаратных инструкций, и возросла скорость реализации прежних. Это было сделано как для увеличения производительности, так и для соответствия чипа стандартам разных API последних версий. Ускорение работы достигнуто за счет того, что отдельные инструкции, требующие ранее некоторое количество циклов для исполнения, отныне могут быть рассчитаны за один заход. Поддержка нужных для DirectX 11 команд, таких как count, insert и extract, была прибавлена как раз на этом уровне. Отдельное внимание было уделено обсчету поднормалей, которые в настоящий момент производятся без потери производительности.

AMD ATI RV870 (Radeon HD 5870)

Выполнение инструкций за один такт

Наверно, одной из самых любопытных добавленных инструкций стала сумма модулей разности – Sum of Absolute Differences (SAD). Она особенно часто используется при кодировании видео и анализе графических данных, так как в геометрическом плане с ее поддержкой легко оценивать движение. В случае с RV770 аппаратная поддержка SAD просто-напросто отсутствовала, а для ее эмуляции требовалась цепочка примерно из 12 инструкций. С добавлением SAD в SPU исполнение инструкции занимает один единственный такт, и, по словам AMD, это должно более чем в два раза ускорить кодирование видео силами GPU. Несколько расстраивает, что SAD не является неизбежной частью DirectX 11 или OpenCL, а это означает, что написанные под DirectX программы не могут вызывать ее. То же справедливо и для OpenCL, но для этого API хотя бы имеется необходимая библиотека. Впрочем, эти API не ограничивают жестко поведение GPU, поэтому динамический компилятор AMD может на лету распознать возможности оптимизаций (например – упомянутую выше цепь из 12 инструкций) и подменить нужные части общего кода на более действенные для данной конкретной архитектуры. То есть, даже если программист и не вызывал какие-либо необходимые функции вручную, интеллектуальные алгоритмы смогут возмещать это упущение самостоятельно.

Список инструкций, которые блок RV870 может осуществлять за один такт:

  • 4x 32-битных FP MAD
  • 2x 64-битных FP MUL или ADD
  • 1x 64-битный FP MAD
  • 4x 24-битных Int MUL или ADD
  • SFU: 1x 32-битный FP MAD

Переходим к SIMD-блокам. Кроме совершенствований в SP, текстурный кэш L1, размещенный здесь, получил значительную прибавку к производительности. Хотя его размер не видоизменился (у каждого SIMD в наличии по 16 КБ L1), скорость работы с данными увеличилась до впечатляющих 1 ТБ/с. Помимо этого, в дополнение к имеющемуся текстурному кэшу, было добавлено 8 КБ для сохранения промежуточных подсчетов SIMD. Наконец, вдвое выросло (до 32 КБ) локальное хранилище данных, подключенное к каждому модулю.

AMD ATI RV870 (Radeon HD 5870)

Строение SIMD блоков практически идентичное

Также были переработаны текстурные модули. Первое из внесенных видоизменений – добавленная возможность чтения сжатых AA цветовых буферов для более разумного применения пропускной способности. Второе – в AMD задались целью поднять скорость интерполяции, и осуществили это довольно любопытным способом. Текстурные модули просто-напросто лишили этой способности, вынеся ее в обязанности SP (часть спецификаций DirectX 11). Это позволило значительно увеличить скорость выполнения операций данного типа. В результате этого текстурные модули RV870 имеют более высокую скорость закраски (филрейта), чем у RV770. AMD утверждает, что чип способен в совокупности добиваться показателя в 68 миллиардов билинейно отфильтрованных текселей в секунду, что является последствием переброски интерполяции на SP и выполненных оптимизаций для эффективного использования пропускной способности. Снова делая шаг вверх по лестнице архитектурных уровней, добираемся до основной причины перевеса в производительности RV870 над своим предшественником. AMD удвоила число блоков SIMD с 10 до 20 штук. Это обозначает двукратное количественное превосходство по всему, начиная от SP и кончая текстурными модулями. Это достаточно банальное изменение, в отличие от добавления новых низкоуровневых команд или переработки кэшей, но как мы видим, наиболее результативное.

AMD ATI RV870 (Radeon HD 5870)

Строение ядра RV870

Непосредственно, чтобы предельно эффективно загружать работой такое количество потоковых процессоров, были внесены и доработки в алгоритмы распределяющего диспетчера Ultra-Threaded Processor, объем 4-х блоков кэш-памяти L2 был удвоен с 64 до 128 КБ, причем в то же время они обрели ускорение в работе. Раньше они были объединены со сверхбыстрой памятью первого уровня на скорости до 384 ГБ/с, теперь – 435 ГБ/с. В конце концов, общий буфер данных был увеличен в 4 раза, до 64 КБ. Мы видим, что AMD не только удвоила все исполнительные блоки и расширила их функциональность, но и побеспокоилась об отсутствии вероятных узких мест.

AMD ATI RV870 (Radeon HD 5870)

Такой вид имел общий буфер в RV770

AMD ATI RV870 (Radeon HD 5870)

А так общий буфер выглядит в RV870

Для того чтобы обработать все то, что рассчитывают SIMD-процессоры, удвоили и блоки ROP. Это значит, что их количество в RV870 увеличилось до 32 штук. Сами ROP также подверглись косметической переделке, вследствие чего их производительность также немного возросла. Теперь блоки растеризации могут проводить быструю цветовую очистку, ведь согласно исследованиям AMD, многие игры проводят сотни таких операций между кадрами. Также ROP ответственны и за отдельные стадии нового метода сглаживания SSAA, представленного ATI вместе с 5000-й линейкой своих видеокарт.

Последнее усовершенствование – AMD Graphics Engine

AMD ATI RV870 (Radeon HD 5870)

AMD Graphics Engine

Блок аппаратной тесселяции внесли еще в RV770, однако, невзирая на свои обширные возможности, разработчики игр практически не применяли его, обходя стороной. В DirectX 11 появилось требование неизбежного наличия такого блока в GPU, и имеющийся в RV770 был улучшен для соответствия спецификациям DX11. Причем если в RV770 такой модуль был один, для наилучшего баланса и равномерности загрузки массива из 20 SIMD, в RV870 добавили второй.

AMD ATI RV870 (Radeon HD 5870)

Так выглядит эталонная видеокарта Radeon HD 5870

Как мы видим, архитектура AMD ATI RV870 перетерпела множество изменений по сравнению с RV770, однако некоторые элементы остались не тронуты. Инженеры из AMD не стали изобретать что-то совсем новое, они просто-напросто хорошо модернизировали видеочип прошлого поколения.

 

Radeon HD 4870

Radeon HD 4890

Radeon HD 5870

Кодовое имя

RV770

RV790

RV870

Площадь чипа, кв. мм.

263

263

334

Техпроцесс, нм

55

55

40

Кол-во транзисторов, млрд. шт.

0,956

0,959

2,15

Частота ядра, МГц

750

850

850

Частота памяти (эффективная QDR), МГц

900
(3600)

975
(3900)

1200
(4800)

Текстурных блоков, шт.

40

40

80

Шейдерных процессоров, шт.

800

800

1600

Блоков ROPs, шт.

16

16

32

Объем памяти, МБ

512/1024

1024

1024

Поддерживаемые API

DirectX 10.1
OpenGL 3.0

DirectX 10.1
OpenGL 3.0

DirectX 11
OpenGL 3.1

Поддержка Eyefinity

Нет

Нет

Есть

Но насколько видеокарты на Radeon HD 5870 стали производительней своих предшественников в лице ускорителей на Radeon HD 4870 и Radeon HD 4890, смогут нам ответить только результаты тестирования в игровых приложениях и синтетических тестах. Поэтому этот обзор будет посвящен одному из первых решений на AMD ATI Radeon HD 5870, которое попало в нашу тестовую лабораторию - GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B).

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Спецификация:

Модель

GIGABYTE Radeon HD 5870
(GV-R587D5-1GD-B)

Графическое ядро

(AMD) ATI Radeon HD 5870 (RV870 PRO)

Конвейера

1600 унифицированных потоковых

Поддерживаемые API

DirectX 11 (Shader Model 5.0)
OpenGL 3.1

Частота ядра, МГц

850

Объем (тип) памяти, МБ

1024 (GDDR5)

Частота памяти (эффективная), МГц

1200 (4800)

Шина памяти, бит

256

Стандарт шины

PCI Express X16 2.0

Максимальное разрешение

До 2560x1600 (Dual-link DVI) или 1920x1200 (Single-link DVI)
До 2048x1536 (VGA через переходник DVI-to-VGA)
До 1920x1080 (HDMI)
До 2560x1600 (DisplayPort)

Выходы

2x DVI-I (HDMI/VGA через переходники)
1x HDMI
1x DisplayPort

Поддержка HDCP

Есть
Декодирование MPEG-2, MPEG-4, DivX, WMV9, VC-1 и H.264/AVC

Драйверы

Свежие драйверы можно скачать с:
- сайта производителя GPU
- сайта поддержки

Сайт производителя

http://www.gigabyte.com.tw/

Не трудно заметить, что характеристики видеокарты очень схожи с рекомендованными производителем GPU, поэтому в плане производительности ускоритель описывает возможности любого «референсного» решения на Radeon HD 5870.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Видеокарта поставляется в достаточно габаритной картонной упаковке. Внешний вид и оформление коробки напоминает таковое для последних решений компании с пассивными системами охлаждения. Основной акцент сделан на графическом процессоре ATI Radeon HD 5870, который лежит в основе ускорителя, а также на наличии выхода DisplayPort.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

На обратной стороне упаковки описываются особенности графического ускорителя и акцентируется внимание на поддержке Microsoft DirectX 11 и технологии ATI Eyefinity, которая через DisplayPort позволяет использовать для визуализации игры несколько мониторов.

Комплект поставки розничной версии GIGABYTE Radeon HD 5870 достаточно сложно оценить, так как в коробке вместе с тестовым семплом мы обнаружили только:

  • Два переходника с периферийного разъема питания на 6-контактный разъем питания видеокарты;
  • Переходник с DVI на D-Sub;
  • Мостик CrossFire.

Как минимум мы не увидели в комплекте диска с драйверами и утилитами, а также хотя бы краткой инструкций по установке видеокарты, но, наверняка, с купленным в магазине ускорителем эти компоненты будут.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Внешне видеокарта GIGABYTE Radeon HD 5870 очень похожа на эталонный ускоритель, копией которого, судя по всему, она и является. Но, все же, внешний вид системы охлаждения и фирменные надписи выделяют видеокарту.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

По габаритам новая видеокарта оказалась достаточно большой, например, она примерно на сантиметр длиннее двухчипового ускорителя от NVIDIA. Такие габариты могут создать некоторые проблемы при установке новых ускорителей в некоторые корпуса.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Обратная сторона ускорителя почти полностью скрыта под металлической пластиной, которая в основном увеличивает жесткость конструкции и обеспечивает более надежное крепление системы охлаждения.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

В правой части верхнего торца ускорителя находятся два 6-контактных разъема дополнительного питания, что говорит о не самом высоком уровне энергопотребления. Последнее позволяет надеяться на то, что стандартной турбины будет достаточно для охлаждения без необходимости раскручивать турбину до очень высокой скорости, что будет создавать много шума. Кстати, интересно выглядят два «сопла» в торце кожуха кулера, которые по идее должны улучшить циркуляцию воздуха.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Слева вверху видеокарты находятся два разъема для мостиков CrossFire, что является хорошим заделом на будущее и подспорьем для желающих получить бескомпромиссно быструю игровую станцию.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Благодаря двухслотовому дизайну системы охлаждения на ускорителе реализовано много видеовыходов: два универсальных выхода DVI, мультимедийные выходы HDMI и DisplayPort. Для подключения аналогового монитора необходимо будет воспользоваться переходником из комплекта поставки.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Лицевая сторона печатной платы достаточно насыщена различными элементами: кроме самого GPU здесь расположились все чипы видеопамяти и все основные узлы стабилизатора питания.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Обратная сторона платы несет только некоторую часть мелких согласующих элементов.

Видеопамять общим объемом 1 ГБ набрана восемью микросхемами стандарта GDDR5 производства SAMSUNG (K4G10325FE-HC04) со временем доступа 0,4 нс, что позволяет им работать на эффективной частоте до 5000 МГц. Поскольку результирующая частота работы чипов памяти на видеокарте немного ниже и составляет 4800 МГц, то остается узенький частотный коридор про запас.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Частота работы графического процессора соответствует рекомендованному значению 850 МГц. Как уже описывалось ранее, сам чип RV870 выполнен по 40 нм техпроцессу, что обуславливает его относительно небольшое энергопотребление, несмотря на то, что в него входят 2154 млн. транзисторов. Количество унифицированных шейдерных процессоров увеличено до 1600, текстурных блоков до 80, а количество ROP равно 32.

При отсутствии нагрузки частота работы чипа снижается до 157 МГц, а видеопамять замедляется до 300 МГц (эффективная частота 1200 МГц). При этом уменьшается и напряжение питания, что обеспечивает заметное снижение энергопотребления и температуры.

GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B)

Теперь рассмотрим систему охлаждения видеокарты. Основная турбина состоит из металлической основы, которая является радиатором для чипов памяти и компонентов стабилизатора питания, прилегая к ним через термопрокладки, а также радиаторного блока из медного теплосъемника, четырех тепловых трубок и алюминиевых ребер.

Для увеличения эффективности контакт между тепловыми трубками и алюминиевыми пластинами качественно пропаян. Продувает всю эту конструкцию, скрытую под пластиковым кожухом, вполне обычная на вид турбина.

Для оценки эффективности системы охлаждения мы использовали утилиту FurMark, а детальный мониторинг осуществлялся при помощи GPU-Z. Работая на штатных частотах и управляя скоростью вращения турбины автоматически, графический процессор прогрелся до 85°С, хотя один из дополнительных термодатчиков засвидетельствовал температуру на 6,5 градусов выше. Учитывая что при этом скорость вращения турбины была только 37% от максимальной и весь кулер оставался очень тихим, мы можем говорить о не очень большом тепловыделении ускорителя и отличной работе системы охлаждения.

Подписаться на наши каналы
telegram YouTube facebook Instagram