Обзор самого производительного настольного процессора AMD FX-8150: тестирование архитектуры Bulldozer
06-11-2011
Одним из наиболее ожидаемых продуктов рынка процессоров как нынешнего, так, в прочем, и прошлого года стали ЦП на базе новой микроархитектуры Bulldozer. Подобный ажиотаж был связан в первую очередь с достаточно большим количеством различной предварительной информации и «всевозможных утечек». Одним из факторов повышенного внимания был достаточно длительный срок использования архитектуры K10, которая была анонсирована в конце далекого 2007 года, а по сути своей являлась коррекцией недостатков предыдущих архитектур K8 и K7. При этом стоит отметить тот факт, что базовой все-таки являлась именно K7, десятилетней давности. В связи с тем, что возможности архитектуры К10 фактически были исчерпаны, что мы наблюдали в различных модельных рядах процессоров компании AMD, вполне логичной стала необходимость осуществления кардинальных изменений. Самым напряженным стал момент представления общественности детища разработчиков компании AMD. Несмотря на то, что демонстрация несколько раз откладывалась, но 12 октября все-таки знаменательное событие произошло, и было представлено целых 4 модели CPU для настольных ПК на основе новой архитектуры Bulldozer. Само же семейство получило название Zambezi.
Прежде чем переходить к модельному ряду процессоров, давайте еще раз посмотрим на структуру самого кристалла. Важным отличием является использование так называемых модулей (блоков), которые по своей сути являются ничем иным как сдвоенными х86 процессорными ядрами. Именно из этой особенности и появляются те самые 8 ядер процессора, хотя при беглом взгляде на структуру кристалла угадываются лишь 4, так называемых, модуля Bulldozer.
Сами же процессорные модули помимо двух х86 ядер оснащены также блоками вещественных вычислений (FPU), «front end» и кэш-памятью второго уровня (L2). Подобная сдвоенная компоновка процессорных ядер по своей сути очень сильно напоминает идею Hyper-Threading, который использовал вычислительные возможности одного физического ядра, а в новинке от компании AMD произошла фактически реализация технологии конкурента на физическом уровне с несколькими общими ресурсами, например блоком FPU. Общей для всех модулей является кэш-память L3.
Важным структурным компонентом новой архитектуры является блок «Front end», который по своей сути является набором логических устройств, обеспечивающих подготовку инструкций для исполнения на вычислительных устройствах. Его ключевыми элементами являются: блоки предсказания переходов, кэш инструкций первого уровня (L1I) и декодер. Основной задачей, решаемой блоками предсказаний является оптимизация загрузки процессорных ядер с целью минимизации общего количества простоев CPU из-за задержек с передачей данных из оперативной памяти или кэшей. Декодер же отвечает за преобразование х86 команд в «понятный» для других устройств вид.
Основным изменением, которое произошло в данном блоке в сравнении с предыдущей архитектурой, помимо повышения точности предсказаний, является увеличение количества каналов обработки инструкций до четырех. Однако если учесть тот факт, что в отличие от архитектуры К10, блок «Front end» будет обрабатывать фактически 2 потока данных, вполне вероятно, что мы можем наблюдать некоторое смещение сильных и слабых сторон ЦП семейства AMD FX, в сравнении с CPU предыдущего поколения.
Принципиальная схема процессорного модуля
Серьезных изменений претерпел блок операций с плавающей запятой. На схеме видно, что в него входят два 128-битных исполнительных устройства FMAC, которые для обработки 256-битных инструкций могут объединяться в единое целое. В отличие от K10, где за операции сложения и умножения отвечали разные устройства, эти являются универсальными, и способны выполнить весь спектр поддерживаемых команд. Мы видим, что компания AMD переходит от ассиметричной схемы исполнительных устройств FPU к симметричной. В случае разделения ресурсов между двумя x86 ядрами, каждое может работать со своим FMAC устройством. Фактически вычислительные возможности FPU разделяются на два ядра, но за счет большей универсальности составляющих компонентов в определённых случаях такой подход может обеспечивать близкую или потенциально более высокую производительность в сравнении с другими решениями.
Единственным недостатком подобного подхода можно назвать то, что в данном случае максимальную ответственность за загрузку процессора несет программист, который изначально должен оптимизировать код для выполнения его в двух потоках. Для сравнения стоит вспомнить, что ядро Sandy Bridge интеллектуально загружает собственные ресурсы за счет продвинутой внутрипроцессорной логики, которая самостоятельно разбирает однопоточный код и исполняет его параллельно на полном наборе своих исполнительных устройств.
Мы постарались более подробно осветить ключевые различия и особенности в архитектуре, что касается других вопросов, то ответы на них вы, скорее всего, найдете в материалах презентации.
Внешний вид розничной коробочной версии новинок достаточно интригует. Вы видите, что присутствуют знакомые элементы упаковки, например пластиковое окошко, однако она приобрела более скругленный и изящный вид. Но, как говорится, упаковка упаковкой, а каждый из нас приобретает именно ее содержимое.
Модельный ряд настольных процессоров AMD FX
Модель |
AMD FX-8120 |
AMD FX-6100 |
AMD FX-4100 |
|
Ядра/Модули |
8/4 |
8/4 |
6/3 |
4/2 |
Базовая Частота CPU, ГГц |
3,6 |
3,1 |
3,3 |
3,6 |
Частота в режиме TurboCore, ГГц |
3,9 |
3,4 |
3,6 |
3,7 |
TDP, Вт |
125 |
125 |
95 |
95 |
Объем кэш-памяти L2, МБ |
8 |
8 |
6 |
4 |
Объем кэш-памяти L3, МБ |
8 |
8 |
8 |
8 |
Тип памяти (макс.) |
DDR3-1866 |
DDR3-1866 |
DDR3-1866 |
DDR3-1866 |
На данный момент в модельному ряду AMD FX имеются как восьмиядерники, так и решения с более низким числом активных модулей. «Изюминкой» серии является наличие разблокированного множителя процессора и поддержка технологии TurboCore2.0.
Героем данного исследования является рекордсмен книги рекордов Гинесса AMD FX-8150.
Внешне процессор абсолютно ничем не отличается от своих предшественников, изготовленных для Socket AM3, и выглядит весьма скромно. Традиционная маркировка процессорной крышки сообщает владельцу достаточно много информации. В данном случае она следующая - FD8150FRW8KGU:
-
F – процессор относится к семейству AMD FX;
-
D – сфера применения данного процессора – рабочие станции;
-
8150 – модельным номер;
-
FR – тепловой пакет процессора 125 Вт;
-
W – упакован процессор в корпус 938 pin Socket AM3+;
-
8 – общее количество активных ядер;
-
K – объем кэш-памяти L2 1 МБ на каждое ядро и 8 МБ кэш-памяти L3;
-
GU - ядро процессора степпинга OR-B2.
Тыльная сторона процессора линейки AMD FX
Тыльная сторона процессора линейки AMD Phenom II
Каких-либо отличий в тыльной стороне процессора по сути нет, даже не смотря на то, что используется принципиально новая архитектура.
Спецификация
Модель |
|
Маркировка |
FD8150FRW8KGU |
Процессорный разъем |
Socket AM3+ |
Тактовая частота (номинальная), МГц |
3600 |
Максимальная тактовая частота с TC 2.0, МГц |
3900 |
Множитель (номинал) |
14 |
Частота шины HT, МГц |
2200 |
Объем кэш-памяти L1, КБ |
4 x 64 (инструкции) |
Объем кэш-памяти L2, МБ |
4 х 2 |
Объем кэш-памяти L3, МБ |
8 |
Ядро |
Zambezi |
Количество ядер |
8 |
Поддержка инструкций |
SSE, SSE2, SSE3, SSE4a, SSE4.1, SSE4.2, SSSE3, AVX, AES, XOP, MMX(+), х86-х64 |
Напряжение питания, В |
--- |
Тепловой пакет, Вт |
125 |
Критическая температура, °C |
61 |
Техпроцесс, нм |
32 |
Поддержка технологий |
Multiple low-power states |
Встроенный контроллер памяти |
|
Типы памяти |
DDR3-1066/1333/1600/1866 |
Число каналов памяти |
2 |
Максимальный объем памяти, ГБ |
16 |
Максимальная пропускная способность, ГБ/c |
21,3 |
Поддержка ECC |
есть |
Восьмиядерный процессор AMD FX-8150 принадлежит семейству Zambezi и изготовлен согласно 32 нм технологического процесса. Тактовая частота процессора составляет 3,6 ГГц, при этом напряжение питания ядра 1,2 В. Отличительной особенностью новой архитектуры является поддержка более широкого набора инструкций: AVX в реализации Intel с дополнением XOP, а также FMA4 (одновременная работа с 4-мя операндами), которые «перекочевали» из набора инструкций SSE5, анонсированного в 2007 году, но так и не получившего особой популярности.
Обращаем ваше внимание, что в состоянии покоя частота понижается до отметки 1,4 ГГц, при этом напряжение питания уменьшается до уровня 0,84 В. Что же касается TDP определяемого утилитой в 124 Вт, то он несколько неточен, т.к. производитель указывает его на уровне 125 Вт, но подобная неточность большой роли не играет.
Как вы видите, даже для процессоров с новой архитектурой частота работы оверклокерских модулей памяти автоматически устанавливается на уровне 1333 МГц, хотя родной для контроллера памяти является DDR3-1866. Максимальную эффективность работы с оперативной памятью можно получить только после ручной подстройки в BIOS параметров работы материнской платы, если она это позволит.
Кэш-память новинки распределяется следующим образом. Кэш-память 1 уровня: по 16 КБ на каждое из 8 ядер выделяется для данных с четырьмя каналами ассоциативности, при этом для инструкции имеется 64 КБ на каждый 2-процессорный модуль с 2-мя каналами ассоциативности. Кэш-память 2 уровня: по 2 МБ на каждый модуль процессора, которых как вы помните 4, с 16-ю каналами ассоциативности. Кэш-память 3 уровня общая для всего процессора и составляет 8 МБ с 64-ю каналами ассоциативности.
Отдельного внимания заслуживает работа технологии Turbo Core 2.0, реализованная в процессорах семейства AMD FX. Общая ее характеристика давалась представителями компании в презентации процессоров. Напомним, что в новинках реализовано 2 режима: Turbo Core и Max Turbo Core. Отличия режимов состоят в том, что для «классического» режима происходит повышение тактовой частоты всех ядер, а для Max Turbo Core частоты половины ядер уменьшаются до минимально возможного уровня, при этом остальные ядра получают максимальный прирост. Работа в данных режимах осуществляется до тех пор, пока ЦП не превысит заявленный тепловой пакет или не отпадет необходимость в повышении частоты.
В случае использования процессора AMD FX-8150 вы можете наблюдать следующие ситуации.
AMD FX-8150 работает в режиме Turbo Core со всеми задействованными ядрами
AMD FX-8150 работает в режиме Max Turbo Core
В связи с тем, что данной технологией оснащены все процессоры, и она позволяет получить дополнительную прибавку к производительности, то вполне разумно все-таки ее использовать.
Тестирование
При тестировании использовался Стенд для тестирования Процессоров №1
Материнские платы (AMD) | ASUS M3A32-MVP DELUXE (AMD 790FX, sAM2+, DDR2, ATX)GIGABYTE GA-MA790XT-UD4P (AMD 790X, sAM3, DDR3, ATX) |
Материнские платы (AMD) | ASUS F1A75-V PRO (AMD A75, sFM1, DDR3, ATX)ASUS SABERTOOTH 990FX (AMD 990FX, sAM3+, DDR3, ATX) |
Материнские платы (Intel) | GIGABYTE GA-EP45-UD3P (Intel P45, LGA 775, DDR2, ATX)GIGABYTE GA-EX58-DS4 (Intel X58, LGA 1366, DDR3, ATX) |
Материнские платы (Intel) | ASUS Maximus III Formula (Intel P55, LGA 1156, DDR3, ATX)MSI H57M-ED65 (Intel H57, LGA 1156, DDR3, mATX) |
Материнские платы (Intel) | ASUS P8Z68-V PRO (Intel Z68, sLGA1155, DDR3, ATX)ASUS P9X79 PRO (Intel X79, sLGA2011, DDR3, ATX) |
Кулеры | Noctua NH-U12P + LGA1366 KitScythe Kama Angle rev.B (LGA 1156/1366)ZALMAN CNPS12X (LGA 2011) |
Оперативная память | 2х DDR2-1200 1024 МБ Kingston HyperX KHX9600D2K2/2G2/3x DDR3-2000 1024 МБ Kingston HyperX KHX16000D3T1K3/3GX |
Видеокарты | EVGA e-GeForce 8600 GTS 256 МБ GDDR3 PCI-EASUS EN9800GX2/G/2DI/1G GeForce 9800 GX2 1ГБ GDDR3 PCI-E 2.0 |
Жесткий диск | Seagate Barracuda 7200.12 ST3500418AS, 500 ГБ, SATA-300, NCQ |
Блок питания | Seasonic SS-650JT, 650 Вт, Active PFC, 80 PLUS, 120 мм вентилятор |
В результате выполнения стандартного набора тестов мы видим, что многочисленные разговоры о революционной производительности были несколько преувеличены представителями компании AMD. Конечно же, показатели достаточно высокие, однако нельзя сказать, что они фантастические. Так, например, если сравнить флагманов AMD FX-8150 и AMD Phenom II X6 1100T, то на лицо существенный прирост производительности в задачах архивирования и конвертирования (кодирования), при этом в данных тестах неоспоримым лидером становится именно AMD FX-8150 в сравнении с конкурентами, однако по среднему показателю новинка ничем не лучше «топового» 6-ядерника.
Если вы достаточно сильно ограничены в бюджетных средствах и планируете собирать игровую систему, то в данной ситуации абсолютно уверенно можно приобретать AMD Phenom II X4 980 или же даже менее дорогой подобный ему процессор со свободным множителем, т.к. на данный момент еще достаточно мало игр, которые способны достаточно хорошо взаимодействовать с большим количеством ядер. Тесты показывают, что среди представителей компании AMD в основном лидирующие показатели остаются именно за 4-ядерной моделью. Лидером же среди сравниваемых по умолчанию CPU по среднему уровню производительности является Intel Core i5-2500K.
Обратите внимание на прирост производительности, связанный с использованием технологии Turbo Core 2.0. За счет ее использования владелец способен получить порядка 4-7% дополнительной вычислительной мощности. Таким образом, если вы оставите ее включенной, то никак не прогадаете.
Разгон AMD FX-8150 с архитектурой Bulldozer
В связи с тем, что позиционируется AMD FX-8150 как решение для оверлокеров, то и мы постараемся оценить его разгонный потенциал. В данном случае стоит сделать оговорку, т.к. мы используем исключительно воздушную систему охлаждения.
Мы выполнили разгон процессора за счет повышения его множителя. В результате наших действий система стабильно работала при увеличении множителя процессора до отметки х23, на котором он достиг частоты 4615 МГц, при этом напряжение на ядре пришлось поднять до 1,452 В.
Частота работы памяти после разгона процессора составила 1872 МГц.
Тестовый пакет |
Результат |
Прирост производи |
||
Номиналь |
Разогнан |
|||
Futuremark PCMark'05 |
CPU |
9729 |
11042 |
13,50 |
Memory |
7461 |
8076 |
8,24 |
|
Graphics |
9402 |
9863 |
4,90 |
|
CrystalMark |
ALU |
48251 |
57126 |
18,39 |
FPU |
44451 |
53839 |
21,12 |
|
Memory |
46562 |
55759 |
19,75 |
|
WinRar, Kb/s |
3287 |
3587 |
9,13 |
|
Futuremark 3DMark'06 |
Mark Score |
6613 |
6685 |
1,09 |
CPU Score |
5591 |
6632 |
18,62 |
|
CINEBENCH R10 |
Rendering, CB-CPU |
14850 |
18213 |
22,65 |
Shading, CB-GFX |
5220 |
6041 |
15,73 |
|
Fritz Chess Benchmark v.4.2, knodes/s |
11640 |
14357 |
23,34 |
|
Futuremark 3DMark Vantage v.1.0.1 |
PMark Score |
11531 |
11977 |
3,87 |
CPU Score |
18905 |
23103 |
22,21 |
|
World in Conflict v.1.0.0.9, Maximum, 1024x768 |
Average FPS |
58 |
67 |
15,52 |
Far Cry 2 v.1.00, 1280x1024 |
DirectX 9, High, fps |
100,46 |
113,19 |
12,67 |
DirectX 10, Very High, fps |
84,06 |
92,28 |
9,78 |
Средний прирост производительности в результате разгона составил 14,15%. Самым чувствительным к разгону ПО оказались вычислительные задачи, для которых подобные действия закончилось более чем 20% прибавкой производительности. Результат в целом можно охарактеризовать как достаточно скромный, т.к. мы уже сталкивались с ЦП компании AMD, которые давали и более существенный прирост мощности при разгоне с использованием воздушных систем охладения.
Эффективность применения оперативной памяти DDR3-1866
Для того чтобы полнее представить производительность процессора AMD FX-8150 и дать общую оценку перспективности использования более быстрой, но и чуть более дорогой, оперативной памяти DDR3-1866, мы решили проверить, какой же вклад в быстродействие системы с этим CPU вносит именно подсистема памяти.
Тестовый пакет |
Результат |
Прирост производи |
||
DDR3-1333 |
DDR3-1866 |
|||
Futuremark PCMark'05 |
CPU |
9729 |
9728 |
-0,01 |
Memory |
7461 |
7665 |
2,73 |
|
Graphics |
9402 |
9440 |
0,40 |
|
CrystalMark |
ALU |
48251 |
48751 |
1,04 |
FPU |
44451 |
44727 |
0,62 |
|
Memory |
46562 |
47505 |
2,03 |
|
WinRar, Kb/s |
3287 |
3554 |
8,12 |
|
Futuremark 3DMark'06 |
Mark Score |
6613 |
6621 |
0,12 |
CPU Score |
5591 |
5626 |
0,63 |
|
CINEBENCH R10 |
Rendering, CB-CPU |
14850 |
14507 |
-2,31 |
Shading, CB-GFX |
5220 |
5093 |
-2,43 |
|
Fritz Chess Benchmark v.4.2, knodes/s |
11640 |
11765 |
1,07 |
|
Futuremark 3DMark Vantage v.1.0.1 |
PMark Score |
11531 |
11571 |
0,35 |
CPU Score |
18905 |
19095 |
1,01 |
|
World in Conflict v.1.0.0.9, Maximum, 1024x768 |
Average FPS |
58 |
60 |
3,45 |
Far Cry 2 v.1.00, 1280x1024 |
DirectX 9, High, fps |
100,46 |
102,18 |
1,71 |
DirectX 10, Very High, fps |
84,06 |
85,57 |
1,80 |
В среднем мы получили прирост всего-навсего 1,2%, что, конечно, не вселяет оптимизма для ее использования в виду более высокой стоимости. Но при комплектации системы подобным «гигантом», можно задуматься над возможностью получить сразу максимально производительную систему.
Анализ энергоэффективности
Наименование |
Простой, Вт |
LinX, Вт |
EVEREST 5.0, Вт |
AMD APU A8-3850 |
58 |
168 |
148 |
AMD Athlon II X3 455 |
68 |
146 |
155 |
AMD Athlon II X4 631 |
61 |
158 |
142 |
AMD FX-8150 |
80 |
218 |
208 |
AMD FX-8150 @4615 1,45 В |
178 |
400 |
355 |
AMD Phenom II X4 970 BE |
68 |
197 |
206 |
AMD Phenom II X4 980 |
77 |
210 |
221 |
AMD Phenom II X6 1100T |
74 |
232 |
251 |
Intel Core i3-2120 |
58 |
104 |
91 |
Intel Core I5-2300 |
59 |
133 |
112 |
Intel Core i5-2500K |
59 |
139 |
116 |
Intel Core i7-2600K |
58 |
142 |
118 |
Intel Core i7-2600K @4900 1,44V |
70 |
224 |
175 |
Intel Pentium G620 |
58 |
92 |
85 |
Intel Pentium G850 |
58 |
95 |
86 |
После проведения замеров энергопотребления было установлено, что в режиме простоя система на базе AMD FX-8150 потребляет 80 Вт, и это своеобразный рекорд «прожорливости» для процессоров, которые проходили у нас замеры потребления энергии, что, кстати, значительно выше показателей характерных для процессоров уходящей архитектуры. В случае же загрузки системы энергопотребление превышает 200 Вт. Рекордно высокие показатели энергопотребления были выявлены также после выполнения разгона и составили 178 Вт в простое, в случае же подачи нагрузки колебались в диапазоне 350-400 Вт. Таким образом, AMD FX-8150 очень сложно назвать экономичным с точки зрения потребления энергии ЦП. Целесообразность его использования возникает в ситуации исключительной важности вычислительной производительности системы, где дополнительные проценты мощности серьезно отразятся на времени выполнения задачи.
Выводы
По итогам знакомства с новой микроархитектурой Bulldozer нельзя говорить о ее неэффективности или неудачности. Судя по той информации, которая уже достаточно давно будоражила просторы Internet, разработчики компании не смогли в полной мере реализовать все свои задумки, а основным камнем преткновения стала, по всей видимости, тактовая частота ядер ЦП, т.к. изначально она должна была быть выше. В результате этой заминки микроархитектура Bulldozer так и не смогла раскрыть весь свой потенциал. Дополнительным «отягчающим» обстоятельством является достаточно небольшой процент домашних, офисных и игровых приложений, качественно оптимизированных под многоядерные CPU.
В отношении «топового» процессора AMD FX-8150 однозначно можно сказать, что он уже становится, если не стал, любимцем у фанатов экстремального разгона в виду своего разгонного потенциала и достаточно низкой стоимости в сравнении с подобными «экстремальными» решениями компании Intel. Однако для выполнения рядовых задач приобретение данного процессора будет не самой оптимальной покупкой. В качестве альтернативы для решения широкого круга задач вполне можно использовать 6 и 4-ядерные ЦП компании AMD, при этом покупатель сможет поберечь свой кошелек, или же «топовые» процессоры Core i5/i7 компании Intel. Дополнительным отрицательным моментом является чрезмерная «прожорливость» AMD FX-8150, так что его использование будет оправдано исключительно в ситуациях, где крайне важна предельно возможная вычислительная мощь, но нет возможности тратить любые суммы. Также стоит помнить, что при покупке данного процессора особое внимание стоит уделить выбору эффективной системы охлаждения и качественной материнской платы с надежной системой питания процессора.
Автор: Гаранжа Дмитрий
Выражаем благодарность украинскому представительству компании AMD за предоставленный для тестирования процессор.
Выражаем благодарность компаниям ASUS, GIGABYTE, Kingston, Noctua, Sea Sonic, Scythe, VIZO за предоставленное для тестового стенда оборудование.
Также предлагаем почитать:
Обновленная методика тестирования процессоров
Опубликовано : 06-11-2011
Подписаться на наши каналы | |||||