Обзор самого производительного настольного процессора AMD FX-8150: тестирование архитектуры Bulldozer
06-11-2011
Одним из наиболее ожидаемых продуктов рынка процессоров как нынешнего, так, в прочем, и прошлого года стали ЦП на базе новой микроархитектуры Bulldozer. Подобный ажиотаж был связан в первую очередь с достаточно большим количеством различной предварительной информации и «всевозможных утечек». Одним из факторов повышенного внимания был достаточно длительный срок использования архитектуры K10, которая была анонсирована в конце далекого 2007 года, а по сути своей являлась коррекцией недостатков предыдущих архитектур K8 и K7. При этом стоит отметить тот факт, что базовой все-таки являлась именно K7, десятилетней давности. В связи с тем, что возможности архитектуры К10 фактически были исчерпаны, что мы наблюдали в различных модельных рядах процессоров компании AMD, вполне логичной стала необходимость осуществления кардинальных изменений. Самым напряженным стал момент представления общественности детища разработчиков компании AMD. Несмотря на то, что демонстрация несколько раз откладывалась, но 12 октября все-таки знаменательное событие произошло, и было представлено целых 4 модели CPU для настольных ПК на основе новой архитектуры Bulldozer. Само же семейство получило название Zambezi.
Прежде чем переходить к модельному ряду процессоров, давайте еще раз посмотрим на структуру самого кристалла. Важным отличием является использование так называемых модулей (блоков), которые по своей сути являются ничем иным как сдвоенными х86 процессорными ядрами. Именно из этой особенности и появляются те самые 8 ядер процессора, хотя при беглом взгляде на структуру кристалла угадываются лишь 4, так называемых, модуля Bulldozer.
Сами же процессорные модули помимо двух х86 ядер оснащены также блоками вещественных вычислений (FPU), «front end» и кэш-памятью второго уровня (L2). Подобная сдвоенная компоновка процессорных ядер по своей сути очень сильно напоминает идею Hyper-Threading, который использовал вычислительные возможности одного физического ядра, а в новинке от компании AMD произошла фактически реализация технологии конкурента на физическом уровне с несколькими общими ресурсами, например блоком FPU. Общей для всех модулей является кэш-память L3.
Важным структурным компонентом новой архитектуры является блок «Front end», который по своей сути является набором логических устройств, обеспечивающих подготовку инструкций для исполнения на вычислительных устройствах. Его ключевыми элементами являются: блоки предсказания переходов, кэш инструкций первого уровня (L1I) и декодер. Основной задачей, решаемой блоками предсказаний является оптимизация загрузки процессорных ядер с целью минимизации общего количества простоев CPU из-за задержек с передачей данных из оперативной памяти или кэшей. Декодер же отвечает за преобразование х86 команд в «понятный» для других устройств вид.
Основным изменением, которое произошло в данном блоке в сравнении с предыдущей архитектурой, помимо повышения точности предсказаний, является увеличение количества каналов обработки инструкций до четырех. Однако если учесть тот факт, что в отличие от архитектуры К10, блок «Front end» будет обрабатывать фактически 2 потока данных, вполне вероятно, что мы можем наблюдать некоторое смещение сильных и слабых сторон ЦП семейства AMD FX, в сравнении с CPU предыдущего поколения.
Принципиальная схема процессорного модуля
Серьезных изменений претерпел блок операций с плавающей запятой. На схеме видно, что в него входят два 128-битных исполнительных устройства FMAC, которые для обработки 256-битных инструкций могут объединяться в единое целое. В отличие от K10, где за операции сложения и умножения отвечали разные устройства, эти являются универсальными, и способны выполнить весь спектр поддерживаемых команд. Мы видим, что компания AMD переходит от ассиметричной схемы исполнительных устройств FPU к симметричной. В случае разделения ресурсов между двумя x86 ядрами, каждое может работать со своим FMAC устройством. Фактически вычислительные возможности FPU разделяются на два ядра, но за счет большей универсальности составляющих компонентов в определённых случаях такой подход может обеспечивать близкую или потенциально более высокую производительность в сравнении с другими решениями.
Единственным недостатком подобного подхода можно назвать то, что в данном случае максимальную ответственность за загрузку процессора несет программист, который изначально должен оптимизировать код для выполнения его в двух потоках. Для сравнения стоит вспомнить, что ядро Sandy Bridge интеллектуально загружает собственные ресурсы за счет продвинутой внутрипроцессорной логики, которая самостоятельно разбирает однопоточный код и исполняет его параллельно на полном наборе своих исполнительных устройств.
Мы постарались более подробно осветить ключевые различия и особенности в архитектуре, что касается других вопросов, то ответы на них вы, скорее всего, найдете в материалах презентации.
Внешний вид розничной коробочной версии новинок достаточно интригует. Вы видите, что присутствуют знакомые элементы упаковки, например пластиковое окошко, однако она приобрела более скругленный и изящный вид. Но, как говорится, упаковка упаковкой, а каждый из нас приобретает именно ее содержимое.
Модельный ряд настольных процессоров AMD FX
Модель |
AMD FX-8120 |
AMD FX-6100 |
AMD FX-4100 |
|
Ядра/Модули |
8/4 |
8/4 |
6/3 |
4/2 |
Базовая Частота CPU, ГГц |
3,6 |
3,1 |
3,3 |
3,6 |
Частота в режиме TurboCore, ГГц |
3,9 |
3,4 |
3,6 |
3,7 |
TDP, Вт |
125 |
125 |
95 |
95 |
Объем кэш-памяти L2, МБ |
8 |
8 |
6 |
4 |
Объем кэш-памяти L3, МБ |
8 |
8 |
8 |
8 |
Тип памяти (макс.) |
DDR3-1866 |
DDR3-1866 |
DDR3-1866 |
DDR3-1866 |
На данный момент в модельному ряду AMD FX имеются как восьмиядерники, так и решения с более низким числом активных модулей. «Изюминкой» серии является наличие разблокированного множителя процессора и поддержка технологии TurboCore2.0.
Героем данного исследования является рекордсмен книги рекордов Гинесса AMD FX-8150.
Внешне процессор абсолютно ничем не отличается от своих предшественников, изготовленных для Socket AM3, и выглядит весьма скромно. Традиционная маркировка процессорной крышки сообщает владельцу достаточно много информации. В данном случае она следующая - FD8150FRW8KGU:
-
F – процессор относится к семейству AMD FX;
-
D – сфера применения данного процессора – рабочие станции;
-
8150 – модельным номер;
-
FR – тепловой пакет процессора 125 Вт;
-
W – упакован процессор в корпус 938 pin Socket AM3+;
-
8 – общее количество активных ядер;
-
K – объем кэш-памяти L2 1 МБ на каждое ядро и 8 МБ кэш-памяти L3;
-
GU - ядро процессора степпинга OR-B2.
Тыльная сторона процессора линейки AMD FX
Тыльная сторона процессора линейки AMD Phenom II
Каких-либо отличий в тыльной стороне процессора по сути нет, даже не смотря на то, что используется принципиально новая архитектура.
Спецификация
Модель |
|
Маркировка |
FD8150FRW8KGU |
Процессорный разъем |
Socket AM3+ |
Тактовая частота (номинальная), МГц |
3600 |
Максимальная тактовая частота с TC 2.0, МГц |
3900 |
Множитель (номинал) |
14 |
Частота шины HT, МГц |
2200 |
Объем кэш-памяти L1, КБ |
4 x 64 (инструкции) |
Объем кэш-памяти L2, МБ |
4 х 2 |
Объем кэш-памяти L3, МБ |
8 |
Ядро |
Zambezi |
Количество ядер |
8 |
Поддержка инструкций |
SSE, SSE2, SSE3, SSE4a, SSE4.1, SSE4.2, SSSE3, AVX, AES, XOP, MMX(+), х86-х64 |
Напряжение питания, В |
--- |
Тепловой пакет, Вт |
125 |
Критическая температура, °C |
61 |
Техпроцесс, нм |
32 |
Поддержка технологий |
Multiple low-power states |
Встроенный контроллер памяти |
|
Типы памяти |
DDR3-1066/1333/1600/1866 |
Число каналов памяти |
2 |
Максимальный объем памяти, ГБ |
16 |
Максимальная пропускная способность, ГБ/c |
21,3 |
Поддержка ECC |
есть |
Восьмиядерный процессор AMD FX-8150 принадлежит семейству Zambezi и изготовлен согласно 32 нм технологического процесса. Тактовая частота процессора составляет 3,6 ГГц, при этом напряжение питания ядра 1,2 В. Отличительной особенностью новой архитектуры является поддержка более широкого набора инструкций: AVX в реализации Intel с дополнением XOP, а также FMA4 (одновременная работа с 4-мя операндами), которые «перекочевали» из набора инструкций SSE5, анонсированного в 2007 году, но так и не получившего особой популярности.
Обращаем ваше внимание, что в состоянии покоя частота понижается до отметки 1,4 ГГц, при этом напряжение питания уменьшается до уровня 0,84 В. Что же касается TDP определяемого утилитой в 124 Вт, то он несколько неточен, т.к. производитель указывает его на уровне 125 Вт, но подобная неточность большой роли не играет.
Как вы видите, даже для процессоров с новой архитектурой частота работы оверклокерских модулей памяти автоматически устанавливается на уровне 1333 МГц, хотя родной для контроллера памяти является DDR3-1866. Максимальную эффективность работы с оперативной памятью можно получить только после ручной подстройки в BIOS параметров работы материнской платы, если она это позволит.
Кэш-память новинки распределяется следующим образом. Кэш-память 1 уровня: по 16 КБ на каждое из 8 ядер выделяется для данных с четырьмя каналами ассоциативности, при этом для инструкции имеется 64 КБ на каждый 2-процессорный модуль с 2-мя каналами ассоциативности. Кэш-память 2 уровня: по 2 МБ на каждый модуль процессора, которых как вы помните 4, с 16-ю каналами ассоциативности. Кэш-память 3 уровня общая для всего процессора и составляет 8 МБ с 64-ю каналами ассоциативности.
Отдельного внимания заслуживает работа технологии Turbo Core 2.0, реализованная в процессорах семейства AMD FX. Общая ее характеристика давалась представителями компании в презентации процессоров. Напомним, что в новинках реализовано 2 режима: Turbo Core и Max Turbo Core. Отличия режимов состоят в том, что для «классического» режима происходит повышение тактовой частоты всех ядер, а для Max Turbo Core частоты половины ядер уменьшаются до минимально возможного уровня, при этом остальные ядра получают максимальный прирост. Работа в данных режимах осуществляется до тех пор, пока ЦП не превысит заявленный тепловой пакет или не отпадет необходимость в повышении частоты.
В случае использования процессора AMD FX-8150 вы можете наблюдать следующие ситуации.
AMD FX-8150 работает в режиме Turbo Core со всеми задействованными ядрами
AMD FX-8150 работает в режиме Max Turbo Core
В связи с тем, что данной технологией оснащены все процессоры, и она позволяет получить дополнительную прибавку к производительности, то вполне разумно все-таки ее использовать.
Подписаться на наши каналы | |||||