Поиск по сайту

up
::>Процессоры >2008 > AMD Phenom X4 9750

Детальное тестирование процессора AMD Phenom X4 9750

29-09-2008

При тестировании использовался Стенд для тестирования Процессоров №1

Материнские платы (AMD) ASUS M3A32-MVP DELUXE (AMD 790FX, sAM2+, DDR2, ATX)GIGABYTE GA-MA790XT-UD4P (AMD 790X, sAM3, DDR3, ATX)
Материнские платы (AMD) ASUS F1A75-V PRO (AMD A75, sFM1, DDR3, ATX)ASUS SABERTOOTH 990FX (AMD 990FX, sAM3+, DDR3, ATX)
Материнские платы (Intel) GIGABYTE GA-EP45-UD3P (Intel P45, LGA 775, DDR2, ATX)GIGABYTE GA-EX58-DS4 (Intel X58, LGA 1366, DDR3, ATX)
Материнские платы (Intel) ASUS Maximus III Formula (Intel P55, LGA 1156, DDR3, ATX)MSI H57M-ED65 (Intel H57, LGA 1156, DDR3, mATX)
Материнские платы (Intel) ASUS P8Z68-V PRO (Intel Z68, sLGA1155, DDR3, ATX)ASUS P9X79 PRO (Intel X79, sLGA2011, DDR3, ATX)
Кулеры Noctua NH-U12P + LGA1366 KitScythe Kama Angle rev.B (LGA 1156/1366)ZALMAN CNPS12X (LGA 2011)
Оперативная память 2х DDR2-1200 1024 МБ Kingston HyperX KHX9600D2K2/2G2/3x DDR3-2000 1024 МБ Kingston HyperX KHX16000D3T1K3/3GX
Видеокарты EVGA e-GeForce 8600 GTS 256 МБ GDDR3 PCI-EASUS EN9800GX2/G/2DI/1G GeForce 9800 GX2 1ГБ GDDR3 PCI-E 2.0
Жесткий диск Seagate Barracuda 7200.12 ST3500418AS, 500 ГБ, SATA-300, NCQ
Блок питания Seasonic SS-650JT, 650 Вт, Active PFC, 80 PLUS, 120 мм вентилятор
Сравнить AMD Phenom X4 9750 с
Обзор AMD Phenom X4 9850
Обзор AMD Phenom X4 9650
Обзор Intel Core 2 Quad Q6600
Обзор Intel Core 2 Duo E8300
Futuremark PCMark'05 CrystalMark 0.9 WinRar 3.80 LAME 3.98, s VirtualDub 1.8.6, mpeg to avi, s Futuremark 3DMark'05 Futuremark 3DMark'06 SmartFPS.com v1.5, max quality, 800x600, fps x264 Benchmark HD 2.0 CINEBENCH R10 Fritz Chess Benchmark v.4.2 Futuremark 3DMark Vantage Tom Clancy's H.A.W.X. Demo, High, 1280x1024, AA2x World  in Conflict v.1.0.0.9, Maximum, 1024x768 Far Cry 2 v.1.00, 1280x1024 Race Driver: GRID Demo, 1280x1024, AA4x

При сравнении с Intel Core 2 Quad Q6600, который тоже работает на частоте 2,4 ГГц, видно, что в большинстве задач процессор AMD Phenom X4 9750 оказывается медленнее примерно на 10%, хотя в некоторых тестах и приложениях встроенный контроллер памяти показывает превосходство над «внешним», находящимся в чипсете. Но в целом, с учетом стоимости и энергопотребления, 125-ваттной модели HD9750XAJ4BGH тяжело на равных конкурировать с Intel Core 2 Quad Q6600, а вот для 95-ваттной модели HD9750WCJ4BGH итог будет определяться предпочтениями покупателя и набором наиболее часто используемых приложений. Отставание же от более быстрой модели AMD Phenom X4 9850 Black Edition находится на уровне примерно 5%, что для многих задач окажется не заметно «на глаз».

Определившись с производительностью, теперь перейдем к более глубокому исследованию различных аспектов быстродействия системы на базе процессора AMD Phenom X4 9750 и особенностей работы самого процессора.

Влияние скорости памяти на производительность

В предыдущих материалах мы проверяли только потенциал перехода с DDR2-800 на DDR2-1066, а теперь давайте посмотрим как будет изменяться производительность системы при установке еще более медленной памяти. С одной стороны, возможно, у кого-то еще есть DDR2-533 или DDR2-667, например вследствие апгрейда системы, а с другой стороны это позволит оценить эффективность работы не только контроллера памяти, но и кэш-памяти третьего уровня.

Для эксперимента мы не искали различные устаревшие модули памяти, а воспользовались одним набором 2x 1 ГБ Transcend aXeRam DDR 2-1066+ (TX1066QLJ-2GK), постепенно замедляя его и выставляя тайминги по SPD.

Наиболее критичным оказался переход с, в принципе, уже не существующей DDR2-400 на столь же морально устраревшую DDR2-533, дальнейшее ускорение памяти уже не так заметно отражалось на общей производительности. Но, учитывая еще некоторую актуальность модулей DDR2-667, мы вычислили прирост производительности при переходе с нее на DDR2-1066 (эффективность DDR2-800 находится где-то между этими значениями).

Тестовый пакет

Результат

Прирост производительности, %

DDR2-667

DDR2-1066

Futuremark PCMark'05

CPU

7084

7100

0,23

Memory

4235

4409

4,11

Graphics

8421

8553

1,57

CrystalMark

ALU

38030

37954

-0,20

FPU

39192

39457

0,68

Memory

21202

25967

22,47

Futuremark 3DMark'06

Mark Score

6118

6123

0,08

CPU Score

3336

3354

0,54

SmartFPS.com v1.5, Max Quality, 800x600, fps

Battlefield 2

134,0

142,7

6,49

Serious Sam 2

111,2

114,3

2,79

Quake 4

120,0

125,1

4,25

Prey

146,9

151,0

2,79

Наиболее чувствительным к скорости памяти оказался синтетический тест CrystalMark, а в остальных «реальных» задачах наибольший прирост быстродействия оказался всего 6,5%. Учитывая эти результаты, можно сделать вывод об очень эффективной работе встроенного контроллера памяти и большой пользе от использования 2 Мб кэш-памяти L3. Таким образом, хотя ускорение памяти и приносит некоторое повышение быстродействия, но если это требует дополнительных затрат времени и денег, то может быть не всегда оправдано.

Если нечем заполнить второй канал памяти

Вполне возможна ситуация, что по каким-то причинам временно или на достаточно длительный период в наличии окажется только один модуль оперативной памяти и двухканальный режим контроллера памяти окажется недоступным. На сколько упадет производительность?

Заинтересовавшись этим вопросом, мы изменили конфигурацию системы таким образом, что общий объем системной памяти остался прежним, но теперь она начала работать в одноканальном режиме.

Тестовый пакет

DDR2-800

Падение производительности, %

Dual Channel

Single Channel

Futuremark PCMark'05

CPU

7106

7085

-0,30

Memory

4305

4243

-1,44

Graphics

8438

8422

-0,19

CrystalMark

ALU

38003

37974

-0,08

FPU

39188

39080

-0,28

Memory

23469

18564

-20,90

Futuremark 3DMark'06

Mark Score

6126

6120

-0,10

CPU Score

3371

3359

-0,36

SmartFPS.com v1.5, Max Quality, 800x600, fps

Battlefield 2

136,3

134,4

-1,39

Serious Sam 2

113,1

112,1

-0,88

Quake 4

121,5

118,3

-2,63

Prey

148,5

144,7

-2,56

Результат оказался интересным, только полностью синтетический тест действительно заметил изменения в работе оперативной памяти, а остальные приложения потеряли в быстродействии совсем немного, в большинстве случаев на уровне погрешности измерения. Этот результат еще раз подтверждает эффективность контроллера памяти, кэш-памяти L3 и вообще архитектуры AMD K10.

Скорость работы встроенного северного моста

Поскольку мы несколько раз убедились в эффективности всех компонентов процессора, которые являются основной частью встроенного в процессор северного моста, то мы заинтересовались зависимостью производительности системы от тактовой частоты, на которой он работает. Кроме того, в большинстве материнских плат этот параметр задается отдельным множителем, который можно менять. Практическая часть этого исследования окажется интересна любителям разгона, т.к. для успешного оверклокинга процессоров AMD Phenom скорость встроенного северного моста (NB) нужно сначала занижать, а потом на ускоренном процессоре не всегда удается вернуть ей исходное номинальное значение без повышения напряжения и увеличения тепловыделения. Ведет ли это к какому-то уменьшению быстродействия?

В большинстве случаев 800 МГц является минимальным возможным значением, поэтому мы провели ряд тестов в диапазоне 800-1800 МГц с шагом 1x, что соответствует 200 МГц.

Естественно, наиболее чувствительными к скорости работы оказались приложения и режимы, требующие быстрого обмена с оперативной памятью, но даже для них только серьезное замедление NB приводит к ощутимому уменьшению производительности.

Тестовый пакет

NB Frequency

Падение производительности, %

1800 MHz

800 MHz

Futuremark PCMark'05

CPU

7106

6988

-1,66

Memory

4305

3304

-23,25

Graphics

8438

7882

-6,59

CrystalMark

ALU

38003

37502

-1,32

FPU

39188

38819

-0,94

Memory

23469

15284

-34,88

Futuremark 3DMark'06

Mark Score

6126

6028

-1,60

CPU Score

3371

3018

-10,47

SmartFPS.com v1.5, Max Quality, 800x600, fps

Battlefield 2

136,3

105,5

-22,60

Serious Sam 2

113,1

93,4

-17,42

Quake 4

121,5

98,5

-18,93

Prey

148,5

128,3

-13,60

Овеклокерам же не стоит опасаться, если частота встроенного северного моста окажется немного ниже номинала, с другой стороны, и его небольшой разгон не окажет заметного влияния на быстродействие.

Кроме того, в приведены результатах есть погрешность, которая еще сильнее уменьшает влияние скорости встроенного северного моста на общее быстродействие...

Влияние скорости работы HyperTransport

Дело в том, что частью процессорного северного моста является и контроллер шины HyperTransport, которая отвечает за скорость обмена данными с системой. Соответственно с замедлением NB происходит и замедление шины HyperTransport и, те же данные трехмерной сцены, от процессора к видеокарте поступают медленнее. Поэтому мы отдельно решили проверить влияние на быстродействие пропускной способности канала между процессором и системой. Кстати и эта шина в процессе разгона может начать работать чуть медленнее номинала или быть ускорена, хотя в последнем случае нередко требуется увеличение напряжения сигнального уровня.

Благо практически любая материнская плата позволяет управлять скоростью HyperTransport в очень широком диапазоне и независимо от скорости работы встроенного северного моста, который ограничивает только максимум. Поэтому с тестируемым процессором минимальным значением оказалась частота 200 МГц или 1x, что соответствует скорости HyperTransport 400 MT/s, т.к. шина двунаправленная.

Интересно, что нам не удалось заметить большого влияния скорости HyperTransport на быстродействие системы.

Тестовый пакет

HT Frequency

Падение производительности, %

1800 MHz

200 MHz

Futuremark PCMark'05

CPU

7106

7063

-0,61

Memory

4305

4260

-1,05

Graphics

8438

7892

-6,47

CrystalMark

ALU

38003

37915

-0,23

FPU

39188

39084

-0,27

Memory

23469

23450

-0,08

Futuremark 3DMark'06

Mark Score

6126

5527

-9,78

CPU Score

3371

3353

-0,53

SmartFPS.com v1.5, Max Quality, 800x600, fps

Battlefield 2

136,3

134,1

-1,61

Serious Sam 2

113,1

102,1

-9,73

Quake 4

121,5

116,2

-4,36

Prey

148,5

144,4

-2,76

Даже игровые приложения не особо отреагировали на серьезное замедление канала HyperTransport, хотя в целом именно графические приложения показали хоть какую-то важность скорости работы этой шины. Возможно, мы использовали не совсем верный набор тестовых пактов, т.к. результат оказался достаточно неожиданным.

Масштабируемость архитектуры AMD K10

Под масштабируемостью архитектуры мы подразумеваем влияние количества активных процессорных ядер на вычислительную мощь системы. Ведь теоретически добавление каждого нового ядра должно пропорционально увеличивать быстродействие, например, 2 ядра в 2 раза быстрее одного, а 3 ядра – в три и т.д. Но на практике этого не происходит, т.к. с одной стороны появляется эффект конкуренции ядер за ресурсы, начинается деление между ними пропускных способностей внешних и внутренних шин, а также памяти и кэш-памяти. С другой стороны и программное обеспечение, начиная от самой операционной системы, должно уметь работать в многопоточном режиме. Будем считать, что второй пункт условно соблюдается, и проведем тесты.

Как видим, в условиях хорошего распараллеливания выполняемой задачи и малых ее требованиях к системным ресурсам архитектура AMD K10 обеспечивает отличную масштабируемость. В тестовом пакете CrystalMark выполнение математических операций ускоряется прямо пропорционально количеству активных ядер. Примерно такую же линейную зависимость демонстрируют и некоторые другие более ресурсоемкие задачи (например, CPU Test в 3DMark’06), но там уже заметно влияние конкуренции за доступ ядер к системным ресурсам. А вот для мало оптимизированных под многопоточность приложений, наилучшей иллюстрацией которых являются не самые новые игры, в очередной раз доказывается отсутствие заметной пользы от трех- и четырехъядерных процессоров. Последнее, в первую очередь, говорит о том, что покупая уже сегодня компьютер с современным четырехъядерным процессором, таким как AMD Phenom X4 9750, нужно представлять себе возможности приложений, которые будут на нем работать, чтобы не разочароваться в отсутствии видимой пользы от покупки достаточно дорогой системы.

Разгон AMD Phenom X4 9750

И, наконец, приступим к разгону тестируемого процессора, используя ранее разработанную методику.

При напряжении питания 1,44 В процессор удалось заставить стабильно работать только на частоте 2830 МГц, что не так уж и много. Дальнейшее увеличение напряжения только снижало стабильность вследствие резкого увеличения тепловыделения. Не помогла даже замена стандартного для стенда AMD кулера akasa AK-859 на Thermalright SI-128 + VIZO Starlet UVLED120. Вероятнее всего, в столь незначительном разгоне виновен изначально очень большой уровень TDP процессора, а может нам просто попался не совсем подходящий для разгона экземпляр. При этом оперативная память смогла работать на почти номинальной частоте, что позволит повторить такой разгон даже при использовании недорогих модулей.

В итоге, разгон составил всего 18%, с 2,4 ГГц до 2,83 ГГц, давайте посмотрим, как это скажется на производительности системы.

Тестовый пакет

Результат

Прирост производительности, %

Номинальная частота

Разогнанный процессор

Futuremark PCMark'05

CPU

7106

8324

17,14

Memory

4305

4670

8,48

Graphics

8438

8742

3,60

CrystalMark

ALU

38003

44472

17,02

FPU

39188

47164

20,35

Memory

23469

24106

2,71

WinRar, Kb/s

1622

1751

7,95

Futuremark 3DMark'05

Mark Score

11795

11994

1,69

CPU Score

15992

16839

5,30

Futuremark 3DMark'06

Mark Score

6126

6220

1,53

CPU Score

3371

3857

14,42

SmartFPS.com v1.5, Max Quality, 800x600, fps

Battlefield 2

136,3

147,9

8,51

Serious Sam 2

113,1

123,8

9,46

Quake 4

121,5

130,4

7,33

Prey

148,5

157,3

5,93

Конечно, приятно получить до 20% «бесплатной» производительности, но может оказаться, что увеличение тепловыделения и, вследствие, шумности системы охлаждения, того не стоят, особенно если большую часть времени вы занимаетесь серфингом в сети и просмотром фильмов. Но если производительность важна, то перед разгоном старших AMD Phenom следует позаботиться о серьезном улучшении их охлаждения, желательно без лишнего шума.

Итог

Процессор AMD Phenom X4 9750, особенно его версию с тепловым пакетом до 95 Вт, можно смело рассматривать как интересную альтернативу «хитовому четырехъядернику» Intel Core 2 Quad Q6600, особенно если вы негативно относитесь к разгону. При этом вы сможете даже немного сэкономить на всей системе в сборе, не заметив особой разницы производительности в большинстве задач, а в чем-то, возможно, даже получите превосходство. Но, собирая компьютер с четырехъядерным процессором, следует представлять задачи, для которых он будет использоваться. Ведь вполне вероятна ситуация, что вы не сможете эффективно использовать весь его архитектурный потенциал, и тогда значительно больше пользы будет от «обычного» двухъядерного процессора с большей тактовой частотой или, даже, большего объема оперативной памяти или более быстрого графического адаптера.

Автор: Александр Черноиван

Выражаем благодарность фирме ООО ПФ Сервис (г. Днепропетровск) за предоставленное для тестирования оборудование.

-->
Статья прочитана раз(а)
Опубликовано : 29-09-2008
Подписаться на наши каналы
telegram YouTube facebook Instagram