Сравнение GeForce RTX 4070 с видеопамятью GDDR6 и GDDR6X: все так плохо?
16-01-2025
В конце августа этого года компаниями NVIDIA подтвердила слухи и официально представила обновленную версию GeForce RTX 4070, отличающуюся использованием более медленной видеопамяти GDDR6 вместо GDDR6X.
Некоторые надеялись, что вместе с этим уменьшится и рекомендованная стоимость графических ускорителей, однако она осталась точно такой же, как и все остальные характеристики. Как отразилось использование чипов другого типа на производительности?
Давайте сначала выясним: что было и какие изменения произошли. Со старта своего жизненного цикла GeForce RTX 4070 базируется на чипе AD104 архитектуры Ada Lovelace, который производится по 5-нм техпроцессу TSMC. Он состоит из 46 SM-блоков, то есть насчитывает 5888 CUDA-ядер, по 184 тензорных ядра и текстурных модуля, 64 блока растеризации и 46 RT-ядер. Работает это все на базовой частоте 1920 МГц с гарантированным бустом до 2475 МГц, но можно увидеть и больше при определенных условиях. Для связи с видеопамятью используется 192-битная шина, а уменьшить количество запросов к VRAM должен 36-мегабайтный кэш второго уровня. Именно представленная в апреле 2023 версия видеокарт комплектовалась чипами памяти GDDR6X, которые работали с эффективной частотой 21 гигабит в секунду на контакт, что обеспечивает пропускную способность свыше 504 ГБ/с.
Обновленная же версия RTX 4070, скажем так "улучшенная", в кавычках, базируется на модифицированной версии GPU AD104. Однако изменения касаются только контроллера памяти, научившего работать с чипами GDDR6, а все остальные характеристики как по количеству исполнительных блоков, так и по рабочим частотам остались неизменными. Однако более простая и потенциально более дешевая VRAM работает несколько медленнее: эффективная рабочая частота теперь 20 гигабит в секунду, и это довольно быстро как для GDDR6, однако все равно привело к уменьшению пропускной способности до 480 ГБ/с, то есть на 4,8%. Теоретически это и есть основное отличие, которое, разумеется, повлияет на конечную производительность. На сколько? Сразу тяжело сказать, потому что обычно чипы более простой организации имеют немного меньшие внутренние задержки. Поэтому нужно тестировать: где более важна пропускная способность, а где – более быстрый доступ.
И в заключение напомним. Для связи с системой обе версии RTX 4070 используют 16 линий PCI Express 4.0, а энергопотребление эталонных видеокарт находится на уровне 200 Вт. Понятно, что эти видеокарты поддерживают все актуальные графические интерфейсы и фирменные технологии, не будем их перечислять
ASUS DUAL-RTX4070-O12G-EVO и ASUS DUAL-RTX4070-O12GD6-EVO
Теперь немного о самых испытуемых графических адаптерах, найти которые было довольно непросто. Дело в том, что, хотя свежие ревизии ускорителей довольно быстро попали в розницу, да еще обычно за большие деньги, чем предыдущие, но именно максимально похожие модели были редкими. Не хотелось сравнивать видеокарты с разным заводским ускорением, разной элементной базой, а также системами охлаждения разной эффективности. И без этого разница в производительности может быть на уровне погрешности.
И вот в Telemart.ua мы заметили два максимально схожих графических ускорителя ASUS GeForce RTX 4070 DUAL EVO OC, которые, на первый взгляд, отличались лишь типом примененных микросхем видеопамяти. Так что благодарим магазин за интересные сэмплы!
Правда, более старая ревизия с GDDR6X нам досталась последняя, уже со статусом «восстановленная продавцом». Кстати, на Телемарте можно найти много предложений с уценкой, цены на которые выглядят заметно вкуснее по сравнению с совершенно новыми комплектующими. При этом по меньшей мере полученная на тесты видеокарта имеет хороший внешний вид, разве что наклейки не сохранились, а вот заглушки все на месте. И в комплекте таких предложений обычно есть все необходимое. Единственное ограничение – гарантия 3 месяца. Однако при желании за дополнительную плату гарантийный срок можно продлить. Так что рисковать и экономить или нет – решать вам.
Что касается этих видеокарт ASUS GeForce RTX 4070 DUAL EVO OC, то это довольно компактные модели длиной чуть более 227 мм и высотой 123, а толщиной 2,5 слота, что делает их совместимыми даже с компактными системами. Поскольку это представительницы бюджетной серии, то у печатной платы нет расширенного функционала, только необходимое, а за охлаждение отвечает довольно простой кулер.
Радиатор на тепловых трубках последнего продувается парой фирменных вентиляторов Axial-tech на двух шарикоподшипниках, останавливающихся в моменты низкой нагрузки. Дополнительное питание тоже простое – обычный 8-контактный разъем PCI-E. Как видно из названия, обе модификации имеют небольшой заводской разгон до 2550 МГц в бустовом режиме. А вот видеопамять на каждой из карт работает с эталонными частотами. Вот ее влияние на производительность и будем исследовать.
Однако уже во время тестов мы заметили и различия между этими графическими ускорителями – они состоят в настройках системы охлаждения.
На видеокарте с GDDR6X пропеллеры раскручиваются медленнее и позволяют графическому процессору быть более горячим.
В то время как на более новой модификации настройки вентиляторов более агрессивные, что под стрессовой нагрузкой обеспечивает меньшую на 10 градусов температуру, но саму видеокарту уже можно услышать из системного блока, если прислушаться. Это также может влиять на рабочие частоты GPU, однако в игровых сценариях использования обычно разницы не было плюс минус погрешность, несмотря на заметно меньшие температуры новинки, что вы увидите дальше.
Однако сначала несколько слов о тестовом стенде.
Тестовый стенд
В его основе был 8-ядерный 16-поточный игровой процессор Ryzen 7 7800X3D с большим 96-мегабайтным 3D-кэшем.
Охлаждением CPU занималась трехсекционная СЖО LIAN LI Galahad II Trinity 360 с яркой ARGB-подсветкой на вентиляторах и водоблоке.
Основой платформы выступила материнская плата AsRock X670E Taichi.
Оперативную память представлял комплект из пары модулей по 16 ГБ – Kingston FURY Renegade RGB DDR5 с быстродействием в 6400 мегатранзакций в секунду. Тайминги составляют 32-39-39, а рабочее напряжение ограничено планкой в 1,4 В. Выглядит оперативка стильно, современно, агрессивно благодаря бело-черным алюминиевым радиаторам и 12-точечной подсветке.
Операционную систему, игры и программы хранил PCI-E 4.0 x4 SSD-накопитель Kingston NV3 объемом 2 ТВ. Его показатели последовательной записи и считывания данных достаточно высокие – 5000 и 6000 МБ в секунду соответственно. Больше информации о нем можно получить в нашем обзоре.
Питал систему 850-ваттный Seasonic PRIME PX-850, соответствующий сертификату 80 Plus Platinum. Есть в ассортименте производителя и более актуальная серия Seasonic VERTEX с поддержкой новейших стандартов АТХ 3.0 и PCI-E 5.0, поэтому рекомендуем обратить внимание и на нее.
Собрали все эти компоненты в единую систему с помощью довольно необычного корпуса LIAN LI SUP01, который предлагает видеокарты устанавливать на передней панели.
Тесты. Синтетика.
А теперь переходим к тестам. И, традиционно, начнем с синтетики. Тем более она интересна великолепной повторяемостью результатов.
Различные подтесты 3DMark фиксируют скудное преимущество до 1% более старой модификации GeForce RTX 4070 с GDDR6X над обновленной версией. Разве что подтест Steel Nomad в режиме DirectX 12 нарушил это правило. Дважды перезапускали, а результат плюс-минус погрешность такой же. Неужели будут-таки сценарии, где меньшие задержки окажутся важнее? То ли влияние каких-либо других факторов?
Но графический подтест бенчмарка Cinebench 2024 предпочитает модификацию с более быстрыми чипами памяти, причем разница в производительности составляет несколько процентов, что как бы уже не так и мало.
Еще один тяжелый рабочий тест, Blender, тоже любит высокую пропускную способность VRAM: версия с GDDR6X обходит GDDR6 на 3-5%. И именно в более тяжелых сценах преимущество самое большое.
Однако алгоритмы искусственного интеллекта в Geekbench AI, похоже, не столь зависимы от пропускной способности видеопамяти, а вот на задержки реагируют. Поэтому в целом обе карты показывают одинаковые результаты, и погрешность чаще идет в пользу GDDR6-версии.
Подтверждает наблюдение и обработка с помощью ИИ-алгоритмов тестового видео в Topaz Video AI, где эффективность видеокарт, будем считать, идентичная: где-то на процент быстрее одна, а в других случаях на столько же другая. Все находится в рамках статистической погрешности.
Как видим, некоторое замедление видеопамяти в RTX 4070 вследствие перехода на GDDR6 только в действительно трудных и объемных задачах привело к падению производительности до пяти с лишним процентов, а в более простых программах разницу заметить почти невозможно. Вот только игры мы бы отнесли тоже к ресурсоемким приложениям, поэтому предполагаем примерно такой же результат, но его надо проверить.
Сравнение в играх
И вот с проверкой в играх получилось не все так просто, потому что нередко именно погрешность в один-два FPS туда-сюда от запуска до запуска теста меняла ситуацию. Потому решили каждую игру записать минимум три раза и для сравнения взять ближайший к средним результатам проход. Конечно, все тесты проводились в актуальном разрешении Quad HD.
Такой подход позволил в Alan Wake 2 с «Высоким» пресетом графики и «Высокой» трассировкой лучей, которые ускорены «Качественным» режимом DLSS, получить идентичные показатели производительности по средней частоте кадров, немного лучшие показатели по 1% low в пользу GDDR6-версии, но стабильно худшие очень редкие события на нем же. Однако ощущения от игры на обеих версиях 4070 были одинаковые, без мониторинга и других утилит разве что по скорости вентиляторов удалось бы идентифицировать, какая именно сейчас карта в системе.
Ультраграфика в Baldur's Gate 3 с API Vulkan позволили по средней частоте кадров и редким событиям более старой видеокарты с более быстрой GDDR6X вырваться вперед на 2%, что лишь на каплю больше статистической погрешности. Однако все три тестовых записи имели худшие показатели 0.1% Low именно на ней, что ощущалось как чуть более частые подтормаживания, которые, в целом, характерны этой игре на любой системе. Однако общие впечатления обе карты обеспечили почти одинаковые – если не концентрировать внимание, разницу не видно.
Совершенно такая же ситуация наблюдалась и у бенчмарка Black Myth: Wukong с «очень высокой» графикой и такими же лучами, которые ускорены DLSS и генератором кадров. По средней частоте кадров и по статистике 1% Low впереди RTX 4070 с GDDR6X буквально на 1 и 2 FPS. Но по очень редким событиям небольшое преимущество имеет более свежая карта с GDDR6. Вероятно, именно так влияют на быстродействие меньшие внутренние задержки последней.
Теперь запускаем Cyberpunk 2077 с самыми тяжелыми и ресурсоемкими настройками, то есть «Ультра» пресет графики с максимальной трассировкой лучей и генератором кадров. Последний тоже нуждается в дополнительной VRAM. Чтобы частота обновления экрана была стабильно выше 60 FPS, добавляем DLSS в качественном режиме. И что? По средней частоте кадров паритет. По редким событиям скудное преимущество GDDR6X. А по очень редким снова косметически впереди GDDR6. Но сам геймплей в обоих случаях совершенно одинаково ощущается.
Какое-то разнообразие внесла Dragon Age: The Veilguard с честными «Ультра» настройками, без апскейлеров, потому что и так ускорители обеспечили достойную производительность. На этот раз более старая версия RTX 4070 из GDDR6X всегда была на несколько кадров в секунду лучше, в том числе и по статистике очень редких событий. Однако без мониторинга и сидящего рядом товарища, который будет считать подергивание, разницу почувствовать крайне сложно.
Такие же тенденции наблюдаются и в бенчмарке Forza Horizon 5 с «Экстремальной» графикой. В этой игре GDDR6X также обеспечил лучшие показатели по всем параметрам. Преимущество над GDDR6 колеблется в диапазоне от почти 1% до 8,5 по очень редким событиям. Однако визуально плавность обновления картинки на обоих ускорителях примерно одинаковая.
Возможно, это тенденция, потому что в Ghost of Tsushima с просто «очень высокими» настройками графики, без апскейлеров и генераторов, снова модификация с GDDR6X уверенно впереди. Причем не только по средней частоте кадров и редким событиям, но и стабильно по показателю 0,1% low. Правда, в геймплее эти теоретически более частые и сильные подтормаживания критически не ощущаются, их больше фиксирует мониторинг.
Достаточно ресурсоемкая Horizon: Forbidden West на «Очень высоких» настройках графики, способных съедать более 10 ГБ видеопамяти, имеет приятный геймплей без применения технологий ускорения частоты кадров. И, что интересно, на обеих версиях RTX 4070 показатели мониторинга фактически одинаковые, как и ощущения от геймплея.
Еще тяжелее Senua's Saga: Hellblade II, хотя и менее требовательная к объему видеопамяти, на «Высоком» пресете, чтобы отображать в среднем более 60 кадров в секунду, требует активации и DLSS в качественном режиме. С такими настройками визуально графические ускорители обеспечивают одинаковую производительность. И только мониторинг свидетельствует о более хорошей статистике длинных и очень длинных кадров на модификации с GDDR6.
Чтобы пробежаться в Silent Hill 2 на «Эпической» графике с аппаратной трассировкой лучей, пришлось активировать апскейлер в качественном режиме. Теперь именно на новой модификации 4070 с GDDR6 мы почему-то постоянно получали несколько подергиваний, которые фиксировал мониторинг, однако в целом оба ускорителя обеспечивали схожую производительность и ощущение от геймплея.
И в заключение Ведьмак 3 с пресетом графики RT Ultra, показатели в котором пришлось подтягивать с помощью качественного апскейлера и генерации кадров. При таких условиях именно версия с GDDR6X оказалась несколько производительнее: почти на 4% по средней частоте кадров и на заметные 12-20% по статистике очень длинных и просто длинных кадров. Опять же несколько раз проезжали по одному и тому же маршруту, а на более новой модификации 4070 подтормаживания не исчезали. Возможно, мы были недостаточно упорным и с пятой или десятой попытки удалось бы получить лучший результат, но, по факту, это единственная игра, где мы почувствовали разницу между видеокартами и без наблюдения за мониторингом.
Итоги
По результатам нашего исследования мы фиксируем незначительное падение производительности обновленных графических ускорителей на GeForce RTX 4070 вследствие перевода их на чуть менее быструю видеопамять стандарта GDDR6. Однако особенно это можно ощутить только в тяжелых ресурсоемких приложениях, активно использующих VRAM, где потеря быстродействия может быть более 5%. Согласитесь, что за те же деньги получать меньше не очень приятно, тем более, когда это можно увидеть на практике.
С другой стороны, более простые программные пакеты и даже игры, в том числе жадные к видеопамяти, в большинстве случаев остались безразличными к типу использованных чипов и их эффективной скорости. На практике без мониторинга редко удалось заметить разницу между этими модификациями графических ускорителей. Возможно, именно поэтому NVIDIA и оставила рекомендованную стоимость без изменений. Но вы, уважаемые зрители, теперь знаете, что при выборе RTX 4070 сейчас стоит обратить внимание и на тип видеопамяти, потому что старая версия из GDDR6X будет капельку производительнее, где-то на процент-другой, а где-то и на все пять, плюс в большинстве случаев именно на ней геймплей окажется немного плавнее. Однако это все при условии одинаковой стоимости графических ускорителей. В других случаях целесообразнее будет выбрать тот более дешевый вариант.
Автор: Александр Черноиван
Опубликовано : 16-01-2025
Подписаться на наши каналы | |||||
![]() |
![]() |
![]() |
![]() |