NVIDIA готовит новый NVLink работающий со скоростью света
Во время конференции по технологиям графических процессоров (GTC) в Китае мистер Билл Далли, главный научный сотрудник NVIDIA и старший вице-президент по исследованиям, рассказал много интересного о том, как компания планирует продвигать будущее высокопроизводительных вычислений, искусственного интеллекта, графики, здравоохранения и периферийных вычислений. Мистер Далли рассказал об исследованиях NVIDIA и о том, каково видение будущего ее продуктов. Среди представленных наиболее интересных вещей был план отказаться от стандартной передачи электрических данных и использовать скорость света для масштабирования и улучшения связи между узлами. Новая технология, использующая передачу данных по оптике, должна значительно увеличить скорость и объем данных, так необходимый для взаимодействия.
Компания предлагает использовать оптический эквивалент NVLink. В то время как текущий чип NVLink 2.0 использует восемь пикоджоулей на бит (8 пДж/б) и может отправлять сигналы только на 0,3 метра без каких-либо повторителей, оптическая замена способна отправлять данные на расстояние от 20 до 100 метров, потребляя в половину меньше энергии ( 4 пДж/б). NVIDIA разработала концепцию системы с четырьмя графическими процессорами в стеке, все из которых соединены по оптике. Для питания такой установки используются лазеры, которые производят 8-10 длин волн. Эти длины волн модулируются на нем со скоростью 25 Гбит/с на длину волны с использованием кольцевых резонаторов. На приемной стороне используются кольцевые фотодетекторы, которые регистрируют длину волны и отправляют ее на фотодетектор. Этот метод обеспечивает быструю передачу данных на большие расстояния.
Чтобы все это работало вместе, NVIDIA необходимо создать решение объединяющее оптическую систему передачи с обвязкой чипов. На изображении ниже показана установка, в которой комбинация графического процессора и памяти установлена на кремниевом переходнике, который, в свою очередь, расположен поверх корпуса. Этот корпус подключен к фотонной интегральной схеме (PIC). Кроме того, имеется микросхема электрического интерфейса (EIC), которая с помощью резонаторов преобразует электрические сигналы, поступающие от графического процессора, в оптические сигналы. Для оптического межкомпонентного соединения необходим переключатель аналогичной конструкции.
Используя эти методы, NVIDIA заявляет, что в будущем могут появиться системы с тысячами взаимосвязанных графических процессоров, каждый из которых взаимодействует с другим, используя скорость света. Выход технологии на рынок - лишь вопрос времени, однако никаких гарантий нет, так как пока это всего лишь исследовательский проект.
https://www.techpowerup.com
Паровышник Валерий
NVIDIA RTX A6000 – новый профессиональный графический ускоритель с 48 ГБ памяти
Компания NVIDIA представила новый профессиональный графический ускоритель RTX A6000 на микроархитектуре Ampere. Его анонс также обозначил конец важной эпохи – NVIDIA отказалась от брендов Quadro и Tesla в своих продуктах. Линейка NVIDIA RTX Axxx пришла на смену Quadro, а в будущем нас ждет релиз серии NVIDIA Axx (A40 – первый представитель), которая заменит Tesla.
В основе нового графического ускорителя лежит GPU GA102 в полноценном его варианте с поддержкой 10 752 ядер CUDA (10496 в составе GA102-300 у RTX 3090). Пиковая его производительность одиночной точности достигает 38,7 TFLOPS (35,6 TFLOPS у RTX 3090).
Объем памяти GDDR6 с ECC-коррекцией составляет 48 ГБ. Другие характеристики видеопамяти не сообщаются. Также NVIDIA RTX A6000 обладает поддержкой внутреннего интерфейса PCIe 4.0 x16, NVLink и четырех внешних портов DisplayPort 1.4. Максимальное энергопотребление достигает 300 Вт, а за охлаждение отвечает кулер активного типа с одним вентилятором.
Рекомендованная стоимость новинки составляет $4650.
https://videocardz.com
https://www.nvidia.com
Сергей Будиловский
Первые фото NVIDIA GeForce RTX 3080?
На китайском портале Chiphell появились предположительно первые фотографии видеокарты NVIDIA GeForce RTX 3080. Их достоверность пока под вопросом. Это могут быть прототипы или инженерные образцы новой видеокарты либо просто возможные варианты дизайна (не обязательно финальные). Также неизвестно, является ли они творением компании NVIDIA или одного из ее партнеров.
Но в целом дизайн выглядит очень стильно и оригинально, если не обращать внимание на перевернутую вверх тормашками надпись «RTX 3080». Система охлаждения получила массивный радиатор с одним вентилятором. И пусть вас не пугает синий цвет верхней модели – это всего лишь защитная лента на серебристом ободке.
Также в дизайне не видно дополнительных коннекторов питания. Наверняка они переместились на боковую сторону. Возможно, новинка получила и новую версию интерфейса NVLink. Одним словом, выглядит интересно – посмотрим, не является ли это фейком.
https://videocardz.com
Сергей Будиловский
NVIDIA представила графический процессор GA100 на базе 7-нм микроархитектуры Ampere
Изначально анонс 7-нм микроархитектуры Ampere был запланирован в рамках GPU Technology Conference (GTC 2020), но из-за пандемии COVID-19 его перенесли на май. Флагманским GPU этой серии является NVIDIA GA100. Он создан на фабрике TSMC с использованием техпроцесса N7P.
Площадь кристалла составляет 826 мм2, а внутри него скрывается 54 млрд транзисторов. Структурно NVIDIA GA100 включает в себя:
- 108 потоковых мультипроцессоров
- 6912 ядер CUDA FP32 (одинарной точности)
- 3456 ядер CUDA FP64 (двойной точности)
- 432 ядер Tensor третьего поколения с поддержкой FP64
На подложке с GPU находится 40 ГБ стековой памяти HBM2E с 6144-битной шиной и пропускной способностью 1,6 ТБ/с. Общая производительность достигает впечатляющих масштабов:
- 19,5 TFLOPS (FP32 classic)
- 9,7 TFLOPS (FP64 classic)
- 19,5 TFLOPS для ядер Tensor (FP64)
- 156 TFLOPS (FP32 с использованием нейросети)
- 312 TFLOPS (FP16 с использованием нейросети)
Новинка поддерживает работу с двумя внутренними интерфейсами: PCIe 4.0 x16 (64 ГБ/с) и NVLink (600 ГБ/с). Типичное энергопотребление GPU достигает 400 Вт для видеоускорителя в формате SXM. NVIDIA GA100 ляжет в основу нового поколения графических ускорителей для HPC и дата-центров. NVIDIA также подтвердила использование микроархитектуры Ampere в игровых видеокартах линейки GeForce нового поколения.
https://www.techpowerup.com
Сергей Будиловский
Обзор видеокарты INNO3D GeForce RTX 2070 SUPER ICHILL BLACK: для ценителей СВО
Август 2018 года стал знаменательным для игровой индустрии, ведь вместе с 12-нм микроархитектурой NVIDIA Turing с ее ядрами Tensor и RT дебютировали технологии Ray Tracing и DLSS. Спустя почти 2 года они все еще остаются эксклюзивом NVIDIA. Согласно последним слухам, официальный анонс видеокарт AMD Radeon RX Navi 2X на базе микроархитектуры RDNA 2 с аппаратной поддержкой рейтрейсинга состоится только в августе или сентябре этого года.
Именно RDNA 2 лежит в основе графики консолей нового поколения от Microsoft и Sony. Также она обеспечит видеокарты AMD полноценной поддержкой DirectX 12 Ultimate вместе с трассировкой лучей и VRS.
Тем временем линейка GeForce RTX 20 уже сейчас обладает поддержкой DirectX 12 Ultimate. Более того, недавно NVIDIA анонсировала технологию Deep Learning Supersampling 2.0 (DLSS 2.0). Она призвана улучшить производительность в играх при сохранении приемлемого качества изображения. Для этого она производит рендеринг 3D-сцены в меньшем разрешении, а затем масштабирует и реконструирует полученную картинку до заданного разрешения с помощью алгоритмов нейронной сети.
Среди других улучшений DLSS 2.0 стоит выделить:
- более эффективное использование ядер Tensor (если таковые имеются в составе GPU);
- ускоренную работу (в 2 раза по сравнению с первой версией DLSS);
- три режима на выбор: Quality, Balanced (1:2) и Performance (1:4) – в скобках указано соотношение разрешения рендеринга к разрешению экрана.
В данный момент поддержка DLSS 2.0 заявлена для четырех игр: Control, Wolfenstein: Youngblood, MechWarrior 5: Mercenaries и Deliver Us The Moon. Со временем их количество будет расти. Пользователям же необходимо установить драйвер GeForce Game Ready 445.75 WHQL или последующие версии, чтобы активировать DLSS 2.0.
Таким образом, пока фанаты AMD преданно ждут на появление Ray Tracing в новом поколении видеокарт, обладатели решений от NVIDIA уже наслаждаются его преимуществами. Сегодня мы познакомим вас с очень интересной версией NVIDIA GeForce RTX 2070 SUPER с предустановленной системой жидкостного охлаждения – INNO3D GeForce RTX 2070 SUPER ICHILL BLACK. Для начала взглянем на ее характеристики.
Спецификация
Модель |
INNO3D GeForce RTX 2070 SUPER ICHILL BLACK (C207SB-08D6X-11800004) |
GPU |
NVIDIA TU104-410 |
Микроархитектура |
NVIDIA Turing |
Техпроцесс, нм |
12 |
Количество ядер CUDA |
2560 |
Количество текстурных блоков |
160 |
Количество растровых блоков |
64 |
Количество тензорных ядер |
320 |
Количество ядер RT |
40 |
Базовая / динамическая частота GPU, МГц |
1605 / 1815 |
Эффективная частота памяти, МГц |
14000 |
Объем памяти, ГБ |
8 |
Тип памяти |
GDDR6 |
Ширина шины памяти, бит |
256 |
Пропускная способность памяти, ГБ/с |
448 |
Тип шины |
PCI Express 3.0 x16 |
Интерфейсы вывода изображения |
1 x HDMI 2.0b |
Минимальная мощность блока питания, Вт |
650 |
Дополнительные разъемы питания PCIe |
1 х 8-контактный 1 x 6-контактный |
Размеры видеокарты с официального сайта (согласно измерениям в нашей тестовой лаборатории), мм |
272 x 112 (280 х 114 x 42) |
Размеры радиатора, мм |
277 x 120 x 37 |
Драйверы |
Свежие драйверы можно скачать с сайта компании INNO3D или сайта производителя GPU |
Сайт производителя |
Упаковка и комплектация
Видеокарта поставляется в крупной картонной коробке с качественной полиграфией и удобной ручкой для транспортировки. На ее сторонах можно ознакомиться с внешним видом графического адаптера и ключевыми его особенностями.
Внутри все компоненты надежно зафиксированы в пластиковой форме, что исключает их повреждение в процессе транспортировки.
В комплекте поставки мы обнаружили стандартную документацию, диска с ПО, набор винтов и шайб, а также большой и качественный коврик для мышки.
Внешний вид
INNO3D GeForce RTX 2070 SUPER ICHILL BLACK получила оригинальный дизайн по сравнению с обычными модификациями с воздушным охлаждением. Лицевая ее сторона полностью скрыта под пластиковым черно-серым кожухом. В центре расположился цветной дисплей, который является не только дизайнерским элементом, но и позволяет мониторить температуру, частоту вращения вентиляторов и состояние видеокарты либо просто выводить изображения.
Еще одним интересным элементом является логотип ICHILL BLACK с подсветкой на верхней грани. Хотя из-за экрана эту модель так и хочется установить в корпус вертикально.
Обратная сторона печатной платы также находится под защитой. Тут установлена интересная пластиковая пластина с ячеистой структурой. Она несет в себе исключительно декоративную функцию. А наклейка на ней не позволит разобрать видеокарту без потери гарантии.
Питание видеоускорителя обеспечивает слот PCI Express х16 и два дополнительных разъема PCIe. Кулер слегка затрудняет отключение кабелей питания.
Для вывода изображения используется следующий набор интерфейсов:
- 1 х HDMI 2.0b;
- 3 х DisplayPort 1.4.
Максимальное разрешение составляет 7680 х 4320.
Возле интерфейсной панели находится коннектор для подключения мостика NVIDIA NVLink.
В основе видеоускорителя лежит 12-нм GPU NVIDIA TU104-410. Базовая его частота составляет 1605 МГц, а динамическая достигает 1815 МГц, что на 2,5% выше эталонного показателя 1770 МГц.
Видеопамять набрана из GDDR6-микросхем компании Micron общим объемом 8 ГБ. Они работают на эталонной эффективной частоте 14 000 МГц. Обмен данными между графическим ядром и памятью осуществляется через 256-битную шину, которая способна пропускать 448 ГБ информации за секунду.
Система охлаждения
Для охлаждения INNO3D GeForce RTX 2070 SUPER ICHILL BLACK используется предустановленная СЖО с замкнутым контуром от компании ARCTIC. Видеокарта занимает ровно два слота расширения и имеет общую длину 272 мм согласно официальному сайту.
У нас не было возможности разбирать видеоускоритель, поэтому о внутренней конструкции можно судить исключительно по изображению с официального сайта. Помпа расположена неподалеку от графического ядра, на котором находится водоблок с медным основанием. Вся конструкция соединена между собой трубками и зафиксирована на металлической пластине.
За охлаждение элементов подсистемы питания и чипов видеопамяти отвечает эта же пластина, которая контактирует с ними через термопрокладки.
Помпа соединена с радиатором при помощи двух гибких шлангов в оплетке длиной 36 см.
Радиатор размером 277 x 120 x 37 мм выполнен из алюминия, а крепежная рама – из стали. Конструкция представляет собой 14 продольных каналов для циркуляции хладагента, между которыми впаяно множество ребер ленточного типа. Плотность ребер на дюйм достигает 19 FPI. Крепежная рама имеет два набора отверстий для установки пары 120-мм вентиляторов спереди и сзади.
За обдув радиатора отвечает пара фирменных вентиляторов ARCTIC P12 PWM без подсветки. В их основе лежит гидродинамический подшипник. Согласно официальным данным, вертушки поддерживают ШИМ-регулировку и скорость вплоть до 1800 об/мин. Максимальный воздушный поток составляет 56,3 CFM (95,65 м3/ч).
Крепление вентиляторов к радиатору осуществляется с помощью комплектных винтов с крестообразной головкой. Сами они подключены друг к другу и к видеокарте по единственному 4-контактному проводу.
При автоматическом регулировании скорости вращения лопастей вентиляторов, в режиме максимальной нагрузки, графическое ядро нагрелось до 55°С при критическом показателе 88°С. Пропеллеры работали на скорости 970 об/мин. По субъективным ощущениям шум был низким.
Для сравнения возьмем видеокарту Palit GeForce RTX 2070 SUPER JS с 2,7-слотовым 2-вентиляторным воздушным кулером. В аналогичном режиме ее GPU нагревался до 65°С и работал на более низкой частоте: 1785 против 1860 МГц.
В режиме максимальной частоты вращения лопастей вентиляторов (1800 об/мин) температура GPU опустилась до 43°С. Шум достиг среднего уровня, но остался комфортным для постоянного использования. Кулер оппонента в аналогичном режиме смог охладить GPU до 54°С. Частота его работы опять была ниже: 1815 против 1905 МГц.
Теперь посмотрим на поведение видеокарты при реальной игровой нагрузке. Для начала мы запустили Assassin’s Creed Odyssey в разрешении Full HD. Максимальная температура составила 53°С при скорости работы вертушек в 1006 об/мин. Частота ядра в пике достигала 1965 МГц.
Переход в разрешение 4K особо не повлиял на поведение видеокарты. Скорость работы системы охлаждения уменьшилась до 760 об/мин, а частота ядра осталась на том же уровне 1965 МГц. С шумом проблем не было.
При отсутствии нагрузки частоты работы графического ядра и памяти автоматически понижались, позволяя снизить энергопотребление и тепловыделение видеоускорителя в целом. В таком режиме температура GPU не превышала 35°С, а система охлаждения работала в пассивном режиме.
Отдельно проверили, как поведет себя система охлаждения внутри корпуса Cooler Master MasterBox MB510L (MCB-B510L-KANN-S00) при максимальной скорости вращения вентиляторов. Разница с открытым стендом составила всего 2°С.
В целом система охлаждения модели INNO3D GeForce RTX 2070 SUPER ICHILL BLACK показала себя просто отлично. Она обладает огромным запасом по мощности как для обычной повседневной эксплуатации, так и для разгонных экспериментов.
Очень понравился приемлемый уровень шума при максимальной скорости вращения вертушек. Если же оставить их в автоматическом режиме, то видеокарту вообще не слышно, зато сама она работает при более высоких тактовых частотах.
Огорчил лишь неприятный периодический писк дросселей во время высокой нагрузки на видеокарту.
NVIDIA Tesla V100s – самый быстрый графический ускоритель для рабочих задач
NVIDIA представила свой самый быстрый графический ускоритель в серии Tesla V100. Он создан для использования в составе систем HPC, чтобы ускорить симуляцию исследовательских проектов и обучение искусственного интеллекта.
Новинка создана в формате карты расширения с интерфейсом PCIe. NVIDIA не сообщает подробности GPU модели Tesla V100s. Скорее всего, речь идет о 12-нм NVIDIA GV100 (Volta), который лежит в основе двух других ускорителей серии Tesla V100. Бонус производительности достигается за счет повышения эффективной частоты видеопамяти HBM2 с 876 до 1106 МГц. В итоге пропускная способность памяти поднялась с 900 до 1134 ГБ/с. Производительность увеличилась на 16-17% по сравнению с моделью NVIDIA Tesla V100 (PCIe).
Стоимость новинки не сообщается. Сводная таблица технической спецификации графического ускорителя NVIDIA Tesla V100s:
Модель |
NVIDIA Tesla V100s (PCIe) |
NVIDIA Tesla V100 (PCIe) |
NVIDIA Tesla V100 (NVLink) |
Тип видеопамяти |
HBM2 |
||
Объем, ГБ |
32 |
16 / 32 |
16 / 32 |
Эффективная частота, МГц |
1106 |
876 |
876 |
Разрядность шины, бит |
4096 |
||
Пропускная способность, ГБ/с |
1134 |
900 |
900 |
Внутренний интерфейс |
PCIe |
PCIe |
NVLink |
Пропускная способность внутреннего интерфейса, ГБ/с |
32 |
32 |
300 |
Пиковая производительность двойной точности, TFLOPS |
8,2 |
7 |
7,8 |
Пиковая производительность одинарной точности, TFLOPS |
16,4 |
14 |
15,7 |
Пиковая производительность в сценариях глубинного обучения, TFLOPS |
130 |
112 |
125 |
Максимальная мощность потребления, Вт |
250 |
250 |
300 |
https://www.techpowerup.com
https://www.nvidia.com
Сергей Будиловский
Обзор видеокарты ASUS Dual GeForce RTX 2080 Ti: экономим на покупке флагмана
В начале июля 2019 года компания NVIDIA пополнила линейку своих видеокарт тремя моделями серии GeForce RTX 20 SUPER. Причем NVIDIA GeForce RTX 2060 SUPER будет существовать параллельно с GeForce RTX 2060, а GeForce RTX 2070 SUPER и GeForce RTX 2080 SUPER заменят на рынке GeForce RTX 2070 и GeForce RTX 2080. А вот роль флагмана текущего поколения пока что сохранится за GeForce RTX 2080 Ti.
И пока мы ожидаем эти новинки на тестирование, решили познакомить вас с видеокартой ASUS Dual GeForce RTX 2080 Ti. Она может похвастать относительно небольшими габаритами и самой доступной стоимостью в модельном ряду компании ASUS. Давайте же для начала взглянем на ее характеристики.
Спецификация
Модель |
ASUS Dual GeForce RTX 2080 Ti (DUAL-RTX2080TI-11G) |
GPU |
NVIDIA TU102-300A |
Микроархитектура |
NVIDIA Turing |
Техпроцесс, нм |
12 |
Количество CUDA-ядер |
4352 |
Количество текстурных блоков |
272 |
Количество растровых блоков |
88 |
Количество тензорных ядер |
544 |
Количество ядер RT |
68 |
Номинальная / динамическая частота графического ядра, МГц |
1350 / 1545 («Gaming») 1350 / 1560 («OC») |
Эффективная частота памяти, МГц |
14000 |
Объем памяти, ГБ |
11 |
Тип памяти |
GDDR6 |
Ширина шины памяти, бит |
352 |
Пропускная способность памяти, ГБ/с |
616 |
Тип шины |
PCI Express 3.0 x16 |
Внешние интерфейсы |
1 x USB Type-C |
Минимальная мощность блока питания, Вт |
650 |
Дополнительные разъемы питания PCIe |
2 х 8-контактных |
Размеры (согласно измерениям в нашей тестовой лаборатории), мм |
268 х 114 х 58 |
Драйверы |
Свежие драйверы можно скачать с сайта компании ASUS или сайта производителя GPU |
Сайт производителя |
Упаковка и комплектация
Видеокарта ASUS DUAL-RTX2080TI-11G поставляется в стильно оформленной коробке из качественного картона. На лицевой стороне находится стилизованное изображение ее системы охлаждения, а на обратной – ключевые преимущества и некоторые характеристики.
Традиционным приятным бонусом является бесплатная 6-месячная премиум-подписка на сервис WTFast Gamers Private Network. Он автоматически оптимизирует путь прохождения игровых пакетов между компьютером пользователя и игровым сервером для минимизации их потери и уменьшения среднего времени отклика (ping).
Список системных требований к компьютеру расположен на одной из боковых сторон коробки. Блок питания должен обладать мощностью не менее 650 Вт и поддерживать два 8-контактных кабеля PCIe.
В комплекте мы обнаружили только стандартную документацию и диск с ПО.
Внешний вид
Видеокарта ASUS DUAL-RTX2080TI-11G получила стильный и сдержанный дизайн. Нас встречает уже хорошо знакомый кожух черного цвета из пластика с небольшим узором и парой белых полос. LED-подсветка отсутствует, ведь линейка ASUS DUAL создавалась для моделей с оптимальным соотношением цены и возможностей.
На обратной стороне находится металлическая опорная пластина. Она призвана защитить печатную плату от изгиба и предотвратить возможные повреждения компонентов в процессе неаккуратного монтажа и эксплуатации.
При желании можете организовать мультиграфическую связку из двух видеокарт ASUS Dual GeForce RTX 2080 Ti в режиме NVIDIA SLI. Однако старые мостики для этой цели не подойдут – нужно приобретать новый NVLink Bridge.
Для питания используется слот PCI Express 3.0 х16 и два 8-контактных разъема PCIe, удачно расположенные в хвостовой части платы. Кулер нисколько не затрудняет отключение кабелей PCIe.
Для вывода изображения используется эталонный набор интерфейсов:
- 1 х USB Type-C;
- 1 х HDMI 2.0b;
- 3 х DisplayPort 1.4.
Максимальное разрешение составляет 7680 х 4320.
В основе видеоускорителя лежит GPU NVIDIA TU102-300A, произведенный по 12-нм техпроцессу. Тестирование проводилось в режиме «Gaming». Базовая частота заявлена на уровне 1350 МГц, а динамическая составляет 1545 МГц, то есть соответствует эталонному показателю. В фирменной утилите GPU Tweak II заложен профиль «OC» с заводским разгоном. После его активации динамическая частота повышается до 1560 МГц. Также есть режима «Silent» с пониженной скоростью работы GPU.
Видеопамять набрана из GDDR6-микросхем компании Samsung общим объемом 11 ГБ, которые работают на эталонной эффективной частоте 14000 МГц. Обмен данными между графическим ядром и памятью осуществляется через 352-битную шину, которая способна пропускать 616 ГБ информации за секунду.
Система охлаждения
Видеокарта ASUS DUAL-RTX2080TI-11G с установленной системой охлаждения занимает практически три слота расширения (2,7) и имеет общую длину 279 мм, но внутри корпуса она занимает 268 мм.
К сожалению, разобрать видеокарту нам не разрешили, но благодаря конструкции кожуха можно рассмотреть, что в составе кулера используется массивный цельный радиатор с поперечным расположением пластин. Тепловые трубки отсутствуют
Приятным бонусом является контакт элементов подсистемы питания и чипов видеопамяти с радиатором при помощи термоинтерфейса.
Что касается вертушек, то на ASUS DUAL-RTX2080TI-11G установлена пара вентиляторов Wing-blade с диаметром лопастей 88 мм. Форма их крыльчатки была улучшена для усиления воздушного потока. Также вертушки защищены от пыли по стандарту IP5X. Последним в порядке очереди бонусом является пассивный режим работы 0dB.
При автоматическом регулировании скорости вращения лопастей вентиляторов, в режиме максимальной нагрузки, графическое ядро нагрелось до 73°С при критическом показателе в 89°С. Вертушки раскручивались до 53% от своей максимальной мощности (1745 – 1748 об/мин). Шум не превышал среднего уровня и не мешал работе.
Для сравнения возьмем более мощную 3-вентиляторную систему охлаждения видеокарты ASUS ROG Strix GeForce RTX 2080 Ti OC edition. В аналогичном режиме она удерживала температуру GPU на уровне 60°С при сопоставимом уровне шума. А вот частота графического процессора у нее была выше: 1680 против 1560 МГц у версии ASUS DUAL.
В режиме максимальной частоты вращения лопастей вентиляторов (3048 – 3164 об/мин) температура GPU опустилась до 60°С. Шум превысил средний уровень и стал некомфортным для постоянного использования.
Что же касается системы охлаждения на видеокарте серии ASUS ROG Strix, то она в аналогичном режиме охладила GPU до 50°С. Частота его работы также была выше: 1695 против 1575 МГц у ASUS Dual GeForce RTX 2080 Ti.
При отсутствии нагрузки частоты работы графического ядра и памяти автоматически понижались, позволяя снизить энергопотребление и тепловыделение видеоускорителя в целом. В таком режиме температура GPU не превышала 49°С, а сам кулер переходил в пассивный режим работы. Вентиляторы включались лишь тогда, когда температура графического процессора поднималась выше 55°С.
В итоге система охлаждения достойно справляется со своей работой и имеет запас для разгонных экспериментов. Немного огорчило, что в процессе тестирования периодически были отчетливо слышны посторонние звуки в виде свиста дросселей. Возможно, это особенности лишь нашего тестового образца. Если же вам мало такого уровня эффективности, то придется раскошелиться на модель из флагманской серии ASUS ROG STRIX.
Обзор видеокарты Palit GeForce RTX 2070 SUPER JS: что-то новое или очередной «Refresh»?
В конце лета 2018 года компания NVIDIA вывела на рынок видеокарты линейки GeForce RTX 20, созданные на базе 12-нм микроархитектуры NVIDIA Turing. А зимой 2019 года эта же микроархитектура дебютировала в более доступном сегменте видеокарт вместе с серией GeForce GTX 16.
В принципе NVIDIA могла бы и дальше использовать серию GeForce RTX 20 в высокопроизводительном сегменте, если бы AMD не анонсировала планы вывести на рынок 7 июля видеокарты серии Radeon RX 5700, созданные на базе 7-нм микроархитектуры RDNA.
Поэтому NVIDIA пришлось ускориться с ответом. Им стала серия GeForce RTX 20 SUPER. В ее состав вошли три модели: NVIDIA GeForce RTX 2060 SUPER, GeForce RTX 2070 SUPER и GeForce RTX 2080 SUPER. Все они анонсированы 2 июля, но в продажу первые две поступили с 9 июля, а третья новинка будет доступна с 23 июля. В их основе находится хорошо знакомая 12-нм микроархитектура NVIDIA Turing. Бонус производительности достигается за счет увеличения количества структурных блоков в составе GPU, повышения его тактовых частот и улучшения подсистемы видеопамяти (в случае GeForce RTX 2060 / 2080 SUPER). Обратной стороной медали стало повышение энергопотребления.
Для более наглядного сравнения все характеристики мы свели в общую таблицу:
Модель |
GeForce RTX 2060 SUPER |
GeForce RTX 2070 SUPER |
GeForce RTX 2080 SUPER |
||||
Техпроцесс, нм |
12 (FFN) |
||||||
GPU |
TU106-200A |
TU106-410 |
TU106-400A |
TU104-410 |
TU104-400A |
TU104-450 |
TU102-300A |
Микроархитектура |
NVIDIA Turing |
||||||
Площадь кристалла, мм2 |
445 |
445 |
445 |
545 |
545 |
545 |
754 |
Количество транзисторов, млрд. |
10,8 |
10,8 |
10,8 |
13,6 |
13,6 |
13,6 |
18,6 |
Количество SM-блоков |
30 |
34 |
36 |
40 |
46 |
48 |
68 |
Количество CUDA-ядер |
1920 |
2176 |
2304 |
2560 |
2944 |
3072 |
4352 |
Количество текстурных блоков |
120 |
136 |
144 |
160 |
184 |
192 |
272 |
Количество растровых блоков |
48 |
64 |
64 |
64 |
64 |
64 |
88 |
Количество ядер Tensor |
240 |
272 |
288 |
320 |
368 |
384 |
544 |
Количество ядер RT |
30 |
34 |
36 |
40 |
46 |
48 |
68 |
Скорость рейтрейсинга, Гига лучей/с |
5 |
6 |
6 |
7 |
8 |
8 |
10 |
Объем кэша L2, КБ |
3072 |
4096 |
4096 |
4096 |
4096 |
4096 |
6144 |
Базовая / динамическая частота GPU, МГц |
1365 / 1680 |
1470 / 1650 |
1410 / 1620 |
1605 / 1770 |
1515 / 1710 |
1650 / 1815 |
1350 / 1545 |
Тип видеопамяти |
GDDR6 |
||||||
Объем, ГБ |
6 |
8 |
8 |
8 |
8 |
8 |
11 |
Эффективная частота памяти, МГц |
14 000 |
14 000 |
14 000 |
14 000 |
14 000 |
15 500 |
14 000 |
Разрядность шины, бит |
192 |
256 |
256 |
256 |
256 |
256 |
352 |
Пропускная способность, ГБ/с |
336 |
448 |
448 |
448 |
448 |
496 |
616 |
Вычислительная мощность FP32, TFLOPS |
6,5 |
7,2 |
7,5 |
9,1 |
10 |
11 |
13,4 |
Пиковая производительность ядер Tensor, Tensor TFLOPS |
51,6 |
57,4 |
60 |
73 |
? |
89 |
? |
TGP (Total Graphics Power), Вт |
160 |
175 |
175 |
215 |
215 |
250 |
250 |
Рекомендованная стоимость на старте продаж, $ |
349 |
399 |
499 |
499 |
699 |
699 |
999 |
В пресс-материалах NVIDIA сделала акцент на технологии трассировки лучей в режиме реального времени, которая уже поддерживается некоторыми актуальными блокбастерами и появится в новых хитах (Cyberpunk 2077, Control, Watch Dogs: Legion, Wolfenstein: Youngblood и других).
А вот в плане микроархитектуры никаких значимых изменений не анонсировано. NVIDIA просто повторила все знакомые преимущества Turing:
- наличие ядер RT и Tensor для реализации аппаратного рейтрейсинга и технологии сглаживания Deep Learning Super Sampling (DLSS);
- возможность одновременного выполнения операций с целочисельными (INT32) и вещественными (FP32) данными;
- использование новых моделей заливки, таких как Mesh Shading и Variable Rate Shading для более эффективного использования ограниченных вычислительных ресурсов.
Даже при оценке улучшения уровня производительности и энергоэффективности NVIDIA сравнивает Turing и Pascal либо видеокарты серий GeForce RTX 20 и GeForce GTX 10, без упоминания GeForce RTX 20 SUPER, хотя именно этой серии посвящен пресс-релиз.
В целом линейка NVIDIA GeForce RTX 20 SUPER не принесла с собой никаких инноваций в плане микроархитектуры. Это уже хорошо знакомая 12-нм Turing с повышенными тактовыми частотами GPU и в некоторых случаях GDDR6-памяти. CUDA-ядер, текстурных блоков и других модулей в составе графических процессоров также стало больше. Все это обещает рост производительности и энергопотребления. А вот ценники для двух из трех видеокарт NVIDIA оставила на прежнем уровне. Одновременно с началом продаж новых адаптеров, старые будут выводиться из рынка.
Но все это теория, а нас больше интересует практика. Реальное знакомство с возможностями NVIDIA GeForce RTX 2070 SUPER проведем на примере видеокарты Palit GeForce RTX 2070 SUPER JS. Она может похвастать массивной 2,7-слотовой системой охлаждения, двумя микросхемами BIOS и заводским разгоном. Сейчас расскажем о других ее преимуществах и недостатках, а также оценим уровень производительности в тестах и разгонный потенциал.
Спецификация
Модель |
Palit GeForce RTX 2070 SUPER JS (NE6207SS19P2-1040J) |
Техпроцесс, нм |
12 |
GPU |
NVIDIA TU104-410 |
Микроархитектура |
NVIDIA Turing |
Количество CUDA-ядер |
2560 |
Количество текстурных блоков |
160 |
Количество растровых блоков |
64 |
Количество тензорных ядер |
320 |
Количество ядер RT |
40 |
Базовая / динамическая частота GPU, МГц |
1605 / 1815 |
Тип видеопамяти |
GDDR6 |
Объем, ГБ |
8 |
Эффективная частота, МГц |
14 000 |
Разрядность шины, бит |
256 |
Пропускная способность, ГБ/с |
448 |
Внутренний интерфейс |
PCI Express 3.0 x16 |
Внешние интерфейсы |
1 x HDMI 2.0b |
Дополнительный коннектор питания |
2 х 8-контактных |
Рекомендованная мощность блока питания, Вт |
650 |
Энергопотребление, Вт |
215 |
Размеры, мм |
292 х 130 х 59,6 |
Драйверы |
Свежие драйверы можно скачать с сайта компании Palit или с сайта производителя GPU |
Сайт производителя |
Упаковка и комплектация
Коробку видеокарты Palit GeForce RTX 2070 SUPER JS можно назвать стильной, но малоинформативной. Она не демонстрирует внешний вид видеокарты и ее технические характеристики. Указаны лишь некоторые подробности и общие преимущества моделей серии GeForce RTX 2070 SUPER.
На обратной стороне есть рекомендации производителя к вашей системе. Например, мощность блока питания должна составлять 650 Вт. Крайне желательно, чтобы в его составе было два 6+2-контактных коннектора PCIe.
В комплекте поставки мы обнаружили руководство пользователя, диск с ПО и переходник питания с двух 6-контактных на один 8-контактный PCIe.
Внешний вид
Дизайн – дело вкуса, но видеокарта Palit GeForce RTX 2070 SUPER JS получила богатый и интересный внешний вид, с обилием дизайнерских элементов. Она станет украшением любого системного блока с прозрачной боковой панелью, особенно если он поддерживает вертикальную установку видеоускорителей.
К тому же инженеры компании Palit реализовали красочную RGB LED-подсветку некоторых элементов. Она может выполнять не только декоративную, но и функциональную роль, сигнализируя цветом о текущей температуре GPU. Всего же доступно 16,8 млн цветов, а для настройки следует использовать фирменную утилиту ThunderMaster.
Обратная сторона прикрыта многофункциональной пластиной жесткости. Во-первых, она поддерживает массивный кулер и предотвращает повреждение печатной платы. Во-вторых, выполняет декоративную роль. А в-третьих, принимает пассивное участие в теплоотводе.
В наборе внешних интерфейсов есть четыре порта:
- 1 x HDMI 2.0b
- 3 x DisplayPort 1.4a
NVIDIA же рекомендует использовать три порта – DisplayPort, HDMI и DVI-DL. Максимальное разрешение составляет 7680 х 4320.
Возле интерфейсной панели находится коннектор для подключения мостика NVIDIA NVLink. То есть Palit GeForce RTX 2070 SUPER JS, как и другие видеокарты серии NVIDIA GeForce RTX 2070 SUPER, поддерживает технологию NVIDIA SLI. Это интересно, поскольку GeForce RTX 2070 такой поддержки лишена. Как это случилось? Очень просто: новинка использует версию чипа TU104 (как GeForce RTX 2080), а не TU106 (как GeForce RTX 2070). Этот GPU изначально проектировался с поддержкой NVIDIA SLI. Поэтому при желании сможете организовать мультиграфическую связку на базе двух GeForce RTX 2070 SUPER.
В хвостовой части находится пара 8-контактных разъемов для подключения дополнительного питания. С их помощью можно подвести 300 Вт. Еще 75 Вт можно подать через интерфейс PCI Express 3.0 x16. Хотя энергопотребление новинки заявлено на уровне 215 Вт. Да и NVIDIA рекомендует использовать связку 6- и 8-контактного разъемов. Дополнительная мощность нужна, например, для стабильной работы видеокарты в разгоне.
Внутрь новинки нам заглянуть не разрешили, но официальная страничка подсказывает об использовании усиленной 10+2-фазной подсистемы питания (эталонная версия предполагает 7+2-фазный дизайн). В цепях применяются надежные и эффективные микросхемы DrMOS, тантал-полимерные конденсаторы и ферритовые дроссели. Все это также необходимо для стабильной работы видеокарты при повышенных частотах.
Возле интерфейсной панели есть еще один интересный элемент. Это переключатель между двумя микросхемами BIOS. Наличие двух версий BIOS с автоматической активацией защитного механизма гарантирует корректную работу видеокарты даже при системном сбое или проблемах при перепрошивке.
В позиции «1» активируется чип с заводским разгоном динамической частоты GPU до 1815 МГц. Если выбрать вторую микросхему (позиция «2»), то тактовые частоты графического процессора будут соответствовать эталонному уровню (1605 / 1770 МГц).
Есть еще одна разница между этими двумя микросхемами: первая обеспечивает постоянную работу вентиляторов системы охлаждения, а вторая поддерживает технологию 0dB (кулер переходит в пассивный режим, если температура GPU ниже 60°С).
Подсистема видеопамяти набрана с помощью GDDR6-микросхем Micron общим объемом 8 ГБ. Они работают на эталонной эффективной частоте 14 000 МГц при 256-битной шине. Пропускная способность составляет 448 ГБ/с.
Система охлаждения
Видеокарта Palit GeForce RTX 2070 SUPER JS получилась довольно большой: в корпусе ее длина составляет 292 мм, а в ширину она займет 2,7 слота. Поэтому если у вас компактный корпус, то обязательно перед покупкой убедитесь, что места хватит.
Пассивная часть кулера включает в себя большое медное основание, двухсекционный алюминиевый радиатор и минимум четыре 8-мм тепловых трубки. Тепло от элементов подсистемы питания передается на основной радиатор через термопрокладки.
Активная часть представлена двумя 96-мм осевыми вентиляторами с 6-фазным мотором и дизайном TurboFan 2.0. Конструкция оптимизирована под создание большего воздушного потока с повышенным статическим давлением и уменьшенным уровнем шума. Давайте проверим, как этот кулер покажет себя на практике.
При максимальной нагрузке и автоматической работе системы охлаждения, температура графического процессора достигала 65°С при критическом показателе 88°С. Вентиляторы вращались на скорости 1355–1356 об/мин (59% от максимальной), создавая средний фоновый шум. Частота графического процессора находилась на уровне 1785 МГц.
После принудительной установки скорости вентиляторов на 100% (2299–2302 об/мин), температура GPU опустилась до 54°С, а частота поднялась до 1815 МГц. Шум превысил средний уровень и перестал быть комфортным для постоянного использования.
В простое вентиляторы бесшумно вращались со скоростью 799–800 об/мин (35% от максимальной), удерживая температуру графического процессора в пределах 30°С. Напомним, что активация пассивного режима 0dB при низкой нагрузке происходит лишь после включения второй микросхемы BIOS.
В целом кулер без проблем справился с охлаждением видеокарты в автоматическом режиме и показал хороший запас прочности для разгонных экспериментов. Никаких посторонних звуков в виде раздражающего писка дросселей в процессе тестирования замечено не было.
Обзор и тестирование видеокарты MSI GeForce RTX 2080 Ti GAMING X TRIO: царь горы
Компания MSI не могла остаться в стороне от анонса и старта продаж новой линейки видеокарт на базе микроархитектуры NVIDIA Turing и уже успела пополнить свой модельный ряд целой россыпью новинок. В ее ассортименте вы найдете порядка десяти различных версий флагманской NVIDIA GeForce RTX 2080 Ti: начиная от укомплектованных жидкостной системой охлаждения и заканчивая привычными моделями с воздушным кулером.
В данном обзоре мы поговорим об одной из топовых версий с воздушной системой охлаждения – MSI GeForce RTX 2080 Ti GAMING X TRIO. Она получила усиленную подсистему питания, высокий заводской разгон и фирменную систему охлаждения с вентиляторами TORX 3.0 на двойном шарикоподшипнике. Давайте же взглянем, какие преимущества вы получите от покупки данной модели.
Спецификация
Модель |
MSI GeForce RTX 2080 Ti GAMING X TRIO |
GPU |
NVIDIA TU102-300A |
Микроархитектура |
NVIDIA Turing |
Техпроцесс, нм |
12 |
Количество CUDA-ядер |
4352 |
Количество текстурных блоков |
272 |
Количество растровых блоков |
88 |
Количество тензорных ядер |
544 |
Количество ядер RT |
68 |
Базовая частота GPU, МГц |
1350 |
Динамическая частота GPU, МГц |
1755 |
Эффективная частота памяти, МГц |
14000 |
Объем памяти, ГБ |
11 |
Тип памяти |
GDDR6 |
Ширина шины памяти, бит |
352 |
Пропускная способность памяти, ГБ/с |
616 |
Тип шины |
PCI Express 3.0 x16 |
Внешние интерфейсы |
1 x USB Type-C |
Минимальная мощность блока питания, Вт |
650 |
Дополнительные разъемы питания PCIe |
1 х 6-контактный 2 х 8-контактных |
Размеры (согласно измерениям в нашей тестовой лаборатории), мм |
327 х 140 х 55,6 |
Драйверы |
Свежие драйверы можно скачать с сайта компании MSI или сайта производителя GPU |
Сайт производителя |
Упаковка и комплектация
Новинка поставляется в крупной картонной коробке, украшенной приятной цветной полиграфией. На лицевой стороне нанесено изображение видеокарты с включенной подсветкой MSI Mystic Light. Обратная сторона коробки отведена под описание ключевых преимуществ модели и некоторых ее характеристик.
Список системных требований к компьютеру, в который планируется установка видеокарты, также расположен на обратной стороне коробки. Исходя из рекомендаций, блок питания должен обладать мощностью не менее 650 Вт и поддерживать один 6-контактный и два 8-контактных коннектора PCIe.
В комплекте мы обнаружили стандартную документацию, диск с ПО, металлический кронштейн для дополнительной фиксации видеокарты в системном блоке и приятный бонус в виде наклеек.
Для вывода изображения используется эталонный набор интерфейсов:
- 1 х USB Type-C;
- 1 х HDMI 2.0b;
- 3 х DisplayPort 1.4.
Максимальное разрешение составляет 7680 х 4320.
Внешний вид
Дизайн видеокарт серии MSI GAMING TRIO претерпел небольшие изменения по сравнению с предшественниками, но общий подход к оформлению остался. Кожух все также выполнен из пластика различной фактуры и нескольких оттенков (от черного к серому). Пропали небольшие вставки из красного полупрозрачного пластика и изменилась логика расположения вентиляторов. Теперь 86-мм вертушка сместилась из центра ближе к интерфейсной панели.
На обратной стороне находится металлическая опорная пластина, которая призвана защитить печатную плату от изгиба, а также предотвратить возможные повреждения компонентов в процессе неаккуратного монтажа и эксплуатации.
В отличие от NVIDIA GeForce RTX 2060 и NVIDIA GeForce RTX 2070, обе старшие видеокарты поддерживают организацию мультиграфических связок. Однако старые мостики NVIDIA SLI для этой цели не подойдут – нужно приобретать новый NVLink Bridge. Если вы захотите объединить пару MSI GeForce RTX 2080 Ti GAMING X TRIO в связку, то для этого нужно отсоединить небольшую пластиковую часть кожуха, которая фиксируется при помощи пары винтиков. Именно по этой причине инженеры MSI решили сместить один из вентиляторов ближе к интерфейсной панели, чтобы в области коннектора было больше свободного пространства.
Для питания используется слот PCI Express 3.0 х16 и три разъема PCIe (один 6- и два 8-контактных), удачно расположенные в хвостовой части платы. Кулер нисколько не затрудняет отключение кабелей PCIe.
В основе видеоускорителя лежит GPU NVIDIA TU102-300A, произведенный по 12-нм техпроцессу. Он состоит из 4352 ядер CUDA, 272 текстурных блоков и 88 блоков растеризации. Базовая частота заявлена на уровне 1350 МГц, а динамическая – 1755 МГц (эталонный показатель – 1545 МГц).
Видеопамять набрана из GDDR6-микросхем компании Micron общим объемом 11 ГБ, которые работают на эталонной эффективной частоте 14000 МГц. Обмен данными между графическим ядром и памятью осуществляется через 352-битную шину, которая способна пропускать 616 ГБ информации за секунду.
К сожалению, видеокарту нам разобрать не разрешили, поэтому остается довольствоваться изображениями с официального сайта. MSI GeForce RTX 2080 Ti GAMING X TRIO основана на печатной плате собственного дизайна и отличается усиленной 17-фазной подсистемой питания для GPU и микросхем памяти.
Любители LED-подсветки по достоинству оценят новинку от MSI, ведь она обладает сразу несколькими зонами иллюминации, а часть света красиво отражается от самой печатной платы в процессе работы.
Управлять подсветкой MSI Mystic Light можно в фирменном ПО. Доступно несколько режимов работы для каждой зоны и возможность синхронизировать иллюминацию с другими компонентами системы.
Система охлаждения
Видеокарта MSI GeForce RTX 2080 Ti GAMING X TRIO с установленной системой охлаждения занимает практически три слота расширения и имеет общую длину 327 мм согласно официальному сайту.
Конструкция кулера включает в себя массивный двухсекционный алюминиевый радиатор с никелированным медным основанием и семью никелированными медными тепловыми трубками (шесть 6-мм и одна 8-мм). Чипы видеопамяти охлаждаются при помощи отдельной пластины с термопрокладками, а элементы подсистемы питания контактируют с основным радиатором.
За активный отвод тепла отвечает пара вентиляторов с диаметром лопастей 96 мм и один 86-мм. Все они выполнены в соответствии с дизайном TORX 3.0 и обладают улучшенной формой крыльчатки. В их основе находятся надежные и долговечные двойные шарикоподшипники.
При автоматическом регулировании скорости вращения лопастей вентиляторов, в режиме максимальной нагрузки, графическое ядро нагрелось до 71°С при критическом показателе в 89°С, а вертушки раскручивались до 1307 – 1350 об/мин (49-40% от своей максимальной мощности). По субъективным ощущениям шум был очень низким и абсолютно не мешал работе.
Для сравнения возьмем 3-вентиляторную систему охлаждения видеокарты ASUS ROG Strix GeForce RTX 2080 Ti OC edition, которая в аналогичном режиме удерживала температуру GPU на уровне 60°С при сопоставимом уровне шума. А вот частота графического процессора у нее была ниже: 1680 против 1770 МГц у версии от MSI.
В режиме максимальной частоты вращения лопастей вентиляторов (2522 – 3312 об/мин) температура GPU опустилась до 56°С. Шум превысил средний уровень и стал некомфортным для постоянного использования.
Что же касается системы охлаждения на видеокарте от ASUS, то она в аналогичном режиме охладила GPU до 50°С. Однако частота его работы опять была ниже: 1695 МГц против 1800 МГц у MSI GeForce RTX 2080 Ti GAMING X TRIO.
При отсутствии нагрузки частоты работы графического ядра и памяти автоматически понижались, позволяя снизить энергопотребление и тепловыделение видеоускорителя в целом. В таком режиме температура GPU составила 46°С. Напомним, что благодаря технологии MSI ZERO FROZR вентиляторы начинают вращаться только при достижении температуры в 60°С.
В целом система охлаждения видеокарты MSI GeForce RTX 2080 Ti GAMING X TRIO произвела очень хорошее впечатление. Она отлично справляется с охлаждением разогнанного графического ядра, и не потревожит вас высоким уровнем шума при повседневной эксплуатации.
Не понравилось лишь наличие посторонних звуков в виде высокочастотного писка дросселей при высоких нагрузках. Возможно, это особенность исключительно тестового образца.
Обзор и тестирование видеокарты ASUS Dual GeForce RTX 2080 Advanced edition: почти топ
В свое время компания ASUS представила серию ASUS Dual в качестве второй по старшинству линейки видеокарт после ROG STRIX. Она призвана совместить более лояльное ценовое позиционирование и производительную систему охлаждения с двумя вертушками (откуда и пошло название). И по сей день эта схема остается неизменной, поэтому если вы подбираете качественную версию той либо иной видеокарты, то серия ASUS Dual зачастую удовлетворит большинство ваших требований, если вы не гонитесь исключительно за флагманскими модификациями.
Вполне логично, что вместе с выходом видеокарт на новой микроархитектуре NVIDIA Turing, соответствующие версии пополнили и серию ASUS Dual. В данном обзоре мы поговорим о модели ASUS Dual GeForce RTX 2080 Advanced edition (DUAL-RTX2080-A8G) и сравним производительность ее системы охлаждения с ранее рассмотренными версиями NVIDIA GeForce RTX 2080.
Спецификация
Модель |
ASUS Dual GeForce RTX 2080 Advanced edition (DUAL-RTX2080-A8G) |
|
GPU |
NVIDIA TU104-400A |
|
Микроархитектура |
NVIDIA Turing |
|
Техпроцесс, нм |
12 |
|
Количество CUDA-ядер |
2944 |
|
Количество текстурных блоков |
184 |
|
Количество растровых блоков |
64 |
|
Количество тензорных ядер |
368 |
|
Количество ядер RT |
46 |
|
Базовая частота GPU, МГц |
1515 |
|
Динамическая частота GPU, МГц |
Режим «Gaming» |
1725 |
Режим «OC» |
1755 |
|
Режим «Silent» |
1680 |
|
Эффективная частота памяти, МГц |
14000 |
|
Объем памяти, ГБ |
8 |
|
Тип памяти |
GDDR6 |
|
Ширина шины памяти, бит |
256 |
|
Пропускная способность памяти, ГБ/с |
448 |
|
Тип шины |
PCI Express 3.0 x16 |
|
Внешние интерфейсы |
1 x USB Type-C |
|
Минимальная мощность блока питания, Вт |
650 |
|
Дополнительные разъемы питания PCIe |
1 х 6-контактный 1 х 8-контактный |
|
Размеры (согласно измерениям в нашей тестовой лаборатории), мм |
268 х 114 х 58 |
|
Драйверы |
Свежие драйверы можно скачать с сайта компании ASUS или сайта производителя GPU |
|
Сайт производителя |
Упаковка и комплектация
Видеокарта ASUS DUAL-RTX2080-A8G поставляется в стильно оформленной коробке из качественного картона. На лицевой стороне находится стилизованное изображение системы охлаждения графического ускорителя, а также его наименование. Уже традиционным приятным бонусом является бесплатная 6-месячная премиум-подписка на сервис WTFast Gamers Private Network. Он автоматически оптимизирует путь прохождения игровых пакетов между компьютером пользователя и игровым сервером для минимизации их потери и уменьшения среднего времени отклика (ping).
Список системных требований к компьютеру расположен на одной из боковых сторон коробки. Исходя из рекомендаций, блок питания должен обладать мощностью не менее 650 Вт и поддерживать два кабеля PCIe (1 x 6-контактный и 1 x 8-контактный).
В комплекте мы обнаружили только стандартную документацию и диск с ПО.
Для вывода изображения используется эталонный набор интерфейсов:
- 1 х USB Type-C;
- 1 х HDMI 2.0b;
- 3 х DisplayPort 1.4.
Максимальное разрешение составляет 7680 х 4320.
Внешний вид
Если вы помните, модели линейки ASUS Dual прошлого поколения видеокарт NVIDIA выделялись на фоне конкурентов белым кожухом и мгновенно опознавались на витринах магазинов. А вот с выходом NVIDIA GeForce RTX 20 кожух стал куда более сдержанным. Большая его часть окрашена в черный цвет, а на общем фоне выделяются только несколько белых полос – отголосок белоснежного прошлого серии. А вот любителям светодиодной иллюминации данная версия явно не подойдет, ведь она лишена подсветки.
На обратной стороне находится металлическая опорная пластина, которая призвана защитить печатную плату от изгиба, а также предотвратить возможные повреждения компонентов в процессе неаккуратного монтажа и эксплуатации.
В отличие от NVIDIA GeForce RTX 2070, обе старшие видеокарты поддерживают организацию мультиграфических связок. Однако старые мостики NVIDIA SLI для этой цели не подойдут – нужно приобретать новый NVLink Bridge.
Для питания тестируемого графического адаптера используется слот PCI Express 3.0 х16 и два разъема PCIe (6- и 8-контактный), удачно расположенные в хвостовой части платы. Кулер нисколько не затрудняет отключение кабелей PCIe.
В основе видеоускорителя лежит GPU NVIDIA TU104-400A, произведенный по 12-нм техпроцессу. Он состоит из 2944 ядер CUDA, 184 текстурных блоков и 64 блоков растеризации. Тестирование проводилось в режиме «Gaming», в котором базовая частота заявлена на уровне 1515 МГц, а динамическая – 1725 МГц.
Видеопамять набрана из GDDR6-микросхем компании Micron общим объемом 8 ГБ, которые работают на эталонной эффективной частоте 14000 МГц. Обмен данными между графическим ядром и памятью осуществляется через 256-битную шину, которая способна пропускать 448 ГБ информации за секунду.
При желании в фирменной утилите GPU Tweak II можно активировать еще два профиля: «Silent» и «OC». В первом динамическая частота графического процессора снижается до 1680 МГц, а во втором – поднимается до 1740 (вместо заявленных на сайте 1755 МГц). Достигнутые при ручном разгоне параметры можно сохранить в пользовательские профили для быстрой активации разгона в будущем.
Система охлаждения
Видеокарта ASUS DUAL-RTX2080-A8G с установленной системой охлаждения занимает практически три слота расширения (2,7) и имеет общую длину 280 мм, но внутри корпуса она занимает 268 мм.
К сожалению, разбирать видеокарту нам не разрешили, но можно рассмотреть, что в составе кулера используется массивный цельный радиатор с поперечным расположением пластин. Тепловые трубки в конструкции отсутствуют.
Приятным бонусом является контакт элементов подсистемы питания и чипов видеопамяти с радиатором при помощи термоинтерфейса.
Что касается вертушек, то на ASUS DUAL-RTX2080-A8G установлена пара вентиляторов с диаметром лопастей 88 мм и улучшенной формой крыльчатки. Благодаря новой геометрии усиливается воздушный поток. Также вертушки защищены от пыли по стандарту IP5X, а при низких нагрузках на GPU они приостанавливают свою работу.
При автоматическом регулировании скорости вращения лопастей вентиляторов, в режиме максимальной нагрузки, графическое ядро нагрелось до 75°С при критическом показателе в 88°С, а вертушки раскручивались до 1838 – 1845 об/мин (56% от своей максимальной мощности). По субъективным ощущениям шум был очень низким и абсолютно не мешал работе.
В режиме максимальной частоты вращения лопастей вентиляторов (2901 – 3097 об/мин) температура GPU опустилась до 63°С. Шум превысил средний уровень и стал некомфортным для постоянного использования.
При отсутствии нагрузки частоты работы графического ядра и памяти автоматически понижались, позволяя снизить энергопотребление и тепловыделение видеоускорителя в целом. В таком режиме температура GPU не превышала 44°С. Напомним, что вентиляторы начинают вращаться только по достижении температуры в 55°С.
Для большей наглядности сравним работу системы охлаждения с другими модификациями NVIDIA GeForce RTX 2080:
Наименование |
ASUS DUAL-RTX2080-A8G |
||||
Длина видеокарты |
280 |
300 |
280 |
280 |
|
Количество вертушек |
2 |
3 |
2 |
1 |
|
Диаметр лопастей, мм |
88 |
88 |
88 |
80 |
|
Количество тепловых трубок |
- |
6 |
- |
- |
|
Диаметр тепловых трубок, мм |
- |
6 |
- |
- |
|
Расположение пластин радиатора / ребер |
Поперечное |
Поперечное |
Поперечное |
Продольное |
|
Секции радиатора |
1 |
2 |
1 |
1 |
|
Автоматическая регулировка |
Температура, °С |
75 |
72 |
78 |
80 |
Частота GPU, МГц |
1650 |
1830 |
1710 |
1620 |
|
Максимальная скорость |
Температура, °С |
63 |
50 |
63 |
53 |
Частота GPU, МГц |
1665 |
1860 |
1725 |
1680 |
|
Простой |
Температура, °С |
44 |
35 |
48 |
30 |
Частота GPU, МГц |
300 |
300 |
300 |
300 |
|
технология 0dB Fan |
+ |
+ |
+ |
- |
Видеокарты серии ASUS Dual используют аналогичную конструкцию кулера и демонстрируют похожие результаты по температуре. Однако ASUS DUAL-RTX2080-O8G работает на более высоких частотах благодаря повышенным скоростям вращения вентиляторов.
А единоличным лидером является самая сложная по конструкции система охлаждения модели ASUS ROG-STRIX-RTX2080-O8G-GAMING, в составе которой вы найдете не только три вертушки, но и шесть тепловых трубок.
Новый флагман: NVIDIA TITAN RTX за $2499
Компания NVIDIA представила самый мощный в мире графический адаптер для настольных ПК – NVIDIA TITAN RTX. Он создан для ресурсоемких приложений в области искусственного интеллекта, графики с трассировкой лучей в реальном времени, виртуальной реальности нового поколения и HPC-приложений. В частности, новинка позволяет редактировать видео в разрешении 8K в реальном времени.
В основе NVIDIA TITAN RTX находится графический процессор NVIDIA TU102-400A с поддержкой 4608 CUDA-ядер и 24 ГБ GDDR6-памяти с эффективной частотой 14 000 МГц и пропускной способностью в 672 ГБ/с благодаря 384-битной шине. А с помощью интерфейса NVIDIA NVLink с пропускной способностью 100 ГБ/с можно объединить в одной системе пару таких адаптеров для получения еще более высокой вычислительной мощности.
Судя по фото, подсистема питания эталонной версии NVIDIA TITAN RTX использует 14+2-фазный дизайн, а для корректной работы требуется подключение двух 8-контактных коннекторов PCIe. Охлаждение возложено на двухслотовый кулер с двумя осевыми вентиляторами.
В продажу на рынке США новинка поступит до конца этого месяца по цене $2499. Сводная таблица технической спецификации видеокарты NVIDIA TITAN RTX:
Читать новость полностью >>>Обзор и тестирование видеокарты ASUS ROG Strix GeForce RTX 2080 OC edition: достойная подражанию
Карты всякие нужны, карты всякие важны. С приходом на рынок линейки NVIDIA GeForce RTX 20 в сегмент высокопроизводительных видеокарт вернулось некое подобие конкуренции. Правда, не между продуктами AMD и NVIDIA, а между новым и предыдущим поколением компании NVIDIA. Но такое положение дел продлится не долго. Старые видеокарты будут постепенно выводиться из рынка, а новые появятся в большем количестве, и цены на них поползут вниз после стартового ажиотажа. А еще компания AMD обещает вернуться в 2019 году с конкурентной 7-нм линейкой Navi. Одним словом, даже если сейчас вы не готовы купить топовою модель линейки NVIDIA GeForce RTX 20, то через несколько месяцев все может кардинально измениться. Но вы уже будете во всеоружии, поскольку мы заблаговременно познакомим вас с видеокартой ASUS ROG Strix GeForce RTX 2080 OC edition.
Чем примечательная эта новинка, кроме нескромных габаритов и ценника? Если вы уже познакомились с обзором видеокарты ASUS ROG Strix GeForce RTX 2070 OC edition, то с первого взгляда рассчитываете на эффективную работу кулера, усиленную подсистему питания и повышенный разгонный потенциал. К этому можно добавить еще ряд полезных мелочей, о которых и пойдет речь далее. Но пока давайте взглянем на ее характеристики.
Спецификация
Модель |
ASUS ROG Strix GeForce RTX 2080 OC edition (ROG-STRIX-RTX2080-O8G-GAMING) |
|
Техпроцесс, нм |
12 |
|
GPU |
NVIDIA TU104-400A |
|
Микроархитектура |
NVIDIA Turing |
|
Количество CUDA-ядер |
2944 |
|
Количество текстурных блоков |
184 |
|
Количество растровых блоков |
64 |
|
Количество тензорных ядер |
368 |
|
Количество ядер RT |
46 |
|
Базовая / динамическая частота GPU, МГц |
«Gaming» |
1515 / 1860 |
«OC» |
1515 / 1890 |
|
Тип видеопамяти |
GDDR6 |
|
Объем, ГБ |
8 |
|
Эффективная частота, МГц |
14 000 |
|
Разрядность шины, бит |
256 |
|
Пропускная способность, ГБ/с |
448 |
|
Внутренний интерфейс |
PCI Express 3.0 x16 |
|
Внешние интерфейсы |
2 x HDMI 2.0b |
|
Дополнительные коннекторы питания |
2 х 8-контактных |
|
Рекомендованная мощность блока питания, Вт |
650 |
|
Размеры, мм |
299,7 х 130,4 х 54,1 |
|
Драйверы |
Свежие драйверы можно скачать с сайта компании ASUS или с сайта производителя GPU |
|
Сайт производителя |
Упаковка и комплектация
Покупателя видеокарты ASUS ROG-STRIX-RTX2080-O8G-GAMING встречает яркая и информативная картонная упаковка. С ее помощью вы не только сможете оценить внешний вид новинки, но и узнать о ключевых ее преимуществах. Не хватает лишь подробных характеристик. Зато упоминается о бесплатной 6-месячной премиум-подписке на сервис WTFast Gamers Private Network. Он автоматически оптимизирует путь прохождения игровых пакетов между компьютером пользователя и игровым сервером для минимизации их потери и уменьшения среднего времени отклика (ping).
На нижней стороне вы найдете список минимальных системных требований. Среди них есть рекомендации производителя к блоку питания: минимальная его мощность должна составлять 650 Вт, а в наборе коннекторов желательно иметь два 8-контактных PCIe. Эти рекомендации традиционно указаны с запасом, поскольку производитель не может предсказать финальную конфигурацию вашей системы. Реальное энергопотребление нашего тестового стенда с этой видеокартой указано на последнем графике блока тестирования.
В комплект поставки видеокарты входит лишь руководство пользователя и диск с ПО.
Внешний вид
Внешний вид моделей серии ASUS ROG Strix не поражает яркими цветами в выключенном состоянии. Но все же пластиковый кожух не выглядит скучно благодаря симметричным декоративным элементам.
Придать новинке яркости и индивидуальности поможет фирменная LED-подсветка ASUS Aura Sync. Подсвечивается не только фронтальная часть, но и логотип на тыльной стороне. Сама иллюминация может быть не только красивой, но и полезной: с ее помощью можно визуально мониторить изменение температуры графического процессора.
Тыльная сторона прикрыта металлической пластиной жесткости. Она помогает удерживать массивный кулер, чтобы предотвратить поломку печатной платы. Также она принимает пассивное участие в процессе охлаждения и выполняет эстетическую функцию, скрывая текстолит.
В вырезах пластины жесткости можно заметить ряд интересных и полезных элементов. В глаза бросаются тантал-полимерные конденсаторы подсистемы питания и наклейка на одном из винтов системы охлаждения, поэтому снять кулер без потери гарантии не получится.
В передней части находится разъем для реализации технологии NVIDIA SLI. Но обычный мостик уже не подходит – нужна новая его версия с поддержкой NVLink. Рядом расположилась кнопка для включения / выключения LED-подсветки.
По центру верхней грани лицевой стороны находится переключатель BIOS для выбора одного из двух режимов работы системы охлаждения: «P Mode» или «Q Mode». Если вы хотите получить более низкие температуры внутренних узлов в автоматическом режиме работы кулера, то выбирайте «P Mode» (сокращение от Performance). В таком случае вентиляторы будут вращаться быстрее. В режиме «Q Mode» (сокращение от Quiet) их скорость будет ниже для более тихой работы.
Хвостовая часть оказалась еще богаче на приятные и полезные мелочи. Во-первых, здесь находятся два 8-контактных коннектора PCIe для подачи дополнительного питания. Вместе с интерфейсом PCI Express 3.0 x16 они способны подвести 375 Вт энергии, чего будет достаточно даже для разгонных экспериментов. А если возникнут проблемы с питанием, то находящиеся ниже светодиоды просигнализируют об этом.
Во-вторых, рядом расположены разъемы для прямого замера напряжений на ключевых узлах. Конечно, для этого можно использовать различные утилиты, включая ASUS GPU Tweak II, но иногда они указывают неправильные данные. Поэтому для опытных оверклокеров подобный инструмент лишним не будет.
Между печатной платой и системой охлаждения спрятались три 4-контактных разъема. Нижний с красной подложкой используется для подключения подсветки ASUS Aura Sync к материнской плате с дальнейшей ее синхронизацией. А два верхних с черной подложкой реализуют технологию ASUS FanConnect II. К ним вы сможете подключить корпусные вентиляторы, привязав скорость их работы к температуре CPU или GPU.
Набор внешних интерфейсов отличается от эталонного. Вместо трех DisplayPort 1.4a и одного HDMI 2.0b имеем по два DisplayPort и HDMI. Неизменным остался лишь USB Type-C. Такой комплект лучше подойдет для подключения актуальных шлемов виртуальной реальности. Максимальное разрешение составляет 7680 х 4320.
Поглазеть на внутренний мир видеокарты ASUS ROG Strix GeForce RTX 2080 OC edition нам не разрешили, поэтому приходится довольствоваться информацией с официального сайта. Подсистема питания использует 10+2-фазный дизайн (10 фаз для GPU и 2 для памяти) с применением элементной базы Super Alloy Power II и автоматического процесса сборки ASUS Auto-Extreme Technology. Напомним, что NVIDIA GeForce RTX 2080 Founders Edition оснащена 8+2-фазной подсистемой питания.
В основе ASUS ROG-STRIX-RTX2080-O8G-GAMING находится графический процессор NVIDIA TU104-400A с поддержкой 2944 CUDA-ядер. Тестирование проводилось в режиме «Gaming», который используется по умолчанию. Он характеризуется разгоном динамической частоты GPU с эталонных 1710 до 1860 МГц. А вот базовая скорость осталась на референсном уровне 1515 МГц.
Подсистема видеопамяти набрана с помощью восьми GDDR6-микросхем компании Micron общим объемом 8 ГБ. Эффективная частота составляет 14 ГГц, что при 256-битной шине дает пропускную способность в 448 ГБ/с.
На официальной страничке указано о наличии профиля «OC» с разгоном динамической частоты GPU до 1890 МГц. Но о режиме «Silent» не упоминается, хотя и он предусмотрен в фирменной утилите GPU Tweak II. Он снижает динамическую скорость до 1830 МГц. Эффективная частота видеопамяти во всех случаях остается неизменной.
Система охлаждения
Система охлаждения видеокарты занимает почти 3 слота расширения, а ее длина достигает 300 мм. Поэтому перед покупкой обязательно проверьте, хватит ли в корпусе места для ее установки и не конфликтует ли она с другими платами.
Пассивная часть конструкции состоит из никелированного медного основания, шести 6-мм никелированных медных тепловых трубок и двухсекционного алюминиевого радиатора. Через специальные вставки и утолщения радиатор контактирует с микросхемами памяти и элементами подсистемы питания. А чтобы снизить нагрузку на печатную плату, используется усиленная рама на лицевой стороне и пластина жесткости на обороте.
Активная часть системы охлаждения представлена тремя 88-мм вентиляторами с дизайном Axial-tech и защитой от пыли (IP5X). Размер их центральной части уменьшен, чтобы увеличить длину лопастей, а специальное кольцо-ограничитель обеспечивает структурную прочность и усиленное давление воздуха в направлении радиатора. Благодаря этому вентиляторы перемещают больше воздуха и вращаются на более высоких скоростях по сравнению с обычными, но без увеличения уровня шума.
Следует вспомнить и о технологии MaxContact. Она предполагает использование более гладкой поверхности основания для увеличения площади контакта с графическим процессором и улучшения теплоотвода.
При максимальной нагрузке и автоматической работе системы в режиме «Q Mode», температура графического процессора достигала 72°С при рабочей частоте 1830 МГц. Вентиляторы вращались на скорости 1188 об/мин (33% от максимума), создавая тихий фоновый шум, который абсолютно не мешал работе. Критической для GPU считается температура в 88°С.
Для сравнения вспомним 2-вентиляторную систему охлаждения видеокарты ASUS Dual GeForce RTX 2080 OC edition. В аналогичном режиме она удержала температуру GPU на отметке 78°С при частоте 1710 МГц. Вентиляторы же вращались со скоростью 1989 об/мин.
После принудительной установки скорости вентиляторов на 100% (3072 – 3327 об/мин), температура GPU опустилась до 50°С, а его скорость поднялась до 1860 МГц. Шум превысил средний уровень и перестал быть комфортным для постоянного использования.
ASUS Dual GeForce RTX 2080 OC edition также справилась с этой задачей, но показатели у нее были закономерно хуже: температура GPU составила 63°С, а его частота – 1725 МГц.
В режиме простоя вентиляторы прекратили свою работу благодаря технологии 0dB, а температура графического процессора составила всего 35°С. В активный режим пропеллеры возвращались лишь тогда, когда температура GPU поднималась до 56°С. Если же вы переведете кулер в режим «P Mode», то вентиляторы будут вращаться даже в режиме простоя. Хотя их скорость будет минимальной, и вы их не услышите.
В аналогичном режиме у модели ASUS Dual GeForce RTX 2080 OC edition температура графического процессора составляла 48°С.
По итогам теста напрашиваются два вывода. Во-первых, система охлаждения видеокарты ASUS ROG-STRIX-RTX2080-O8G-GAMING эффективно и тихо справляется со своими задачами даже в автоматическом режиме работы. Остается еще и солидный запас для разгонных экспериментов. Никаких посторонних звуков в виде раздражающего писка дросселей в процессе тестирования не было.
Во-вторых, переплата за более мощную систему охлаждения приводит не только к снижению рабочих температур, но и к повышению частоты GPU и бонусу в производительности.
Обзор и тестирование видеокарты ASUS Dual GeForce RTX 2080 OC edition: шаг в будущее
В конце лета NVIDIA сделала то, что от нее ожидали с начала весны – официально анонсировала новую линейку видеокарт. По мнению компании, она настолько инновационна, что даже заслуживает новой приставки «RTX» вместо привычной «GTX». Первые ее представители уже поступили в продажу, что позволило и нам получить модель для тестов. Но для начала немного теории.
Для более удобного восприятия информации приводим сводную таблицу видеокарт NVIDIA:
Модель |
NVIDIA GeForce GTX 1070 |
NVIDIA GeForce RTX 2070 |
NVIDIA GeForce GTX 1080 |
NVIDIA GeForce RTX 2080 |
NVIDIA GeForce GTX 1080 Ti |
NVIDIA GeForce RTX 2080 Ti |
Техпроцесс, нм |
16 (FinFET) |
12 (FFN) |
16 (FinFET) |
12 (FFN) |
16 (FinFET) |
12 (FFN) |
GPU |
NVIDIA GP104-200 |
NVIDIA TU106 |
NVIDIA GP104-400 |
NVIDIA TU104-400A |
NVIDIA GP102-350 |
NVIDIA TU102-300A |
Микроархитектура |
NVIDIA Pascal |
NVIDIA Turing |
NVIDIA Pascal |
NVIDIA Turing |
NVIDIA Pascal |
NVIDIA Turing |
Площадь кристалла, мм2 |
314 |
445 |
314 |
545 |
471 |
754 |
Количество транзисторов, млрд. |
7,2 |
10,8 |
7,2 |
13,6 |
12 |
18,6 |
Количество SM-блоков |
15 |
36 |
20 |
46 |
28 |
68 |
Количество CUDA-ядер |
1920 |
2304 |
2560 |
2944 |
3584 |
4352 |
Количество CUDA-ядер в SM-блоке |
128 |
64 |
128 |
64 |
128 |
64 |
Количество текстурных блоков |
120 |
144 |
160 |
184 |
224 |
272 |
Количество растровых блоков |
64 |
64 |
64 |
64 |
88 |
88 |
Количество ядер Tensor |
- |
288 |
- |
368 |
- |
544 |
Количество ядер RT |
- |
36 |
- |
46 |
- |
68 |
Объем кэша L2, КБ |
2048 |
4096 |
2048 |
4096 |
3072 |
6144 |
Базовая / динамическая частота GPU, МГц |
1506 / 1683 |
1410 / 1620 |
1607 / 1733 |
1515 / 1710 |
1480 / 1582 |
1350 / 1545 |
Базовая / динамическая частота GPU Founders Edition, МГц |
1506 / 1683 |
1410 / 1710 |
1607 / 1733 |
1515 / 1800 |
1480 / 1582 |
1350 / 1635 |
Тип видеопамяти |
GDDR5 |
GDDR6 |
GDDR5X |
GDDR6 |
GDDR5X |
GDDR6 |
Объем, ГБ |
8 |
8 |
8 |
8 |
11 |
11 |
Эффективная частота памяти, МГц |
8 008 |
14 000 |
10 008 |
14 000 |
11 008 |
14 000 |
Разрядность шины, бит |
256 |
256 |
256 |
256 |
352 |
352 |
Пропускная способность, ГБ/с |
256,3 |
448 |
320 |
448 |
484 |
616 |
Вычислительная мощность FP32 (Founders Edition), TFLOPS |
6,5 |
7,5 (7,9) |
8,9 |
10 (10,6) |
11,3 |
13,4 (14,2) |
TDP (Founders Edition), Вт |
150 |
175 (185) |
180 |
215 (225) |
250 |
250 (260) |
Рекомендованная стоимость на старте продаж (партнерские / Founders Edition), $ |
379 / 449 |
499 / 599 |
599 / 699 |
699 / 799 |
699 |
999 / 1199 |
Мы понимаем, что выкладываем обзор по новинке с опозданием, поэтому нет особого смысла в глубоком погружении в микроархитектурные особенности: кому интересно – уже прочел все подробности на других ресурсах, а кому не интересно – все равно пропустит этот блок и сразу перейдет к знакомству с видеокартой. Поэтому лишь кратко остановимся на ключевых инновациях.
Техпроцесс
На бумаге видим переход от 16-нм технологии до 12-нм, но производитель самих чипов, компания TSMC, открыто заявляет, что ее техпроцесс 12-нм FFN является слегка улучшенной версией 16-нм FinFET+. Поэтому в реальности плотность размещения транзисторов возросла незначительно. Например, для NVIDIA TU104 она увеличилась на 9% по сравнению с NVIDIA GP104. Основной же рост числа транзисторов произошел благодаря увеличению общей площади кристаллов.
Микроархитектура
Блок-схема графического процессора NVIDIA TU104
Важные изменения коснулись распределения структурных блоков внутри графического процессора. По-прежнему в основе находятся вычислительные кластеры GPC (Graphics Processing Cluster), но по сравнению с NVIDIA Pascal имеем ряд нововведений:
- каждый SM-модуль внутри GPC получил по одному ядру RT;
- каждый SM-модуль внутри GPC получил по 8 тензорных ядер (Tensor);
- количество CUDA-ядер в каждом SM-модуле уменьшилась со 128 до 64;
- появилась возможность одновременного параллельного выполнения операций с целочисленными (INT32) и вещественными (FP32) данными, хотя раньше вычислительные блоки были универсальными, поэтому за такт обрабатывались либо первые, либо вторые данные;
- в 2 раза увеличился объем кэш-памяти L2;
- до 2,7 раз вырос объем кэш-памяти L1, в 2 раза увеличилась ее пропускная способность и существенно снизилась задержка доступа.
Тензорные ядра
Тензорные ядра (Tensor Core) в микроархитектуре Turing используются для перемножения двух матриц размером 4 х 4 и складывания полученного результата с третьей матрицей аналогичного размера. При этом сами матрицы могут включать в себя целые числа или числа с запятой. Эта простая с виду операция лежит в основе обучения нейронных сетей.
В играх на основе тензорных ядер будет реализована технология сглаживания Deep Learning Super Sampling (DLSS). По уровню качества финального изображения она превосходит 64-кратное MSAA, но при этом создает меньшую нагрузку на систему. Однако поддержку DLSS необходимо реализовать еще и на уровне игр. Если таковая имеется, то существенно повышается скорость видеоряда.
RT-ядра
Трассировка лучей в режиме реального времени – это не новинка. Она уже многие годы используется в архитектуре для создания фотореалистичных интерактивных проектов зданий либо интерьеров. Также ее активно применяют в киноиндустрии, но там рендеринг каждого кадра занимает уйму времени и требует большого объема вычислительных ресурсов. Игры же выделяются вариативным геймплеем и даже NVIDIA Turing не сможет в полной мере просчитать все лучи в реальном времени, но первый шаг в этом направлении сделан с помощью RT-ядер.
Они помогают системе определить, пересекает ли виртуальный луч света определенный пиксель изображения или нет. А после этого просчитывается, насколько меняется его освещенность и как это отображается на соседних пикселях.
Сложность этой задачи такова, что все вычислительные ресурсы видеокарты NVIDIA GeForce GTX 1080 Ti обеспечивают производительность в 1,1 гигалучей за секунду (Giga Rays/s). А всего 68 RT-ядер видеокарты NVIDIA GeForce RTX 2080 Ti выдают более 10 гигалучей в секунду. При этом остальные блоки освобождаются для выполнения других задач. Кстати, тензорные ядра также участвуют в технологии трассировки лучей: они используются для подавления сопутствующих шумов.
К сожалению, такой производительности недостаточно для полноценной трассировки лучей в режиме реального времени, поэтому в NVIDIA Turing появился гибридный метод рендеринга: в некоторых эффектах может использоваться растеризация, а в других – трассировка лучей. Но, опять же, ее поддержку должны предусмотреть сами разработчики игр.
Производительность и модели заливки
Улучшения в структуре SM-модулей и архитектуре памяти, а также увеличение регистрового файла привели к 50%-ому росту производительности шейдерных блоков.
Кроме того, NVIDIA предлагает использовать новые модели заливки (Shading Model):
- Mesh Shading – предлагает заменить тесселяцию, вершинные и геометрические шейдеры на более универсальные Task Shader и Mesh Shader, чтобы ускорить обработку сложных сцен с большим количеством объектов.
- Variable Rate Shading (VRS) – позволяет разбить экран на зоны размером 16 х 16 пикселей, и внутри каждой зоны гибко менять плотность выборки пикселей. Например, если конкретная зона не нуждается в точном определении цвета пикселей, то их можно объединить в разных вариациях (1 х 2, 2 х 1, 2 х 2, 4 х 2, 2 х 4, 4 х 4), чтобы снизить нагрузку на систему. Это целесообразно для закраски изображения на периферии. А для центральной части используется более точная модель 1 х 1.
- Texture-Space Sharing – сохраняет результат заливки в памяти для последующего использования, без необходимости повторного просчета.
- Multi-View Rendering (MVR) – является дальнейшим развитием технологии Simultaneous Multi-Projection (SMP). Если SMP за один проход может отрисовать проекцию полигонов на экран с двух точек обзора, то MVR выполняет то же самое для четырех точек. Эта технология будет востребована, например, в новых поколениях VR-шлемов.
GDDR6
NVIDIA Turing первой использует видеопамять стандарта GDDR6 с пропускной способностью 14 Гбит/с на контакт. Графические процессоры поддерживают по одному 8-гигабитному чипу на каждый 32-битный контроллер памяти. В составе NVIDIA TU104 и TU106 есть по 8 контроллеров, а NVIDIA TU102 получил 11. Соответственно, имеем либо 8, либо 11 ГБ памяти. Общая пропускная способность выросла до 616 ГБ/с. Для сравнения напомним, что у HBM2 в составе AMD Radeon RX Vega 64 этот показатель достигает 484 ГБ/с. Добавьте к этому улучшенные алгоритмы компрессии данных, и вы получите 50%-ый рост эффективной пропускной способности по сравнению с предшественниками.
NVLink
Один канал NVLink с 8 линиями имеет пиковую пропускную способность в 25 ГБ/с в одном направлении (50 ГБ/с в двух направлениях). Этого достаточно для передачи кадрового буфера с разрешением 8K. Для двух каналов пропускная способность повышается до 50 и 100 ГБ/с соответственно. Этого хватит для режима 8K Surround.
Таким образом NVIDIA обеспечила мощный толчок для дальнейшего развития технологии NVIDIA SLI, но реализовать ее можно будет только в видеокартах NVIDIA GeForce RTX 2080 и RTX 2080 Ti, и лишь в режиме 2-Way для двух адаптеров. Всем желающим придется дополнительно потратиться на новый мостик NVLink Bridge.
Интерфейсы вывода изображения
Позаботилась компания и о поддержке мониторов со сверхвысоким разрешением. Для этого в стандартном наборе есть порт HDMI 2.0b с максимальным разрешением 4K @ 60 Гц, три DisplayPort 1.4a (8K @ 60 Гц) и USB Type-C (VirtualLink) для шлемов виртуальной реальности нового поколения.
Стримерам также лучше смотреть в сторону видеокарт NVIDIA Turing благодаря улучшенной поддержке кодирования HEVC и H.264, а также декодирования VP9 и HEVC.
GPU Boost 4.0
И напоследок теоретического раздела вспомним о технологии GPU Boost 4.0. Новая версия динамического оверклокинга предлагает дополнительные параметры для тонкой настройки разгона. В спецификации по-прежнему указывается некое среднее значение скорости, а не максимальное. Если система охлаждения и питания позволяют, то реальная скорость динамического разгона буде выше той, которая обозначена в спецификации.
Также разработан инструмент NVIDIA Scanner, поддержка которого уже добавлена в утилиту EVGA Precision X1. Он позволяет просканировать вашу видеокарту в автоматическом режиме и определить максимальные значение тактовой частоты и необходимые для этого рабочие напряжения. Очень удобно, особенно для новичков-любителей.
ASUS Dual GeForce RTX 2080 OC edition
Теперь давайте перейдем от теории к практике на примере видеокарты ASUS Dual GeForce RTX 2080 OC edition (DUAL-RTX2080-O8G). В первую очередь она выделяется обновленным 2,7-слотовым кулером и заводским разгоном графического процессора. Об остальных ее возможностях расскажем далее.
Спецификация
Модель |
ASUS Dual GeForce RTX 2080 OC edition (DUAL-RTX2080-O8G) |
|
Техпроцесс, нм |
12 |
|
GPU |
NVIDIA TU104-400A |
|
Микроархитектура |
NVIDIA Turing |
|
Количество CUDA-ядер |
2944 |
|
Количество текстурных блоков |
184 |
|
Количество растровых блоков |
64 |
|
Базовая / динамическая частота GPU, МГц |
«Gaming» |
1515 / 1800 |
«OC» |
1515 / 1830 |
|
Тип видеопамяти |
GDDR6 |
|
Объем, ГБ |
8 |
|
Эффективная частота, МГц |
14 000 |
|
Разрядность шины, бит |
256 |
|
Пропускная способность, ГБ/с |
448 |
|
Внутренний интерфейс |
PCI Express 3.0 x16 |
|
Внешние интерфейсы |
1 x HDMI 2.0b |
|
Дополнительные коннекторы питания |
1 х 8-контактный |
|
Рекомендованная мощность блока питания, Вт |
650 |
|
Размеры, мм |
268 х 114 х 58 |
|
Драйверы |
Свежие драйверы можно скачать с сайта компании ASUS или с сайта производителя GPU |
|
Сайт производителя |
Упаковка и комплектация
Новинка поставляется в красочной картонной упаковке с информативной полиграфией, которая отображает ключевые преимущества графического адаптера. На лицевой стороне упоминается о бесплатной 6-месячной премиум-подписке на сервис WTFast Gamers Private Network. Он автоматически оптимизирует путь прохождения игровых пакетов между компьютером пользователя и игровым сервером для минимизации их потери и уменьшения среднего времени отклика (ping).
На нижнюю сторону производитель поместил рекомендации к блоку питания: минимальная его мощность должна составлять 650 Вт, а в наборе коннекторов желательно иметь один 6-контактный и один 8-контактный PCIe. Эти рекомендации традиционно указаны с запасом, поскольку производитель не может предсказать финальную конфигурацию пользовательской системы. Реальное энергопотребление нашего тестового стенда с этой видеокартой указано на последнем графике блока тестирования.
В коробке мы обнаружили только руководство пользователя и диск с ПО.
Внешний вид
Для видеокарт серии ASUS Dual характерным является сочетание черно-белой цветовой схемы, но если раньше преобладал белый цвет, то теперь – черный. Адаптер выглядит стильно, немного агрессивно и не скучно благодаря множеству дизайнерских элементов на пластиковом кожухе.
На обратной стороне приютилась металлическая пластина жесткости. Она поддерживает массивную конструкцию системы охлаждения, предотвращая изгиб или повреждение печатной платы, а также участвует в пассивном отводе излишков тепла. Один из крепежных винтов прикрыт наклейкой, поэтому снять пластину жесткости без потери гарантии не получится.
Разобрать видеокарту ASUS Dual GeForce RTX 2080 OC edition нам не разрешили, поэтому заглянуть внутрь и показать вам подсистему питания с элементной базой мы не можем. Даже на официальном сайте отсутствует эта информация.
В наборе же внешних интерфейсов используется стандартный перечень портов:
- 1 x HDMI 2.0b
- 3 x DisplayPort 1.4a
- 1 x USB Type-C
Максимальное разрешение составляет 7680 х 4320.
В верхней части возле интерфейсной панели находится традиционный разъем для реализации технологии NVIDIA SLI. Правда, теперь для этого подходят только мостики NVLink Bridge. В младших моделях (NVIDIA GeForce RTX 2070 и других) поддержка этой технологии отсутствует.
Для корректной работы видеокарты ASUS DUAL-RTX2080-O8G необходимо подключить два дополнительных коннектора питания PCIe: один 6-контактный и один 8-контактный. Вместе со слотом PCIe 3.0 x16 они смогут подать до 300 Вт мощности. Этого хватит даже для оверклокерских экспериментов.
В основе ASUS DUAL-RTX2080-O8G находится графический процессор NVIDIA TU104-400A с поддержкой 2944 CUDA-ядер. Тестирование проводилось в режиме «Gaming», который используется по умолчанию. Он характеризуются разгоном динамической частоты GPU с эталонных 1710 до 1800 МГц. А вот базовая скорость осталась на референсном уровне.
Подсистема видеопамяти набрана с помощью GDDR6-микросхем компании Micron общим объемом 8 ГБ. Эффективная частота составляет 14 ГГц, что при 256-битной шине дает пропускную способность в 448 ГБ/с.
На официальной страничке указано о наличии профиля «OC» с разгоном динамической частоты GPU до 1830 МГц. Но там не упоминается режим «Silent», который также есть в фирменной утилите GPU Tweak II. Он снижает динамическую скорость до 1770 МГц. Эффективная частота видеопамяти во всех случаях остается неизменной.
Подсветка в конструкции видеокарты ASUS DUAL-RTX2080-O8G не предусмотрена.
Система охлаждения
Кулер – это одно из ключевых изменений в дизайне нового представителя серии ASUS Dual. Он занимает 2,7 слота расширения, а общие габариты графического адаптера составляют 268 х 114 х 58 мм. Поэтому перед покупкой обязательно убедитесь, что в корпусе достаточно места для новинки.
Конструкция системы охлаждения состоит из массивного алюминиевого радиатора без тепловых трубок, но с большим основанием. На обороте приютилась пластина жесткости, которая также принимает участие в отводе тепла. За активный обдув отвечает пара 88-мм осевых вентиляторов с дизайном Wing-blade и защитой от пыли (IP5X).
В автоматическом режиме работы системы охлаждения, при максимальной нагрузке температура графического процессора достигала 78°С. Вентиляторы вращались на 60% (1989 об/мин) от своей максимальной скорости, создавая очень тихий фоновый шум, который абсолютно не мешал работе. Напомним, что критической для GPU считается температура в 88°С.
После принудительной установки скорости вентиляторов на 100% (3259 – 3239 об/мин), температура GPU опустилась до более приятных 63°С. Шум превысил средний уровень и перестал быть комфортным для постоянного использования.
В режиме простоя вентиляторы прекратили свою работу благодаря технологии 0dB, а температура графического процессора уменьшилась до 48°С. В активный режим пропеллеры возвращались лишь тогда, когда температура GPU поднималась до 56°С.
Система охлаждения видеокарты ASUS Dual GeForce RTX 2080 OC edition даже в автоматическом режиме удержала температуру графического процессора в рабочих пределах, но до критической отметки осталось всего 10°С. При максимальной скорости вращения вентиляторов у нее есть хороший запас прочности, но тогда придется жертвовать акустическим комфортом. Никаких посторонних звуков в виде раздражающего писка дросселей в процессе тестирования замечено не было.
Официальный релиз видеокарт линейки NVIDIA GeForce RTX 20
Вечером 20 августа в немецком Кельне компания NVIDIA официально презентовала серию массовых игровых видеокарт NVIDIA GeForce RTX 20, первыми в которую вошли три модели: NVIDIA GeForce RTX 2080 Ti, GeForce RTX 2080 и GeForce RTX 2070. Они объединяют преимущества новой архитектуры NVIDIA Turing и платформы NVIDIA RTX, включающей шейдеры нового поколения с трассировкой лучей в реальном времени и новыми возможностями искусственного интеллекта.
Новая гибридная графика демонстрирует самый большой скачок между поколениями в истории игровых GPU. Архитектура Turing, которая в определенных задачах обеспечивает шестикратный прирост производительности по сравнению с предшественницей Pascal, меняет представление о ПК как об передовой игровой платформе благодаря новым функциям и технологиям, обеспечивающим 4K HDR-гейминг при 60 кадрах в секунду даже в самых требовательных играх.
Список ключевых возможностей линейки NVIDIA GeForce RTX 20 выглядит следующим образом:
- Новые RT-ядра обеспечивают трассировку лучей в реальном времени для объектов и сред с физически правильными тенями, отражениями, преломлениями и глобальным освещением.
- Тензорные ядра Turing обеспечивают молниеносную работу глубоких нейронных сетей.
- Новый фреймворк нейронной графики NGX интегрирует ИИ в весь графический конвейер, позволяя улучшать и генерировать изображения с помощью алгоритмов ИИ.
- Новая шейдерная архитектура Turing с поддержкой Variable Rate Shading позволяет шейдерам направлять большую часть ресурсов на области с высокой детализацией, что повышает общую производительность.
- Новая ультрабыстрая память GDDR6 с полосой пропускания свыше 600 ГБ/с для динамичного гейминга в высоком разрешении.
- NVIDIA NVLink, высокоскоростной интерфейс с более широкой полосой пропускания (до 100 ГБ/с) и улучшенной масштабируемостью для конфигураций мульти-GPU.
- Аппаратная поддержка USB Type-C и VirtualLink, нового открытого стандарта, который отвечает требованиям VR-шлемов нового поколения с разъемом USB-C с точки зрения питания, визуализации и полосы пропускания.
- Новые улучшенные технологии повышения производительности VR-приложений, включая Variable Rate Shading, Multi-View Rendering и VRWorks Audio.
Уже традиционно в продаже будут версии Founders Edition, созданные непосредственно компанией NVIDIA. И в этот раз они будут отличаться от референсных моделей (Reference) тактовыми частотами GPU и энергопотреблением. К тому же версии Founders Edition могут похвастать следующими преимуществами:
- 13-фазным питанием с использованием микросхем DrMOS и оперативным управлением питания для максимального разгона.
- Наличием двух 13-лопастных осевых вентилятора, которые обеспечивают в три раза больший воздушный поток при минимальном уровне шума.
- Использованием литого алюминиевого корпуса, который служит прочной и легкой рамой для открытой конструкции с плавными изгибами.
- Наличием испарительной камеры вдвое большего размера для максимально эффективного отвода тепла.
- Использованием улучшенного порта DisplayPort 1.4a с DSC, что позволяет подключать 8K-монитор на 60 Гц.
Что же касается платформы NVIDIA RTX, то многие ведущие издатели и разработчики игр, а также создатели движков, объявили о ее поддержке. Она появится в Battlefield V, Shadow of the Tomb Raider, Metro Exodus, Control, Assetto Corsa Competizione и во многих других. Всего же во время презентации был показан список из 21 игры, в которой планируется поддержка NVIDIA RTX. Кроме того, эту платформу также берут на вооружение многие разработчики профессиональных приложений рендеринга, включая Adobe, Autodesk и Pixar.
Сводная таблица технических характеристик видеокарт линейки NVIDIA GeForce RTX 20:
SIGGRAPH 2018: Дебют микроархитектуры NVIDIA Turing и видеокарт линейки NVIDIA Quadro RTX
В рамках SIGGRAPH 2018 компания NVIDIA представила новую микроархитектуру Turing и линейку профессиональных видеокарт на ее основе – NVIDIA Quadro RTX. Также анонсирована NVIDIA Quadro RTX Server – референсная архитектура для построения настраиваемых решений для рендеринга по требованию и виртуальных рабочих станций из дата-центра.
Turing позиционируется компанией NVIDIA как самый большой технологический прыжок с момента перехода на дизайн CUDA в 2006 году. Топовая версия GPU располагает 18,6 млрд транзисторов на площади 754 мм2. Turing совмещает в себе технологии трассировки лучей в режиме реального времени (Real-Time Ray Tracing), искусственного интеллекта (Artificial intelligence, AI), симуляции и растеризации, чтобы изменить само восприятие компьютерной графики.
Вот лишь несколько ключевых инноваций этой микроархитектуры:
- Новый тип ядер RT Cores (Ray Tracing) предназначен для расчета в режиме реального времени движения световых и звуковых волн в 3D-среде со скоростью 10 Гига Лучей/с. Это в 25 раз быстрее, чем NVIDIA Pascal. Может использоваться для финального рендеринга эффектов в фильмах и анимации.
- Обновленные ядра Tensor Cores для ускорения процессов глубинного обучения. Обеспечивают выполнение 500 трлн Tensor операций в секунду. Используются для ускорения работы алгоритмов AI, например, шумоподавления, масштабирования и других.
- Обновленные потоковые мультипроцессоры (Streaming Multiprocessor, SM) улучшают скорость растеризации по сравнению с NVIDIA Pascal и позволяют более комфортно взаимодействовать с большими моделями и сценами, а также повышают производительность VR. В частности, новая архитектура SM обеспечивает выполнение до 16 трлн операций с плавающей точкой (16 TFLOPS) параллельно с 16 трлн целочисленных операций (16 TIPS). Разработчики могут задействовать до 4608 CUDA-ядер для создания сложных комплексных симуляций, например, динамического взаимодействия частиц или жидкостей.
- Поддержка технологии NVIDIA NVLink, которая позволяет объединять два GPU для удвоения общего объема памяти и повышения скорости передачи данных до 100 ГБ/с.
- Аппаратная поддержка интерфейсов USB Type-C и VirtualLink для нового поколения VR-шлемов.
- Поддержка новых и улучшенных версий технологий Variable Rate Shading, Multi-View Rendering и VRWorks Audio для повышения качества VR-контента.
Новая серия профессиональных видеокарт на основе микроархитектуры NVIDIA Turing включает в себя три модели: NVIDIA Quadro RTX 8000, NVIDIA Quadro RTX 6000 и NVIDIA Quadro RTX 5000. Все они характеризуются двухслотовым дизайном кулер с одним вентилятором турбинного типа, поддержкой интерфейса VirtualLink для VR-шлемов нового поколения и несколькими интерфейсами DisplayPort 1.4 (в спецификации на сайте – 4, в демонстрационном образце – 3).
Для большего удобства их анонсированные характеристики сведены в общую таблицу:
Читать новость полностью >>>Печатная плата видеокарты NVIDIA GeForce GTX 1180 (или GTX 2080) красуется на камеру
На одном из китайских форумов разместили фото печатной платы PG180 видеокарты NVIDIA GeForce GTX 1180 (или GTX 2080, но об этом чуть ниже). В левой части привычно расположились контактные площадки для четырех видеоинтерфейсов. Это может быть комбинация 3 x DisplayPort + 1 x HDMI или 2 x DisplayPort + 2 HDMI. За ними находится посадочное место под GPU и восемь микросхем памяти. Если новая микроархитектура по-прежнему использует 32-битные контроллеры памяти, то получим 256-битную шину.
Подсистема питания NVIDIA GeForce GTX 1180 включает в себя 10 фаз для GPU (хотя это может быть 5 фаз с удвоением) и 2 фазы для памяти (или одна фаза с удвоением). Для корректной работы предусмотрены два коннектора PCIe: 6- и 8-контактный. Вместе они могут выдать питание мощностью 225 Вт, и это помимо 75 Вт от слота PCI Express x16, что весьма странно, ведь GeForce GTX 1180 ожидается с TDP на уровне 180 Вт.
Интересно выглядит и разъем для Multi-GPU. Он напоминает комбинированный коннектор NVIDIA SLI и NVLink. Возможно, таким образом NVIDIA решила увеличить его пропускную способность, чтобы иметь возможность эффективно работать с высокими разрешениями (4K, 5K или 8K), поддерживать HDR, высокую глубину цвета и частоту развертки. Но пока это лишь предположения.
Кстати, о предположениях. На сайте Евразийской экономической комиссии 20 июля появилась регистрационная карточка компании Manli, партнера NVIDIA, в которой замечены графические процессоры NVIDIA GA104 и GA104-400, а также наименования новых видеокарт – NVIDIA GeForce GTX 2070 и GTX 2080. Поэтому не исключено, что новая микроархитектура получила название NVIDIA Ampere, а видеокарты будут представлять серию NVIDA GeForce GTX 20. Все точки над «і» должна расставить презентация NVIDIA, которая запланирована на 20 августа.
https://www.techpowerup.com
Сергей Будиловский
Анонсирована версия графического ускорителя NVIDIA Tesla V100 с интерфейсом PCI Express 3.0
Чуть более месяца назад компания NVIDIA представила графический ускоритель NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. Он предназначается для использования в системах глубинного обучения и научных исследований, а также оснащается интерфейсом NVLink.
Теперь NVIDIA представила вариацию этого видеоадаптера в виде классической видеокарты с использованием интерфейса PCI Express 3.0. Графическое ядро NVIDIA GV100 обладает 5120 CUDA-ядрами FP32, 2560 FP64 и 640 Tensor Core, а динамическая частота его работы достигает 1370 МГц, что несколько ниже 1455 МГц у ранее представленной версии видеоадаптера. В связи с этим пиковая вычислительная мощность FP32 и FP64 уменьшилась с 15 / 7,5 TFLOPS до 14 / 7 TFLOPS соответственно, а уровень TDP данной модификации NVIDIA Tesla V100 снизился с 300 до 250 Вт. Видеобуфер представлен теми же 16 ГБ HBM2-памяти с пропускной способностью 900 ГБ/с.
Новинка рассчитана на использование в серверах глубинного обучения, научных исследований и анализа. Она появится на рынке до конца текущего года.
Читать новость полностью >>>Представлен графический ускоритель NVIDIA Tesla V100
В прошлом году на выставке GTC 2016 был дан старт появлению микроархитектуры NVIDIA Pascal путем анонса графического ускорителя NVIDIA Tesla P100. В этом году, в рамках GTC 2017, представлен его приемник в виде NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. В его основе находится графический процессор NVIDIA GV100, построенный на базе 12-нм технологии FFN от TSMC. Это самый большой GPU в арсенале компании – его площадь составляет 815 мм2, а общее количество транзисторов превысило 21 млрд. Кстати, на создание NVIDIA Tesla V100 потребовалось $3 млрд.
Первым важным нововведением в NVIDIA GV100 является интеграция особых ядер – Tensor Core, которые предназначены для ускорения процессов глубинного обучения. Вторым является использование интерфейса NVLink 2.0 с пропускной способностью 300 ГБ/с. В целом структура NVIDIA GV100 включает в себя 80 SM-блоков. Каждый из них содержит 64 CUDA-ядер для вычислений одинарной точности (FP32), 32 CUDA-ядер для вычислений двойной точности (FP64) и 8 ядер Tensor Core. В итоге мы имеем 5120 ядер FP32, 2560 FP64 и 640 Tensor Core. Динамическая частота работы GPU достигает 1455 МГц. В массовых пользовательских видеокартах CUDA-ядра FP64 не используются. Вряд ли мы увидим и Tensor Core.
Кстати, это еще не максимальная конфигурация, поскольку 4 SM-блока отключены. Вполне возможно, что в будущем мы увидим видеокарту NVIDIA TITAN Xv c 84 SM-блоками и 5376 CUDA-ядрами, как это произошло с NVIDIA TITAN Xp.
Подсистема видеопамяти NVIDIA Tesla V100 включает в себя 16 ГБ HBM2 с 4096-битной шиной, что соответствует показателю NVIDIA Tesla P100. Однако пропускная способность памяти в новинке достигла 900 ГБ/с, а у предшественника она составляла 720 ГБ/с. Сводная таблица технической спецификации графических адаптеров серии NVIDIA Tesla:
NVIDIA на GTC 2016: анонс микроархитектуры NVIDIA Pascal и ряд других инноваций
В калифорнийском городе Сан-Хосе успешно стартовала GPU Technology Conference (GTC), в рамках которой компания NVIDIA сделала ряд важных анонсов своих будущих продуктов. В первую очередь многих интересует микроархитектура NVIDIA Pascal, поэтому с нее и начнем.
NVIDIA Tesla P100
Первым официальным анонсом новой микроархитектуры стали не массовые пользовательские видеокарты, а ускоритель для сверхмасштабируемых дата-центров − NVIDIA Tesla P100. С его помощью можно создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Мощности подобных решений будет достаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.
Модель NVIDIA Tesla P100 использует пять передовых технологий для обеспечения высокой производительности и эффективности использования ресурсов:
- Микроархитектура NVIDIA Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе NVIDIA Maxwell.
- Высокоскоростной интерфейс NVIDIA NVLink используется для связи между несколькими графическими процессорами. Он более эффективно распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVIDIA NVLink позволяет связать до восьми GPU NVIDIA Tesla P100. IBM уже внедрила этот интерфейс в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
- 16-нм FinFET-технология позволила интегрировать в процессор 15,3 млрд. транзисторов, что гарантирует высочайшую производительность и энергоэффективность.
- Инновационный подход к строению памяти Chip-on-Wafer-on-Substrate (CoWoS) с HBM2 повышает пропускную способность в 3 раза (до 720 ГБ/с) по сравнению с архитектурой NVIDIA Maxwell.
- Новые алгоритмы искусственного интеллекта обеспечивают пиковую производительность свыше 21 TFLOPS в задачах глубокого обучения.
Использование ускорителя NVIDIA Tesla P100 позволяет достичь феноменальных результатов. Например, приложение молекулярной динамики AMBER работает быстрее на одном сервере с NVIDIA Tesla P100, чем на 48 обычных двухсокетных серверных узлах. А для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU NVIDIA Tesla P100.
Ключевые характеристики NVIDIA Tesla P100:
Модель |
NVIDIA Tesla P100 |
Тип памяти |
CoWoS HBM2 |
Объем памяти |
16 ГБ |
Полоса пропускания |
720 ГБ/с |
Интерфейс |
Двунаправленный NVIDIA NVLink |
Пропускная способность интерфейса |
160 ГБ/с |
Скорость вычислений двойной точности |
5,3 TFLOPS |
Скорость вычислений одинарной точности |
10,6 TFLOPS |
Скорость вычислений половинной точности |
21,2 TFLOPS |
Дополнительные преимущества |
Улучшенная программируемость с движком перехода по страницам и унифицированной памятью |