Новая видеокарта NVIDIA с поддержкой 124 блоков CU и 7936 ядер CUDA
На прошлой неделе в базе данных Geekbench засветились две новые видеокарты NVIDIA. Одна получила 118 вычислительных блоков (CU), 7552 ядер CUDA и 24 ГБ собственной памяти. А вторая использует 108 модулей CU, 6912 ядер CUDA и 48 ГБ памяти.
На днях в Geekbench замечена еще более мощная видеокарта NVIDIA. Она имеет в своем составе 124 блока CU, что эквивалентно 7936 ядрам CUDA. Максимальная их частота составляет 1,11 ГГц. В паре с GPU работает 32 ГБ видеопамяти (возможно, HBM2e) с частотой 1,2 ГГц.
Можно только предположить, что в полноценном дизайне предусмотрено 128 блоков CU и 8192 ядер CUDA. Хотя подобный чип может и не поступить в продажу из-за высокого процента брака при производстве. Например, полноценный дизайн GPU NVIDIA GV100 (Volta) для графических ускорителей Tesla V100 и Quadro GV100 предполагает наличие 84 блоков CU, но финальный вариант получил лишь 80 CU, чтобы повысить количество годных чипов в процессе производства.
То есть замеченный видеоускоритель NVIDIA с поддержкой 124 модулей CU как раз может быть новым флагманом, о котором нам расскажет Дженсен Хуан (Jensen Huang) во время онлайн-выступления в рамках GTC 2020.
https://videocardz.com
Сергей Будиловский
Замечены два новых GPU NVIDIA с огромным количеством ядер CUDA
Twitter-аккаунт «_rogame» опубликовал ссылки на две очень интересные записи в базе данных Geekbench. Обе представленные системы собраны на базе связки процессора Intel Core i7-8700K и материнской платы ASUS Prime Z370-A или Prime Z370-A II. Но главные их особенности кроются в используемых видеокартах компании NVIDIA.
В первом случае графический процессор включает в себя 118 вычислительных блоков CU с максимальной тактовой частотой 1,11 ГГц и 23,8 ГБ видеопамяти. Если каждый CU по-прежнему использует 64 ядра CUDA, то общее их количество составляет внушительные 7552. Для сравнения: в составе NVIDIA GV100 (Tesla V100S) есть лишь 80 блоков CU (5120 ядер CUDA), а NVIDIA TU102 (Titan RTX) получил 72 блока CU (4608 ядер CUDA).
Вторая видеокарта содержит 108 вычислительных модулей в составе GPU (6912 ядер CUDA), которые работают на более низкой частоте (1,01 ГГц). Зато объем ее видеопамяти почти в 2 раза больше – 46,8 ГБ.
Результаты этих новинок составляют 184 096 и 141 654 баллов соответственно. Для сравнения: самые высокие показатели видеоускорителей Tesla V100 и Quadro RTX 8000 в этом же бенчмарке составляют 171 075 и 143 438 баллов соответственно. Возможно, NVIDIA подробнее расскажет об этих новинка в рамках GPU Technology Conference (GTC) (21 – 26 марта), если и ее не отменят из-за COVID-2019.
https://www.tomshardware.com
Сергей Будиловский
NVIDIA Tesla V100s – самый быстрый графический ускоритель для рабочих задач
NVIDIA представила свой самый быстрый графический ускоритель в серии Tesla V100. Он создан для использования в составе систем HPC, чтобы ускорить симуляцию исследовательских проектов и обучение искусственного интеллекта.
Новинка создана в формате карты расширения с интерфейсом PCIe. NVIDIA не сообщает подробности GPU модели Tesla V100s. Скорее всего, речь идет о 12-нм NVIDIA GV100 (Volta), который лежит в основе двух других ускорителей серии Tesla V100. Бонус производительности достигается за счет повышения эффективной частоты видеопамяти HBM2 с 876 до 1106 МГц. В итоге пропускная способность памяти поднялась с 900 до 1134 ГБ/с. Производительность увеличилась на 16-17% по сравнению с моделью NVIDIA Tesla V100 (PCIe).
Стоимость новинки не сообщается. Сводная таблица технической спецификации графического ускорителя NVIDIA Tesla V100s:
Модель |
NVIDIA Tesla V100s (PCIe) |
NVIDIA Tesla V100 (PCIe) |
NVIDIA Tesla V100 (NVLink) |
Тип видеопамяти |
HBM2 |
||
Объем, ГБ |
32 |
16 / 32 |
16 / 32 |
Эффективная частота, МГц |
1106 |
876 |
876 |
Разрядность шины, бит |
4096 |
||
Пропускная способность, ГБ/с |
1134 |
900 |
900 |
Внутренний интерфейс |
PCIe |
PCIe |
NVLink |
Пропускная способность внутреннего интерфейса, ГБ/с |
32 |
32 |
300 |
Пиковая производительность двойной точности, TFLOPS |
8,2 |
7 |
7,8 |
Пиковая производительность одинарной точности, TFLOPS |
16,4 |
14 |
15,7 |
Пиковая производительность в сценариях глубинного обучения, TFLOPS |
130 |
112 |
125 |
Максимальная мощность потребления, Вт |
250 |
250 |
300 |
https://www.techpowerup.com
https://www.nvidia.com
Сергей Будиловский
И все-таки Volta: HWiNFO наносит сокрушительный удар по Turing
Отсутствие официальной позиции – благодатная почва для рождения различных слухов и домыслов. Ранее в своих планах компания NVIDIA официально заявляла, что после линейки Pascal она представит Volta. И свое обещание она выполнила весной 2017 года, презентовав графический ускоритель NVIDIA Tesla V100 на базе 12-нм GPU NVIDIA GV100.
С того времени прошло уже больше года, но Volta так и не дебютировала на рынке массовых пользовательских видеокарт, что породило множество слухов. Одни источники сообщали о серии Amper в качестве преемницы Pascal, другие уверяли, что NVIDIA оставила Volta для рынка профессиональных адаптеров, а на массовом появится Turing.
И вот когда Turing уже действительно воспринимался всерьез, утилита HWiNFO в списке изменений сообщает о скорой поддержке чипов NVIDIA GV102 и GV104. Соответственно, видеокарты новой линейки NVIDIA GeForce GTX 11 все же построены на основе NVIDIA Volta. А что такое Turing – внутреннее кодовое название, отдельная линейка новых продуктов или утка маркетологов NVIDIA – мы, возможно, так и не узнаем.
http://www.guru3d.com
Сергей Будиловский
NVIDIA Quadro GV100 – самый мощный в мире профессиональный видеоускоритель
В рамках GPU Technology Conference компания NVIDIA представила свою самую новую и по совместительству самую мощную профессиональную видеокарту – NVIDIA Quadro GV100. Она предназначена для использования в рабочих станциях в сфере автомобилестроения, архитектуры, инжинерии, развлечений и здравохранения. Новинка способна ускорить процессы глубинного обучения, рендеринга и симуляции.
В основе данной видеокарты находится графический процессор NVIDIA GV100, построенный на базе 12-нм микроархитектуры NVIDIA Volta. Он имеет в своей структуре 21,1 млрд. транзисторов, размещенных на площади 815 мм2. А с точки зрения логических блоков его структура выглядит таким образом: 5120 CUDA-ядер, 640 ядер Tensor, 320 текстурных и 128 растровых модулей. Базовая тактовая частота GPU составляет 1200 МГц, а динамическая – 1447 МГц. Интегрированная HBM2-видеопамять общим объемом 32 ГБ использует 4096-битную шину и работает на эффективной частоте 1700 МГц, что обеспечивает пропускную способность в 870,4 ГБ/с.
В итоге пиковая производительность половинной точности NVIDIA Quadro GV100 достигает 29,6 TFLOPS, единичной – 14,8 TFLOPS, а двойной – 7,4 TFLOPS. Производительность ядер Tensor гораздо выше – 118,5 TFLOPS. Для корректной работы новинка требует подключения одного 6-контактного и одного 8-контактного коннектора PCIe. Ее TDP составляет 250 Вт. За активное охлаждение внутренних компонентов отвечает фирменный кулер с одним вентилятором радиального типа, а в наборе внешних интерфейсов присутствуют четыре порта DisplayPort.
В продажу NVIDIA Quadro GV100 поступит с нескромным ценником в $8999.
https://www.techpowerup.com
https://www.nvidia.com
Сергей Будиловский
Официальный дебют флагманской видеокарты NVIDIA TITAN V
В середине текущего года была представлена первая видеокарта на базе новой микроархитектуры NVIDIA Volta – NVIDIA Tesla V100. Она предназначается для использования в системах глубинного обучения и для научных исследований. Теперь в арсенале NVIDIA официально появился второй представитель этой серии – NVIDIA TITAN V. Эта новинка уже предназначена для персональных компьютеров и позиционируется в качестве самой мощной из когда-либо созданных видеокарт.
В основе NVIDIA TITAN V находится топовый графический процессор NVIDIA GV100, произведенный по 12-нм технологии FinFET+ компанией TSMC. Он состоит из 21,1 млрд. транзисторов. Его структура разделена на 6 кластеров GPC (Graphics Processing Clusters) и включает в себя 80 потоковых мультипроцессоров, каждый из которых состоит из 64 CUDA-ядер, 8 Tensor-ядер (предназначены для ускорения процессов глубинного обучения) и 4 текстурных блоков. То есть общее их количество достигает 5120, 640 и 320 соответственно. Базовая частота GPU составляет 1200 МГц, а динамическая повышается до 1455 МГц.
Подсистема видеопамяти представлена тремя стеками HBM2-памяти общим объемом 12 ГБ с эффективной частотой 1,7 ГГц. Благодаря 3072-битной шине памяти общая пропускная способность достигает 652,8 ГБ/с. А для охлаждения внутренних компонентов используется фирменный дизайн кулера с одним вентилятором радиального типа.
В наборе внешних интерфейсов NVIDIA TITAN V находятся три порта DisplayPort и один HDMI. Для корректной работы видеокарте требуется подключение одного 6-контактного и одного 8-контактного коннектора PCIe. TDP новинки составляет 250 Вт, а рекомендованный ценник заявлен на уровне $2999.
https://www.techpowerup.com
https://www.nvidia.com
Сергей Будиловский
Анонсирована версия графического ускорителя NVIDIA Tesla V100 с интерфейсом PCI Express 3.0
Чуть более месяца назад компания NVIDIA представила графический ускоритель NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. Он предназначается для использования в системах глубинного обучения и научных исследований, а также оснащается интерфейсом NVLink.
Теперь NVIDIA представила вариацию этого видеоадаптера в виде классической видеокарты с использованием интерфейса PCI Express 3.0. Графическое ядро NVIDIA GV100 обладает 5120 CUDA-ядрами FP32, 2560 FP64 и 640 Tensor Core, а динамическая частота его работы достигает 1370 МГц, что несколько ниже 1455 МГц у ранее представленной версии видеоадаптера. В связи с этим пиковая вычислительная мощность FP32 и FP64 уменьшилась с 15 / 7,5 TFLOPS до 14 / 7 TFLOPS соответственно, а уровень TDP данной модификации NVIDIA Tesla V100 снизился с 300 до 250 Вт. Видеобуфер представлен теми же 16 ГБ HBM2-памяти с пропускной способностью 900 ГБ/с.
Новинка рассчитана на использование в серверах глубинного обучения, научных исследований и анализа. Она появится на рынке до конца текущего года.
Читать новость полностью >>>Следующая линейка видеокарт NVIDIA GeForce не будет использовать память HBM2?
Новая микроархитектура NVIDIA Volta дебютировала в мае путем анонса графического ускорителя NVIDIA Tesla V100. Он построен на основе самого большого GPU в арсенале компании – NVIDIA GV100. Его площадь составляет 815 мм2, а общее количество транзисторов превысило 21 млрд. Он разработан для применения в системах искусственного интеллекта и глубинного обучения.
Конечно, представители следующего поколения массовых пользовательских видеокарт NVIDIA GeForce не получат этот GPU, поскольку это было бы слишком рискованно и дорого. Вместо него ожидаем увидеть технологический потенциал графических процессоров NVIDIA GV102, GV104, GV106 и GV108 (если NVIDIA cохранит привычную схему наименований).
Также проверенный источник, близкий к NVIDIA, заявляет, что новые видеокарты NVIDIA GeForce не смогут похвастать наличием памяти HBM2, поскольку этот тип памяти будет слишком дорогим, что повлияет на конечную стоимость продукта. Поэтому NVIDIA будет использовать возможности GDDR5X-памяти, скоростные показатели которой уже могут достигать уровня 16 Гбит/с. Не исключена также интеграция стандарта GDDR6, однако пока уверенно говорить об этом еще рано.
Вполне возможно, что NVIDIA также заняла выжидательную позицию в связи со скорым релизом графических адаптеров AMD Radeon Vega с использованием HBM2-видеопамяти и реакцией рынка на это событие.
Представлен графический ускоритель NVIDIA Tesla V100
В прошлом году на выставке GTC 2016 был дан старт появлению микроархитектуры NVIDIA Pascal путем анонса графического ускорителя NVIDIA Tesla P100. В этом году, в рамках GTC 2017, представлен его приемник в виде NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. В его основе находится графический процессор NVIDIA GV100, построенный на базе 12-нм технологии FFN от TSMC. Это самый большой GPU в арсенале компании – его площадь составляет 815 мм2, а общее количество транзисторов превысило 21 млрд. Кстати, на создание NVIDIA Tesla V100 потребовалось $3 млрд.
Первым важным нововведением в NVIDIA GV100 является интеграция особых ядер – Tensor Core, которые предназначены для ускорения процессов глубинного обучения. Вторым является использование интерфейса NVLink 2.0 с пропускной способностью 300 ГБ/с. В целом структура NVIDIA GV100 включает в себя 80 SM-блоков. Каждый из них содержит 64 CUDA-ядер для вычислений одинарной точности (FP32), 32 CUDA-ядер для вычислений двойной точности (FP64) и 8 ядер Tensor Core. В итоге мы имеем 5120 ядер FP32, 2560 FP64 и 640 Tensor Core. Динамическая частота работы GPU достигает 1455 МГц. В массовых пользовательских видеокартах CUDA-ядра FP64 не используются. Вряд ли мы увидим и Tensor Core.
Кстати, это еще не максимальная конфигурация, поскольку 4 SM-блока отключены. Вполне возможно, что в будущем мы увидим видеокарту NVIDIA TITAN Xv c 84 SM-блоками и 5376 CUDA-ядрами, как это произошло с NVIDIA TITAN Xp.
Подсистема видеопамяти NVIDIA Tesla V100 включает в себя 16 ГБ HBM2 с 4096-битной шиной, что соответствует показателю NVIDIA Tesla P100. Однако пропускная способность памяти в новинке достигла 900 ГБ/с, а у предшественника она составляла 720 ГБ/с. Сводная таблица технической спецификации графических адаптеров серии NVIDIA Tesla: