up
ru ua en
menu

Ru.gecid.com 160x600.jpg


nvlink

Выбрать из: Обзоров Новостей
Только в разделе
Искать в найденом тег:

Анонсирована версия графического ускорителя NVIDIA Tesla V100 с интерфейсом PCI Express 3.0

Чуть более месяца назад компания NVIDIA представила графический ускоритель NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. Он предназначается для использования в системах глубинного обучения и научных исследований, а также оснащается интерфейсом NVLink.

NVIDIA Tesla V100

Теперь NVIDIA представила вариацию этого видеоадаптера в виде классической видеокарты с использованием интерфейса PCI Express 3.0. Графическое ядро NVIDIA GV100 обладает 5120 CUDA-ядрами FP32, 2560 FP64 и 640 Tensor Core, а динамическая частота его работы достигает 1370 МГц, что несколько ниже 1455 МГц у ранее представленной версии видеоадаптера. В связи с этим пиковая вычислительная мощность FP32 и FP64 уменьшилась с 15 / 7,5 TFLOPS до 14 / 7 TFLOPS соответственно, а уровень TDP данной модификации NVIDIA Tesla V100 снизился с 300 до 250 Вт. Видеобуфер представлен теми же 16 ГБ HBM2-памяти с пропускной способностью 900 ГБ/с.

NVIDIA Tesla V100

Новинка рассчитана на использование в серверах глубинного обучения, научных исследований и анализа. Она появится на рынке до конца текущего года.

guru3d.com
Юрий Коваль

Тэги: nvidia   nvidia tesla   pci express 3.0   pci express   gv100   nvlink   nvidia gv100   hbm2   cuda   volta   
Читать новость полностью >>>

Представлен графический ускоритель NVIDIA Tesla V100

В прошлом году на выставке GTC 2016 был дан старт появлению микроархитектуры NVIDIA Pascal путем анонса графического ускорителя NVIDIA Tesla P100. В этом году, в рамках GTC 2017, представлен его приемник в виде NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. В его основе находится графический процессор NVIDIA GV100, построенный на базе 12-нм технологии FFN от TSMC. Это самый большой GPU в арсенале компании – его площадь составляет 815 мм2, а общее количество транзисторов превысило 21 млрд. Кстати, на создание NVIDIA Tesla V100 потребовалось $3 млрд.

NVIDIA Tesla V100

Первым важным нововведением в NVIDIA GV100 является интеграция особых ядер – Tensor Core, которые предназначены для ускорения процессов глубинного обучения. Вторым является использование интерфейса NVLink 2.0 с пропускной способностью 300 ГБ/с. В целом структура NVIDIA GV100 включает в себя 80 SM-блоков. Каждый из них содержит 64 CUDA-ядер для вычислений одинарной точности (FP32), 32 CUDA-ядер для вычислений двойной точности (FP64) и 8 ядер Tensor Core. В итоге мы имеем 5120 ядер FP32, 2560 FP64 и 640 Tensor Core. Динамическая частота работы GPU достигает 1455 МГц. В массовых пользовательских видеокартах CUDA-ядра FP64 не используются. Вряд ли мы увидим и Tensor Core.

NVIDIA Tesla V100

Кстати, это еще не максимальная конфигурация, поскольку 4 SM-блока отключены. Вполне возможно, что в будущем мы увидим видеокарту NVIDIA TITAN Xv c 84 SM-блоками и 5376 CUDA-ядрами, как это произошло с NVIDIA TITAN Xp.

NVIDIA Tesla V100

Подсистема видеопамяти NVIDIA Tesla V100 включает в себя 16 ГБ HBM2 с 4096-битной шиной, что соответствует показателю NVIDIA Tesla P100. Однако пропускная способность памяти в новинке достигла 900 ГБ/с, а у предшественника она составляла 720 ГБ/с. Сводная таблица технической спецификации графических адаптеров серии NVIDIA Tesla:

Тэги: nvidia   nvidia tesla   cuda   hbm2   pascal   titan x   volta   nvlink   gp100   kepler   maxwell   gk110   gm200   titan xp   tsmc   nvidia gv100   gv100   
Читать новость полностью >>>

NVIDIA на GTC 2016: анонс микроархитектуры NVIDIA Pascal и ряд других инноваций

В калифорнийском городе Сан-Хосе успешно стартовала GPU Technology Conference (GTC), в рамках которой компания NVIDIA сделала ряд важных анонсов своих будущих продуктов. В первую очередь многих интересует микроархитектура NVIDIA Pascal, поэтому с нее и начнем.

NVIDIA Tesla P100

NVIDIA Tesla P100

Первым официальным анонсом новой микроархитектуры стали не массовые пользовательские видеокарты, а ускоритель для сверхмасштабируемых дата-центров − NVIDIA Tesla P100. С его помощью можно создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Мощности подобных решений будет достаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.

NVIDIA Tesla P100

Модель NVIDIA Tesla P100 использует пять передовых технологий для обеспечения высокой производительности и эффективности использования ресурсов:

  • Микроархитектура NVIDIA Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе NVIDIA Maxwell.
  • Высокоскоростной интерфейс NVIDIA NVLink используется для связи между несколькими графическими процессорами. Он более эффективно распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVIDIA NVLink позволяет связать до восьми GPU NVIDIA Tesla P100. IBM уже внедрила этот интерфейс в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
  • 16-нм FinFET-технология позволила интегрировать в процессор 15,3 млрд. транзисторов, что гарантирует высочайшую производительность и энергоэффективность.
  • Инновационный подход к строению памяти Chip-on-Wafer-on-Substrate (CoWoS) с HBM2 повышает пропускную способность в 3 раза (до 720 ГБ/с) по сравнению с архитектурой NVIDIA Maxwell.
  • Новые алгоритмы искусственного интеллекта обеспечивают пиковую производительность свыше 21 TFLOPS в задачах глубокого обучения.

Использование ускорителя NVIDIA Tesla P100 позволяет достичь феноменальных результатов. Например, приложение молекулярной динамики AMBER работает быстрее на одном сервере с NVIDIA Tesla P100, чем на 48 обычных двухсокетных серверных узлах. А для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU NVIDIA Tesla P100.

Ключевые характеристики NVIDIA Tesla P100:

Модель

NVIDIA Tesla P100

Тип памяти

CoWoS HBM2

Объем памяти

16 ГБ

Полоса пропускания

720 ГБ/с

Интерфейс

Двунаправленный NVIDIA NVLink

Пропускная способность интерфейса

160 ГБ/с

Скорость вычислений двойной точности

5,3 TFLOPS

Скорость вычислений одинарной точности

10,6 TFLOPS

Скорость вычислений половинной точности

21,2 TFLOPS

Дополнительные преимущества

Улучшенная программируемость с движком перехода по страницам и унифицированной памятью
Защита ECC для повышенной надежности
Оптимизация под сервер для высокой пропускной способности и надежности дата-центра

Тэги: nvidia   nvidia tesla   nvlink   pascal   hbm2   maxwell   cuda   ibm   
Читать новость полностью >>>

NVIDIA Pascal станет следующей графической микроархитектурой после NVIDIA Maxwell

Компания NVIDIA анонсировала следующее поколения GPU, которая последует за NVIDIA Maxwell и будет называться NVIDIA Pascal. Главными нововведениями NVIDIA Pascal, ранее известной как NVIDIA Volta, станут такие технологии, как NVLINK (UVM) и трехмерная видеопамять, которая решит проблему пропускной способности современных видеокарт.

NVIDIA Pascal

Технология NVLINK должна будет ускорить обмен данных между процессором и GPU, что позволит полностью раскрыть производительность графического адаптера. Благодаря NVLINK можно будет преодолеть ключевой ограничитель производительности в работе процессора и GPU, которым является интерфейс PCI Express. По информации NVIDIA, скорость обмена данными возрастет как минимум в пять раз по сравнению с интерфейсом PCI Express 3.0.

Применение трехмерной памяти на видеокартах с NVIDIA Pascal также приведет к увеличению производительности. Как известно, производительность современных видеокарт очень сильно зависит от пропускной способности памяти. Трехмерная память решит эту проблему раз и навсегда, так как её пропускная способность, как указывает NVIDIA, достигает 1 ТБ/с. Для сравнению можно напомнить, что у самых производительных видеокарт NVIDIA сейчас память имеет пропускную способность около 340 ГБ/с.

Первые видеокарты с GPU NVIDIA Pascal будут выпущены не ранее 2016-го года.

http://wccftech.com
Андрей Серебрянский

Тэги: pascal   maxwell   pci express   nvidia   nvlink   
Читать новость полностью >>>

nvlink

Выбрать из: Обзоров Новостей
Только в разделе
Искать в найденом тег:
kpi_600x90-2017.gif
Поиск по сайту
Почтовая рассылка
top10

vote

Голосование



Seagate-FareCuda.gif