up
ru ua
menu


GOODRAM-SSD-Iridium-PRO.gif

Новости: > 2016 > 04 > 06

rss

NVIDIA на GTC 2016: анонс микроархитектуры NVIDIA Pascal и ряд других инноваций

В калифорнийском городе Сан-Хосе успешно стартовала GPU Technology Conference (GTC), в рамках которой компания NVIDIA сделала ряд важных анонсов своих будущих продуктов. В первую очередь многих интересует микроархитектура NVIDIA Pascal, поэтому с нее и начнем.

NVIDIA Tesla P100

NVIDIA Tesla P100

Первым официальным анонсом новой микроархитектуры стали не массовые пользовательские видеокарты, а ускоритель для сверхмасштабируемых дата-центров − NVIDIA Tesla P100. С его помощью можно создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Мощности подобных решений будет достаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.

NVIDIA Tesla P100

Модель NVIDIA Tesla P100 использует пять передовых технологий для обеспечения высокой производительности и эффективности использования ресурсов:

  • Микроархитектура NVIDIA Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе NVIDIA Maxwell.
  • Высокоскоростной интерфейс NVIDIA NVLink используется для связи между несколькими графическими процессорами. Он более эффективно распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVIDIA NVLink позволяет связать до восьми GPU NVIDIA Tesla P100. IBM уже внедрила этот интерфейс в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
  • 16-нм FinFET-технология позволила интегрировать в процессор 15,3 млрд. транзисторов, что гарантирует высочайшую производительность и энергоэффективность.
  • Инновационный подход к строению памяти Chip-on-Wafer-on-Substrate (CoWoS) с HBM2 повышает пропускную способность в 3 раза (до 720 ГБ/с) по сравнению с архитектурой NVIDIA Maxwell.
  • Новые алгоритмы искусственного интеллекта обеспечивают пиковую производительность свыше 21 TFLOPS в задачах глубокого обучения.

Использование ускорителя NVIDIA Tesla P100 позволяет достичь феноменальных результатов. Например, приложение молекулярной динамики AMBER работает быстрее на одном сервере с NVIDIA Tesla P100, чем на 48 обычных двухсокетных серверных узлах. А для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU NVIDIA Tesla P100.

Ключевые характеристики NVIDIA Tesla P100:

Модель

NVIDIA Tesla P100

Тип памяти

CoWoS HBM2

Объем памяти

16 ГБ

Полоса пропускания

720 ГБ/с

Интерфейс

Двунаправленный NVIDIA NVLink

Пропускная способность интерфейса

160 ГБ/с

Скорость вычислений двойной точности

5,3 TFLOPS

Скорость вычислений одинарной точности

10,6 TFLOPS

Скорость вычислений половинной точности

21,2 TFLOPS

Дополнительные преимущества

Улучшенная программируемость с движком перехода по страницам и унифицированной памятью
Защита ECC для повышенной надежности
Оптимизация под сервер для высокой пропускной способности и надежности дата-центра

Обновления в NVIDIA SDK

Возросшая вычислительная мощность и расширенные функциональные возможности потребовали обновления платформы NVIDIA SDK. В число ключевых изменений входит NVIDIA CUDA 8. Новейшая версия платформы параллельных вычислений NVIDIA представляет разработчикам прямой доступ к новым возможностям микроархитектуры NVIDIA Pascal, включая унифицированную память и интерфейс NVIDIA NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

NVIDIA SDK

Для сетей глубокого обучения NVIDIA анонсировала GPU-ускоряемую библиотеку примитивов cuDNN версии 5. Она включает в себя поддержку GPU NVIDIA Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для применения в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.

NVIDIA DGX-1

NVIDIA DGX-1 – это первый в мире суперкомпьютер для глубокого обучения, который обладает достаточной вычислительной мощью для развития искусственного интеллекта (ИИ). Он разработан специально для задач глубокого обучения (Deep Learning). Система NVIDIA DGX-1 оснащена всем необходимым аппаратным и программным обеспечением для глубокого обучения и инструментами разработки для быстрого и легкого развертывания.

NVIDIA DGX-1

В основе новинки находятся графические ускорители NVIDIA Tesla P100 с высокоскоростным интерфейсом NVIDIA NVLink и 16 ГБ памяти CoWoS HBM2. В результате вычислительную мощность NVIDIA DGX-1 можно сопоставить с 250 традиционными серверами на базе CPU.

В свою очередь набор комплектного ПО включает в себя NVIDIA Deep Learning GPU Training System (DIGITS), полноценную интерактивную систему для создания глубоких нейронных сетей (DNN), а также NVIDIA CUDA Deep Neural Network (cuDNN) версии 5 − GPU-ускоряемую библиотеку примитивов для создания DNN.

В США системы глубокого обучения NVIDIA DGX-1 будут доступны напрямую у NVIDIA и у некоторых партнеров в июне, в других регионах − в третьем квартале текущего года. Также ожидается, что ускоритель NVIDIA Tesla P100 появится в составе серверов от ведущих производителей в начале 2017 года.

Ключевые характеристики системы NVIDIA DGX-1:

Название

NVIDIA DGX-1

Используемые ускорители

8 х NVIDIA Tesla P100

Объем памяти каждого ускорителя

16 ГБ

Интерфейс

NVLink Hybrid Cube Mesh

Постоянная память

7 ТБ SSD

Пиковая производительность вычислений половинной точности

170 TFLOPS

Сетевые интерфейсы

Dual 10 GbE, Quad InfiniBand 100Gb

Формат

3U

Мощность

3200 Вт

http://www.nvidia.com
Сергей Будиловский

Новость прочитана 1447 раз(а)

Тэги: cuda   hbm2   ibm   maxwell   nvidia   nvidia tesla   nvlink   pascal   


<< предыдущая новость     следующая новость >>

Социальные комментарии Cackle

Рекомендуемые видео:


Поиск по сайту
Почтовая рассылка
top10

vote

Голосование