Компьютерные новости

Все разделы

11-05-2017 09:02

Представлен графический ускоритель NVIDIA Tesla V100

В прошлом году на выставке GTC 2016 был дан старт появлению микроархитектуры NVIDIA Pascal путем анонса графического ускорителя NVIDIA Tesla P100. В этом году, в рамках GTC 2017, представлен его приемник в виде NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. В его основе находится графический процессор NVIDIA GV100, построенный на базе 12-нм технологии FFN от TSMC. Это самый большой GPU в арсенале компании – его площадь составляет 815 мм², а общее количество транзисторов превысило 21 млрд. Кстати, на создание NVIDIA Tesla V100 потребовалось $3 млрд.

Первым важным нововведением в NVIDIA GV100 является интеграция особых ядер – Tensor Core, которые предназначены для ускорения процессов глубинного обучения. Вторым является использование интерфейса NVLink 2.0 с пропускной способностью 300 ГБ/с. В целом структура NVIDIA GV100 включает в себя 80 SM-блоков. Каждый из них содержит 64 CUDA-ядер для вычислений одинарной точности (FP32), 32 CUDA-ядер для вычислений двойной точности (FP64) и 8 ядер Tensor Core. В итоге мы имеем 5120 ядер FP32, 2560 FP64 и 640 Tensor Core. Динамическая частота работы GPU достигает 1455 МГц. В массовых пользовательских видеокартах CUDA-ядра FP64 не используются. Вряд ли мы увидим и Tensor Core.

Кстати, это еще не максимальная конфигурация, поскольку 4 SM-блока отключены. Вполне возможно, что в будущем мы увидим видеокарту NVIDIA TITAN Xv c 84 SM-блоками и 5376 CUDA-ядрами, как это произошло с NVIDIA TITAN Xp.

Подсистема видеопамяти NVIDIA Tesla V100 включает в себя 16 ГБ HBM2 с 4096-битной шиной, что соответствует показателю NVIDIA Tesla P100. Однако пропускная способность памяти в новинке достигла 900 ГБ/с, а у предшественника она составляла 720 ГБ/с. Сводная таблица технической спецификации графических адаптеров серии NVIDIA Tesla:

Модель	NVIDIA Tesla K40	NVIDIA Tesla M40	NVIDIA Tesla P100	NVIDIA Tesla V100
GPU	GK110 (Kepler)	GM200 (Maxwell)	GP100 (Pascal)	GV100 (Volta)
Техпроцесс, нм	28	28	16 (FinFET+)	12 (FFN)
Площадь GPU, мм²	551	601	610	815
Количество транзисторов, млрд.	7,1	8	15,3	21,1
SM	15	24	56	80
TPC	15	24	28	40
Ядер FP32 / SM	192	128	64	64
Ядер FP32 / GPU	2880	3072	3584	5120
Ядер FP64 / SM	64	4	32	32
Ядер FP64 / GPU	960	96	1792	2560
Ядер Tensor / SM	N/A	N/A	N/A	8
Ядер Tensor / GPU	N/A	N/A	N/A	640
Динамическая частота GPU, МГц	875	1114	1480	1455
Пиковая вычислительная мощность FP32, TFLOPS	5,04	6,8	10,6	15
Пиковая вычислительная мощность FP64, TFLOPS	1,68	2,1	5,3	7,5
Пиковая вычислительная мощность Tensor Core, Tensor TFLOPS	N/A	N/A	N/A	120
Текстурные блоки	240	192	224	320
Тип видеопамяти	GDDR5	GDDR5	HBM2	HBM2
Объем видеопамяти, ГБ	12	24	16	16
Разрядность шины, бит	384	384	4096	4096
Кэш-память L2, КБ	1536	3072	4096	6144
TDP, Вт	235	250	300	300

https://www.techpowerup.com
https://videocardz.com
Сергей Будиловский

<< Предыдущая новость

Следующая новость >>

Поиск по сайту

Компьютерные новости

Все разделы

Представлен графический ускоритель NVIDIA Tesla V100