Компьютерные новости
Все разделы
Представлен графический ускоритель NVIDIA Tesla V100
В прошлом году на выставке GTC 2016 был дан старт появлению микроархитектуры NVIDIA Pascal путем анонса графического ускорителя NVIDIA Tesla P100. В этом году, в рамках GTC 2017, представлен его приемник в виде NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. В его основе находится графический процессор NVIDIA GV100, построенный на базе 12-нм технологии FFN от TSMC. Это самый большой GPU в арсенале компании – его площадь составляет 815 мм2, а общее количество транзисторов превысило 21 млрд. Кстати, на создание NVIDIA Tesla V100 потребовалось $3 млрд.
Первым важным нововведением в NVIDIA GV100 является интеграция особых ядер – Tensor Core, которые предназначены для ускорения процессов глубинного обучения. Вторым является использование интерфейса NVLink 2.0 с пропускной способностью 300 ГБ/с. В целом структура NVIDIA GV100 включает в себя 80 SM-блоков. Каждый из них содержит 64 CUDA-ядер для вычислений одинарной точности (FP32), 32 CUDA-ядер для вычислений двойной точности (FP64) и 8 ядер Tensor Core. В итоге мы имеем 5120 ядер FP32, 2560 FP64 и 640 Tensor Core. Динамическая частота работы GPU достигает 1455 МГц. В массовых пользовательских видеокартах CUDA-ядра FP64 не используются. Вряд ли мы увидим и Tensor Core.
Кстати, это еще не максимальная конфигурация, поскольку 4 SM-блока отключены. Вполне возможно, что в будущем мы увидим видеокарту NVIDIA TITAN Xv c 84 SM-блоками и 5376 CUDA-ядрами, как это произошло с NVIDIA TITAN Xp.
Подсистема видеопамяти NVIDIA Tesla V100 включает в себя 16 ГБ HBM2 с 4096-битной шиной, что соответствует показателю NVIDIA Tesla P100. Однако пропускная способность памяти в новинке достигла 900 ГБ/с, а у предшественника она составляла 720 ГБ/с. Сводная таблица технической спецификации графических адаптеров серии NVIDIA Tesla:
Модель |
NVIDIA Tesla K40 |
NVIDIA Tesla M40 |
NVIDIA Tesla P100 |
NVIDIA Tesla V100 |
GPU |
GK110 (Kepler) |
GM200 (Maxwell) |
GP100 (Pascal) |
GV100 (Volta) |
Техпроцесс, нм |
28 |
28 |
16 (FinFET+) |
12 (FFN) |
Площадь GPU, мм2 |
551 |
601 |
610 |
815 |
Количество транзисторов, млрд. |
7,1 |
8 |
15,3 |
21,1 |
SM |
15 |
24 |
56 |
80 |
TPC |
15 |
24 |
28 |
40 |
Ядер FP32 / SM |
192 |
128 |
64 |
64 |
Ядер FP32 / GPU |
2880 |
3072 |
3584 |
5120 |
Ядер FP64 / SM |
64 |
4 |
32 |
32 |
Ядер FP64 / GPU |
960 |
96 |
1792 |
2560 |
Ядер Tensor / SM |
N/A |
N/A |
N/A |
8 |
Ядер Tensor / GPU |
N/A |
N/A |
N/A |
640 |
Динамическая частота GPU, МГц |
875 |
1114 |
1480 |
1455 |
Пиковая вычислительная мощность FP32, TFLOPS |
5,04 |
6,8 |
10,6 |
15 |
Пиковая вычислительная мощность FP64, TFLOPS |
1,68 |
2,1 |
5,3 |
7,5 |
Пиковая вычислительная мощность Tensor Core, Tensor TFLOPS |
N/A |
N/A |
N/A |
120 |
Текстурные блоки |
240 |
192 |
224 |
320 |
Тип видеопамяти |
GDDR5 |
GDDR5 |
HBM2 |
HBM2 |
Объем видеопамяти, ГБ |
12 |
24 |
16 |
16 |
Разрядность шины, бит |
384 |
384 |
4096 |
4096 |
Кэш-память L2, КБ |
1536 |
3072 |
4096 |
6144 |
TDP, Вт |
235 |
250 |
300 |
300 |
https://www.techpowerup.com
https://videocardz.com
Сергей Будиловский