Поиск по сайту

up

Компьютерные новости

Все разделы

Представлен графический ускоритель NVIDIA Tesla V100

В прошлом году на выставке GTC 2016 был дан старт появлению микроархитектуры NVIDIA Pascal путем анонса графического ускорителя NVIDIA Tesla P100. В этом году, в рамках GTC 2017, представлен его приемник в виде NVIDIA Tesla V100, который положил начало распространению микроархитектуры NVIDIA Volta. В его основе находится графический процессор NVIDIA GV100, построенный на базе 12-нм технологии FFN от TSMC. Это самый большой GPU в арсенале компании – его площадь составляет 815 мм2, а общее количество транзисторов превысило 21 млрд. Кстати, на создание NVIDIA Tesla V100 потребовалось $3 млрд.

NVIDIA Tesla V100

Первым важным нововведением в NVIDIA GV100 является интеграция особых ядер – Tensor Core, которые предназначены для ускорения процессов глубинного обучения. Вторым является использование интерфейса NVLink 2.0 с пропускной способностью 300 ГБ/с. В целом структура NVIDIA GV100 включает в себя 80 SM-блоков. Каждый из них содержит 64 CUDA-ядер для вычислений одинарной точности (FP32), 32 CUDA-ядер для вычислений двойной точности (FP64) и 8 ядер Tensor Core. В итоге мы имеем 5120 ядер FP32, 2560 FP64 и 640 Tensor Core. Динамическая частота работы GPU достигает 1455 МГц. В массовых пользовательских видеокартах CUDA-ядра FP64 не используются. Вряд ли мы увидим и Tensor Core.

NVIDIA Tesla V100

Кстати, это еще не максимальная конфигурация, поскольку 4 SM-блока отключены. Вполне возможно, что в будущем мы увидим видеокарту NVIDIA TITAN Xv c 84 SM-блоками и 5376 CUDA-ядрами, как это произошло с NVIDIA TITAN Xp.

NVIDIA Tesla V100

Подсистема видеопамяти NVIDIA Tesla V100 включает в себя 16 ГБ HBM2 с 4096-битной шиной, что соответствует показателю NVIDIA Tesla P100. Однако пропускная способность памяти в новинке достигла 900 ГБ/с, а у предшественника она составляла 720 ГБ/с. Сводная таблица технической спецификации графических адаптеров серии NVIDIA Tesla:

Модель

NVIDIA Tesla K40

NVIDIA Tesla M40

NVIDIA Tesla P100

NVIDIA Tesla V100

GPU

GK110 (Kepler)

GM200 (Maxwell)

GP100 (Pascal)

GV100 (Volta)

Техпроцесс, нм

28

28

16 (FinFET+)

12 (FFN)

Площадь GPU, мм2

551

601

610

815

Количество транзисторов, млрд.

7,1

8

15,3

21,1

SM

15

24

56

80

TPC

15

24

28

40

Ядер FP32 / SM

192

128

64

64

Ядер FP32 / GPU

2880

3072

3584

5120

Ядер FP64 / SM

64

4

32

32

Ядер FP64 / GPU

960

96

1792

2560

Ядер Tensor / SM

N/A

N/A

N/A

8

Ядер Tensor / GPU

N/A

N/A

N/A

640

Динамическая частота GPU, МГц

875

1114

1480

1455

Пиковая вычислительная мощность FP32, TFLOPS

5,04

6,8

10,6

15

Пиковая вычислительная мощность FP64, TFLOPS

1,68

2,1

5,3

7,5

Пиковая вычислительная мощность Tensor Core, Tensor TFLOPS

N/A

N/A

N/A

120

Текстурные блоки

240

192

224

320

Тип видеопамяти

GDDR5

GDDR5

HBM2

HBM2

Объем видеопамяти, ГБ

12

24

16

16

Разрядность шины, бит

384

384

4096

4096

Кэш-память L2, КБ

1536

3072

4096

6144

TDP, Вт

235

250

300

300

https://www.techpowerup.com
https://videocardz.com
Сергей Будиловский