Поиск по сайту

up

Компьютерные новости

Все разделы

Подробный взгляд на графический процессор NVIDIA GP100 (Pascal)

После официальной презентации ускорителя NVIDIA Tesla P100 появились очень интересные подробности используемого в нем графического процессора NVIDIA GP100. Поскольку это флагманский GPU серии NVIDIA Pascal, то его конфигурация является максимальной. То есть в обычных массовых видеокартах мы не увидим большего количества структурных компонентов.

NVIDIA GP100

Официальная блок-схема GPU NVIDIA GP100. Любопытно, что на диаграмме изображено 60 SM-блоков, хотя для NVIDIA GP100 заявлено лишь 56

Начнем с того, что переход с 28-нм на 16-нм техпроцесс позволил компании NVIDIA практически удвоить количество транзисторов (с 8 млрд. до 15,3 млрд.) по сравнению с предыдущим флагманом, сохранив общую площадь кристалла практически неизменной (601 мм2 против 610 мм2).

NVIDIA GP100

Второе важное изменении касается количества структурных компонентов в одном SM-модуле. Микроархитектура NVIDIA Maxwell предполагала использование 128 обычных CUDA-ядер (FP32) и 4 CUDA-ядер для вычислений двойной точности. В результате общее количество этих структурных блоков в GPU NVIDIA GM200 составляло 3072 и 96 соответственно. Микроархитектура NVIDIA GP100 предполагает интеграцию в каждый SM-модуль 64 обычных CUDA-ядер и 32 CUDA-ядер для вычислений двойной точности. Соответственно, максимальное общее количество первых достигнет 3584, а вторых – 1792. Этим объясняется громадный скачек в скорости вычислений двойной точности: с 213 до 5304 GFLOPS.

Впечатлили и тактовые частоты работы графического процессора NVIDIA GP100: в номинальном режиме она составляет 1328 МГц, а в динамическом достигает 1480 МГц. При этом показатель TDP новинки вырос на 50 Вт: с 250 до 300 Вт. Сравнительная таблица технической спецификации видеокарты NVIDIA Tesla P100 со своими предшественниками:

Модель

NVIDIA Tesla K40

NVIDIA Tesla M40

NVIDIA Tesla P100

GPU

NVIDIA GK110

NVIDIA GM200

NVIDIA GP100

Микроархитектура

NVIDIA Kepler

NVIDIA Maxwell

NVIDIA Pascal

Техпроцесс, нм

28

28

16

Площадь GPU, мм2

551

601

610

Количество транзисторов, млрд.

7,1

8

15,3

Количество SM-модулей

15

24

56

Количество CUDA-ядер

2880

3072

3584

Количество CUDA-ядер для вычислений двойной точности

960

96

1792

Количество текстурных блоков

240

192

224

Базовая / динамическая тактовая частота, МГц

745 / 875

948 / 1114

1328 / 1480

Тип видеопамяти

GDDR5

GDDR5

HBM2

Объем памяти, ГБ

12

24

16

Разрядность шины, бит

384

384

4096

Скорость вычислений двойной точности, GFLOPS

1680

213

5304

TDP, Вт

235

250

300

http://www.pcworld.com
Сергей Будиловский