Компьютерные новости

Все разделы

06-04-2016 12:21

Подробный взгляд на графический процессор NVIDIA GP100 (Pascal)

После официальной презентации ускорителя NVIDIA Tesla P100 появились очень интересные подробности используемого в нем графического процессора NVIDIA GP100. Поскольку это флагманский GPU серии NVIDIA Pascal, то его конфигурация является максимальной. То есть в обычных массовых видеокартах мы не увидим большего количества структурных компонентов.

Официальная блок-схема GPU NVIDIA GP100. Любопытно, что на диаграмме изображено 60 SM-блоков, хотя для NVIDIA GP100 заявлено лишь 56

Начнем с того, что переход с 28-нм на 16-нм техпроцесс позволил компании NVIDIA практически удвоить количество транзисторов (с 8 млрд. до 15,3 млрд.) по сравнению с предыдущим флагманом, сохранив общую площадь кристалла практически неизменной (601 мм² против 610 мм²).

Второе важное изменении касается количества структурных компонентов в одном SM-модуле. Микроархитектура NVIDIA Maxwell предполагала использование 128 обычных CUDA-ядер (FP32) и 4 CUDA-ядер для вычислений двойной точности. В результате общее количество этих структурных блоков в GPU NVIDIA GM200 составляло 3072 и 96 соответственно. Микроархитектура NVIDIA GP100 предполагает интеграцию в каждый SM-модуль 64 обычных CUDA-ядер и 32 CUDA-ядер для вычислений двойной точности. Соответственно, максимальное общее количество первых достигнет 3584, а вторых – 1792. Этим объясняется громадный скачек в скорости вычислений двойной точности: с 213 до 5304 GFLOPS.

Впечатлили и тактовые частоты работы графического процессора NVIDIA GP100: в номинальном режиме она составляет 1328 МГц, а в динамическом достигает 1480 МГц. При этом показатель TDP новинки вырос на 50 Вт: с 250 до 300 Вт. Сравнительная таблица технической спецификации видеокарты NVIDIA Tesla P100 со своими предшественниками:

Модель	NVIDIA Tesla K40	NVIDIA Tesla M40	NVIDIA Tesla P100
GPU	NVIDIA GK110	NVIDIA GM200	NVIDIA GP100
Микроархитектура	NVIDIA Kepler	NVIDIA Maxwell	NVIDIA Pascal
Техпроцесс, нм	28	28	16
Площадь GPU, мм²	551	601	610
Количество транзисторов, млрд.	7,1	8	15,3
Количество SM-модулей	15	24	56
Количество CUDA-ядер	2880	3072	3584
Количество CUDA-ядер для вычислений двойной точности	960	96	1792
Количество текстурных блоков	240	192	224
Базовая / динамическая тактовая частота, МГц	745 / 875	948 / 1114	1328 / 1480
Тип видеопамяти	GDDR5	GDDR5	HBM2
Объем памяти, ГБ	12	24	16
Разрядность шины, бит	384	384	4096
Скорость вычислений двойной точности, GFLOPS	1680	213	5304
TDP, Вт	235	250	300

http://www.pcworld.com
Сергей Будиловский

<< Предыдущая новость

Следующая новость >>

Поиск по сайту

Компьютерные новости

Все разделы

Подробный взгляд на графический процессор NVIDIA GP100 (Pascal)