Компьютерные новости
Все разделы
Подробный взгляд на графический процессор NVIDIA GP100 (Pascal)
После официальной презентации ускорителя NVIDIA Tesla P100 появились очень интересные подробности используемого в нем графического процессора NVIDIA GP100. Поскольку это флагманский GPU серии NVIDIA Pascal, то его конфигурация является максимальной. То есть в обычных массовых видеокартах мы не увидим большего количества структурных компонентов.
Официальная блок-схема GPU NVIDIA GP100. Любопытно, что на диаграмме изображено 60 SM-блоков, хотя для NVIDIA GP100 заявлено лишь 56
Начнем с того, что переход с 28-нм на 16-нм техпроцесс позволил компании NVIDIA практически удвоить количество транзисторов (с 8 млрд. до 15,3 млрд.) по сравнению с предыдущим флагманом, сохранив общую площадь кристалла практически неизменной (601 мм2 против 610 мм2).
Второе важное изменении касается количества структурных компонентов в одном SM-модуле. Микроархитектура NVIDIA Maxwell предполагала использование 128 обычных CUDA-ядер (FP32) и 4 CUDA-ядер для вычислений двойной точности. В результате общее количество этих структурных блоков в GPU NVIDIA GM200 составляло 3072 и 96 соответственно. Микроархитектура NVIDIA GP100 предполагает интеграцию в каждый SM-модуль 64 обычных CUDA-ядер и 32 CUDA-ядер для вычислений двойной точности. Соответственно, максимальное общее количество первых достигнет 3584, а вторых – 1792. Этим объясняется громадный скачек в скорости вычислений двойной точности: с 213 до 5304 GFLOPS.
Впечатлили и тактовые частоты работы графического процессора NVIDIA GP100: в номинальном режиме она составляет 1328 МГц, а в динамическом достигает 1480 МГц. При этом показатель TDP новинки вырос на 50 Вт: с 250 до 300 Вт. Сравнительная таблица технической спецификации видеокарты NVIDIA Tesla P100 со своими предшественниками:
Модель |
NVIDIA Tesla K40 |
NVIDIA Tesla M40 |
NVIDIA Tesla P100 |
GPU |
NVIDIA GK110 |
NVIDIA GM200 |
NVIDIA GP100 |
Микроархитектура |
NVIDIA Kepler |
NVIDIA Maxwell |
NVIDIA Pascal |
Техпроцесс, нм |
28 |
28 |
16 |
Площадь GPU, мм2 |
551 |
601 |
610 |
Количество транзисторов, млрд. |
7,1 |
8 |
15,3 |
Количество SM-модулей |
15 |
24 |
56 |
Количество CUDA-ядер |
2880 |
3072 |
3584 |
Количество CUDA-ядер для вычислений двойной точности |
960 |
96 |
1792 |
Количество текстурных блоков |
240 |
192 |
224 |
Базовая / динамическая тактовая частота, МГц |
745 / 875 |
948 / 1114 |
1328 / 1480 |
Тип видеопамяти |
GDDR5 |
GDDR5 |
HBM2 |
Объем памяти, ГБ |
12 |
24 |
16 |
Разрядность шины, бит |
384 |
384 |
4096 |
Скорость вычислений двойной точности, GFLOPS |
1680 |
213 |
5304 |
TDP, Вт |
235 |
250 |
300 |