Компьютерные новости
Видеокарты
Предположительные сроки появления AMD Polaris и NVIDIA Pascal
Похоже, что лето 2016 года будет очень жарким в сегменте графических адаптеров. Согласно неофициальной информации из источников, близких к производителям видеокарт, компании AMD и NVIDIA наметили релиз новых продуктов именно на лето.
Cообщается, что высокопроизводительные видеокарты AMD Radeon R9 490 и AMD Radeon R9 490X, основанные на 14-нм микроархитектуре AMD Polaris 10, могут быть анонсированы уже в рамках выставки Computex 2016 в начале июня. Полноценный релиз ожидается в конце июня, но пока неизвестно, поступят ли они сразу в продажу. Дело в том, что некоторые источники упоминают об использовании в них памяти GDDR5X, массовое производство которой начнется летом.
В свою очередь компания NVIDIA хочет еще быстрее вывести на рынок свою 16-нм микроархитектуру NVIDIA Pascal. Дебют производительных моделей NVIDIA GeForce GTX 1070 и NVIDIA GeForce GTX 1080 может предположительно состоятся уже в конце мая – в начале июня. На рынке они появятся в июле.
http://www.dvhardware.net
Сергей Будиловский
Сроки появления видеокарты AMD Radeon Pro Duo в продаже
В середине марта был представлен графический адаптер AMD Radeon Pro Duo. Теперь же стало известно, что в продажу он поступит с 26 апреля по ориентировочной стоимости $1499, то есть займет ценовой сегмент своего предшественника – AMD Radeon R9 295X2. Партнеры компании AMD смогут продавать новинку под собственным брендом, но при этом должны использовать референсный ее дизайн. То есть существенных изменений в компоновке печатной платы или системы охлаждения не предвидится.
Напомним, что AMD Radeon Pro Duo в первую очередь предназначена для использования в высокопроизводительных игровых системах, а также для просмотра и создания VR-контента. Она состоит из двух графических процессоров AMD Fiji XT, каждый из которых оснащен 4 ГБ HBM-памяти. Вычислительная мощь подобной связки достигает 16 TFLOPS. Однако для корректной работы новинка требует подключения трех 8-контактных коннекторов PCIe, поэтому мощный блок питания в такой системе является обязательным элементом.
Сводная таблица технической спецификации видеокарты AMD Radeon Pro Duo:
|
Модель |
AMD Radeon Pro Duo |
|
GPU |
2 х AMD Fiji XT |
|
Микроархитектура |
AMD GCN |
|
Техпроцесс, нм |
28 |
|
Количество потоковых процессоров |
8192 (2 x 4096) |
|
Количество текстурных блоков |
512 (2 x 256) |
|
Количество растровых блоков |
128 (2 x 64) |
|
Тактовая частота GPU, МГц |
730 / 1000 |
|
Тип видеопамяти |
HBM |
|
Объем, ГБ |
8 (2 x 4) |
|
Номинальная / эффективная частота памяти, МГц |
500 / 1000 |
|
Ширина шины памяти, бит |
8192 (2 x 4096) |
|
Пропускная способность памяти, ГБ/с |
1024 (2 х 512) |
|
Внутренний интерфейс |
PCI Express 3.0 x16 |
|
Вычислительная мощность, TFLOPS |
16 |
|
Дополнительные разъемы питания PCIe |
3 x 8-контактные |
|
Ориентировочная стоимость, $ |
1499 |
http://www.techpowerup.com
Сергей Будиловский
Подробный взгляд на графический процессор NVIDIA GP100 (Pascal)
После официальной презентации ускорителя NVIDIA Tesla P100 появились очень интересные подробности используемого в нем графического процессора NVIDIA GP100. Поскольку это флагманский GPU серии NVIDIA Pascal, то его конфигурация является максимальной. То есть в обычных массовых видеокартах мы не увидим большего количества структурных компонентов.
Официальная блок-схема GPU NVIDIA GP100. Любопытно, что на диаграмме изображено 60 SM-блоков, хотя для NVIDIA GP100 заявлено лишь 56
Начнем с того, что переход с 28-нм на 16-нм техпроцесс позволил компании NVIDIA практически удвоить количество транзисторов (с 8 млрд. до 15,3 млрд.) по сравнению с предыдущим флагманом, сохранив общую площадь кристалла практически неизменной (601 мм2 против 610 мм2).
Второе важное изменении касается количества структурных компонентов в одном SM-модуле. Микроархитектура NVIDIA Maxwell предполагала использование 128 обычных CUDA-ядер (FP32) и 4 CUDA-ядер для вычислений двойной точности. В результате общее количество этих структурных блоков в GPU NVIDIA GM200 составляло 3072 и 96 соответственно. Микроархитектура NVIDIA GP100 предполагает интеграцию в каждый SM-модуль 64 обычных CUDA-ядер и 32 CUDA-ядер для вычислений двойной точности. Соответственно, максимальное общее количество первых достигнет 3584, а вторых – 1792. Этим объясняется громадный скачек в скорости вычислений двойной точности: с 213 до 5304 GFLOPS.
Впечатлили и тактовые частоты работы графического процессора NVIDIA GP100: в номинальном режиме она составляет 1328 МГц, а в динамическом достигает 1480 МГц. При этом показатель TDP новинки вырос на 50 Вт: с 250 до 300 Вт. Сравнительная таблица технической спецификации видеокарты NVIDIA Tesla P100 со своими предшественниками:
|
Модель |
NVIDIA Tesla K40 |
NVIDIA Tesla M40 |
NVIDIA Tesla P100 |
|
GPU |
NVIDIA GK110 |
NVIDIA GM200 |
NVIDIA GP100 |
|
Микроархитектура |
NVIDIA Kepler |
NVIDIA Maxwell |
NVIDIA Pascal |
|
Техпроцесс, нм |
28 |
28 |
16 |
|
Площадь GPU, мм2 |
551 |
601 |
610 |
|
Количество транзисторов, млрд. |
7,1 |
8 |
15,3 |
|
Количество SM-модулей |
15 |
24 |
56 |
|
Количество CUDA-ядер |
2880 |
3072 |
3584 |
|
Количество CUDA-ядер для вычислений двойной точности |
960 |
96 |
1792 |
|
Количество текстурных блоков |
240 |
192 |
224 |
|
Базовая / динамическая тактовая частота, МГц |
745 / 875 |
948 / 1114 |
1328 / 1480 |
|
Тип видеопамяти |
GDDR5 |
GDDR5 |
HBM2 |
|
Объем памяти, ГБ |
12 |
24 |
16 |
|
Разрядность шины, бит |
384 |
384 |
4096 |
|
Скорость вычислений двойной точности, GFLOPS |
1680 |
213 |
5304 |
|
TDP, Вт |
235 |
250 |
300 |
http://www.pcworld.com
Сергей Будиловский
Серия видеокарт EVGA GeForce GTX 950 Low Power включает в себя четыре модели
Компания EVGA презентовала сразу четыре новые видеокарты серии EVGA GeForce GTX 950 Low Power, ключевым преимуществом которых является пониженное энергопотребление, поэтому для корректной работы они не требуют подключения 6-контактного кабеля PCIe.
Также представленные новинки характеризуются компактными размерами и одновентиляторной фирменной системой охлаждения ACX 2.0. В результате они отлично подойдут для использования в компактных среднепроизводительных игровых системах.
Что же касается технических характеристик, то базовая и динамическая частоты графического процессора моделей EVGA GeForce GTX 950 (02G-P4-0952) и EVGA GeForce GTX 950 (02G-P4-0954) находятся на уровне 1025 и 1190 МГц соответственно. В версиях EVGA GeForce GTX 950 SC (02G-P4-0956) и EVGA GeForce GTX 950 SC (02G-P4-0958) аналогичные показатели составляют 1076 и 1253 МГц. А вот подсистема оперативной памяти у них одинаковая – 2 ГБ GDDR5 с эффективной частотой 6608 МГц и 128-битной шиной.
Сравнительная таблица технической спецификации видеокарт серии EVGA GeForce GTX 950 Low Power:
|
Модель |
EVGA GeForce GTX 950 (02G-P4-0952) |
EVGA GeForce GTX 950 (02G-P4-0954) |
EVGA GeForce GTX 950 SC (02G-P4-0956) |
EVGA GeForce GTX 950 SC (02G-P4-0958) |
|
GPU |
NVIDIA GM206-250 |
|||
|
Микроархитектура |
NVIDIA Maxwell |
|||
|
Техпроцесс, нм |
28 |
|||
|
Количество CUDA-ядер |
768 |
|||
|
Количество текстурных блоков |
48 |
|||
|
Количество растровых блоков |
32 |
|||
|
Тактовая частота GPU, МГц |
1025 / 1190 |
1076 / 1253 |
||
|
Тип видеопамяти |
GDDR5 |
|||
|
Объем, ГБ |
2 |
|||
|
Номинальная / эффективная частота памяти, МГц |
1652 / 6608 |
|||
|
Ширина шины памяти, бит |
128 |
|||
|
Пропускная способность памяти, ГБ/с |
105,73 |
|||
|
Внешние интерфейсы |
1 x DVI-I |
1 x DVI-I |
1 x DVI-I |
1 x DVI-I |
http://www.techpowerup.com
http://www.evga.com
Сергей Будиловский
NVIDIA на GTC 2016: анонс микроархитектуры NVIDIA Pascal и ряд других инноваций
В калифорнийском городе Сан-Хосе успешно стартовала GPU Technology Conference (GTC), в рамках которой компания NVIDIA сделала ряд важных анонсов своих будущих продуктов. В первую очередь многих интересует микроархитектура NVIDIA Pascal, поэтому с нее и начнем.
NVIDIA Tesla P100
Первым официальным анонсом новой микроархитектуры стали не массовые пользовательские видеокарты, а ускоритель для сверхмасштабируемых дата-центров − NVIDIA Tesla P100. С его помощью можно создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Мощности подобных решений будет достаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.
Модель NVIDIA Tesla P100 использует пять передовых технологий для обеспечения высокой производительности и эффективности использования ресурсов:
- Микроархитектура NVIDIA Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе NVIDIA Maxwell.
- Высокоскоростной интерфейс NVIDIA NVLink используется для связи между несколькими графическими процессорами. Он более эффективно распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVIDIA NVLink позволяет связать до восьми GPU NVIDIA Tesla P100. IBM уже внедрила этот интерфейс в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
- 16-нм FinFET-технология позволила интегрировать в процессор 15,3 млрд. транзисторов, что гарантирует высочайшую производительность и энергоэффективность.
- Инновационный подход к строению памяти Chip-on-Wafer-on-Substrate (CoWoS) с HBM2 повышает пропускную способность в 3 раза (до 720 ГБ/с) по сравнению с архитектурой NVIDIA Maxwell.
- Новые алгоритмы искусственного интеллекта обеспечивают пиковую производительность свыше 21 TFLOPS в задачах глубокого обучения.
Использование ускорителя NVIDIA Tesla P100 позволяет достичь феноменальных результатов. Например, приложение молекулярной динамики AMBER работает быстрее на одном сервере с NVIDIA Tesla P100, чем на 48 обычных двухсокетных серверных узлах. А для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU NVIDIA Tesla P100.
Ключевые характеристики NVIDIA Tesla P100:
|
Модель |
NVIDIA Tesla P100 |
|
Тип памяти |
CoWoS HBM2 |
|
Объем памяти |
16 ГБ |
|
Полоса пропускания |
720 ГБ/с |
|
Интерфейс |
Двунаправленный NVIDIA NVLink |
|
Пропускная способность интерфейса |
160 ГБ/с |
|
Скорость вычислений двойной точности |
5,3 TFLOPS |
|
Скорость вычислений одинарной точности |
10,6 TFLOPS |
|
Скорость вычислений половинной точности |
21,2 TFLOPS |
|
Дополнительные преимущества |
Улучшенная программируемость с движком перехода по страницам и унифицированной памятью |
Обновления в NVIDIA SDK
Возросшая вычислительная мощность и расширенные функциональные возможности потребовали обновления платформы NVIDIA SDK. В число ключевых изменений входит NVIDIA CUDA 8. Новейшая версия платформы параллельных вычислений NVIDIA представляет разработчикам прямой доступ к новым возможностям микроархитектуры NVIDIA Pascal, включая унифицированную память и интерфейс NVIDIA NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.
Для сетей глубокого обучения NVIDIA анонсировала GPU-ускоряемую библиотеку примитивов cuDNN версии 5. Она включает в себя поддержку GPU NVIDIA Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для применения в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.
NVIDIA DGX-1
NVIDIA DGX-1 – это первый в мире суперкомпьютер для глубокого обучения, который обладает достаточной вычислительной мощью для развития искусственного интеллекта (ИИ). Он разработан специально для задач глубокого обучения (Deep Learning). Система NVIDIA DGX-1 оснащена всем необходимым аппаратным и программным обеспечением для глубокого обучения и инструментами разработки для быстрого и легкого развертывания.
В основе новинки находятся графические ускорители NVIDIA Tesla P100 с высокоскоростным интерфейсом NVIDIA NVLink и 16 ГБ памяти CoWoS HBM2. В результате вычислительную мощность NVIDIA DGX-1 можно сопоставить с 250 традиционными серверами на базе CPU.
В свою очередь набор комплектного ПО включает в себя NVIDIA Deep Learning GPU Training System (DIGITS), полноценную интерактивную систему для создания глубоких нейронных сетей (DNN), а также NVIDIA CUDA Deep Neural Network (cuDNN) версии 5 − GPU-ускоряемую библиотеку примитивов для создания DNN.
В США системы глубокого обучения NVIDIA DGX-1 будут доступны напрямую у NVIDIA и у некоторых партнеров в июне, в других регионах − в третьем квартале текущего года. Также ожидается, что ускоритель NVIDIA Tesla P100 появится в составе серверов от ведущих производителей в начале 2017 года.
Ключевые характеристики системы NVIDIA DGX-1:
|
Название |
NVIDIA DGX-1 |
|
Используемые ускорители |
8 х NVIDIA Tesla P100 |
|
Объем памяти каждого ускорителя |
16 ГБ |
|
Интерфейс |
NVLink Hybrid Cube Mesh |
|
Постоянная память |
7 ТБ SSD |
|
Пиковая производительность вычислений половинной точности |
170 TFLOPS |
|
Сетевые интерфейсы |
Dual 10 GbE, Quad InfiniBand 100Gb |
|
Формат |
3U |
|
Мощность |
3200 Вт |
http://www.nvidia.com
Сергей Будиловский
AMD FirePro S9300 x2 – первый в мире серверный графический ускоритель с поддержкой HBM-памяти
Компания AMD с гордостью представила свой флагманский графический ускоритель для серверных систем – AMD FirePro S9300 x2. Он предназначен для использования в сложных вычислительных задачах, например, для анализа больших массивов данных, в сфере молекулярной динамики, при изучении астрономических процессов, в глубоких нейронных сетях и других.
Новинка построена на основе двух GPU AMD Fiji в максимальной их конфигурации (4096 потоковых процессоров в каждом), которые работают на частоте 850 МГц. Каждый из них использует собственные 4 ГБ HBM-памяти с эффективной частотой 1000 МГц и пропускной способностью 512 ГБ/с. Благодаря этому вычислительная мощность достигает 13,9 TFLOPS, что существенно выше конкурентных аналогов в виде NVIDIA Tesla K80 (5,6 TFLOPS) и NVIDIA Tesla M60 (7,4 TFLOPS).
Важным преимуществом AMD FirePro S9300 x2 является поддержка программного стека AMD GPUOpen, который реализует аппаратное ускорение программного кода, написанного на C++ или OpenCL. В продажу новинка поступит во втором квартале по ориентировочной стоимости $5999.
Сводная таблица технической спецификации графического адаптера AMD FirePro S9300 x2:
|
Модель |
AMD FirePro S9300 x2 |
|
Используемая микроархитектура |
AMD GCN |
|
Количество графических процессоров |
2 |
|
Тип графических процессоров |
AMD Fiji |
|
Количество потоковых процессоров |
2 x 4096 |
|
Тактовая частота GPU, МГц |
850 |
|
Тип видеопамяти |
HBM |
|
Объем, ГБ |
2 x 4 |
|
Базовая / эффективная частота памяти, МГц |
500 / 1000 |
|
Пропускная способность, ГБ/с |
2 х 512 |
|
Максимальная вычислительная мощность (одиночная точность), TFLOPS |
13,9 |
|
Максимальная вычислительная мощность (двойная точность), GFLOPS |
870 |
|
Тип системы охлаждения |
Двухслотовая, пассивная |
|
Внутренний интерфейс |
PCI Express 3.0 x16 |
|
Дополнительные разъемы питания |
2 х 8-контактные |
|
Потребляемая мощность, Вт |
300 |
|
Ориентировочная стоимость, $ |
5999 |
http://www.techpowerup.com
http://www.amd.com
Сергей Будиловский
Видеокарта ASUS Radeon R7 250 (R7250-2GD5) с поддержкой технологии AUTO-EXTREME
В данный момент бюджетный сегмент рынка графических адаптеров компании AMD представляет линейка AMD Radeon R7 200. Поэтому особого удивления дебют модели ASUS Radeon R7 250 (R7250-2GD5) не вызывает. Она построена на основе графического чипа AMD Oland XT и оснащена поддержкой 2 ГБ GDDR5-памяти, поэтому сможет использоваться даже нетребовательными геймерами.
Базовая тактовая частота графического процессора новинки составляет 725 МГц. В динамическом режиме она может повышаться до 925 МГц. В свою очередь видеопамять работает на эффективной частоте 4500 МГц. Для охлаждения внутренних компонентов используется достаточно компактная система на основе алюминиевого радиатора и одного осевого вентилятора с дизайном Dust-proof fan.
Особого внимания в ASUS Radeon R7 250 (R7250-2GD5) заслуживает использование технологии ASUS AUTO-EXTREME при ее производстве, а также применение надежной элементной базы Super Alloy Power II. А в комплект поставки новинки входит полезная фирменная утилита GPU Tweak II. Более подробная таблица технической спецификации видеокарты ASUS Radeon R7 250 (R7250-2GD5):
|
Модель |
ASUS Radeon R7 250 (R7250-2GD5) |
|
GPU |
AMD Oland XT |
|
Микроархитектура |
AMD GCN |
|
Техпроцесс, нм |
28 |
|
Количество потоковых процессоров |
384 |
|
Количество текстурных блоков |
24 |
|
Количество растровых блоков |
8 |
|
Базовая / динамическая тактовая частота GPU, МГц |
725 / 925 |
|
Тип видеопамяти |
GDDR5 |
|
Объем, ГБ |
2 |
|
Номинальная / эффективная частота памяти, МГц |
1125 / 4500 |
|
Ширина шины памяти, бит |
128 |
|
Внешние интерфейсы |
1 x DVI-I |
|
Размеры, мм |
168 x 121 x 37 мм |
http://www.asus.com
Сергей Будиловский
AMD Greenland – это AMD Vega 10 с 4096 потоковыми процессорами
Очередная порция неофициальной, но весьма любопытной информации поступила благодаря профилю одного из сотрудников компании AMD в сети LikenIn, который сообщил некоторые подробности о следующем флагманском графическом процессоре поколения v9.0. В нем будет использоваться 4096 потоковых процессоров архитектуры v15.
Очевидно, что «v9.0» и «v15» − это внутренние обозначения для нового флагманского GPU. Ранее он был известен как «AMD Greenland». Дата его релиза ожидалась в 2016 году. Но в свете новой дорожной карты многие предполагают, что это будет чип AMD Vega 10 с поддержкой памяти HBM2, который выйдет в начале 2017 года.
В текущем же году на рынке появятся менее производительные модели линейки AMD Polaris. Речь идет о шести GPU серии AMD Polaris 11 (AMD Baffin), которые предположительно займут мейнстрим-сегмент (ранее предполагалось, что AMD Baffin будет высокопроизводительным чипом), и о двух графических процессорах серии AMD Polaris 10 (AMD Ellesmere), которые нацелены на рынок производительных систем. Одна из версий AMD Polaris 10 с кодовым обозначением «67DF» оснащена 2304 потоковыми процессорами и 8 ГБ GDDR5-памяти с эффективной частотой 6 ГГц и 256-битной шиной.
В результате именно AMD Vega 10 заменит модели серии AMD Fiji, в то время как серия AMD Polaris 10 придет на смену моделям серии AMD Radeon R9 390. Любопытно, что количество потоковых процессоров у них одинаковое, но использование улучшенной микроархитектуры должно обеспечить заметный прирост производительности.
http://videocardz.com
Сергей Будиловский
Показать еще




























