Поиск по сайту

up
Banner

Компьютерные новости

Видеокарты

Предположительные сроки появления AMD Polaris и NVIDIA Pascal

Похоже, что лето 2016 года будет очень жарким в сегменте графических адаптеров. Согласно неофициальной информации из источников, близких к производителям видеокарт, компании AMD и NVIDIA наметили релиз новых продуктов именно на лето.

AMD Polaris 10

Cообщается, что высокопроизводительные видеокарты AMD Radeon R9 490 и AMD Radeon R9 490X, основанные на 14-нм микроархитектуре AMD Polaris 10, могут быть анонсированы уже в рамках выставки Computex 2016 в начале июня. Полноценный релиз ожидается в конце июня, но пока неизвестно, поступят ли они сразу в продажу. Дело в том, что некоторые источники упоминают об использовании в них памяти GDDR5X, массовое производство которой начнется летом.

NVIDIA GeForce GTX 1070 и NVIDIA GeForce GTX 1080

В свою очередь компания NVIDIA хочет еще быстрее вывести на рынок свою 16-нм микроархитектуру NVIDIA Pascal. Дебют производительных моделей NVIDIA GeForce GTX 1070 и NVIDIA GeForce GTX 1080 может предположительно состоятся уже в конце мая – в начале июня. На рынке они появятся в июле.

http://www.dvhardware.net
Сергей Будиловский

Постоянная ссылка на новость

Сроки появления видеокарты AMD Radeon Pro Duo в продаже

В середине марта был представлен графический адаптер AMD Radeon Pro Duo. Теперь же стало известно, что в продажу он поступит с 26 апреля по ориентировочной стоимости $1499, то есть займет ценовой сегмент своего предшественника – AMD Radeon R9 295X2. Партнеры компании AMD смогут продавать новинку под собственным брендом, но при этом должны использовать референсный ее дизайн. То есть существенных изменений в компоновке печатной платы или системы охлаждения не предвидится.

AMD Radeon Pro Duo

Напомним, что AMD Radeon Pro Duo в первую очередь предназначена для использования в высокопроизводительных игровых системах, а также для просмотра и создания VR-контента. Она состоит из двух графических процессоров AMD Fiji XT, каждый из которых оснащен 4 ГБ HBM-памяти. Вычислительная мощь подобной связки достигает 16 TFLOPS. Однако для корректной работы новинка требует подключения трех 8-контактных коннекторов PCIe, поэтому мощный блок питания в такой системе является обязательным элементом.

Сводная таблица технической спецификации видеокарты AMD Radeon Pro Duo:

Модель

AMD Radeon Pro Duo

GPU

2 х AMD Fiji XT

Микроархитектура

AMD GCN

Техпроцесс, нм

28

Количество потоковых процессоров

8192 (2 x 4096)

Количество текстурных блоков

512 (2 x 256)

Количество растровых блоков

128 (2 x 64)

Тактовая частота GPU, МГц

730 / 1000

Тип видеопамяти

HBM

Объем, ГБ

8 (2 x 4)

Номинальная / эффективная частота памяти, МГц

500 / 1000

Ширина шины памяти, бит

8192 (2 x 4096)

Пропускная способность памяти, ГБ/с

1024 (2 х 512)

Внутренний интерфейс

PCI Express 3.0 x16

Вычислительная мощность, TFLOPS

16

Дополнительные разъемы питания PCIe

3 x 8-контактные

Ориентировочная стоимость, $

1499

http://www.techpowerup.com
Сергей Будиловский

Постоянная ссылка на новость

Подробный взгляд на графический процессор NVIDIA GP100 (Pascal)

После официальной презентации ускорителя NVIDIA Tesla P100 появились очень интересные подробности используемого в нем графического процессора NVIDIA GP100. Поскольку это флагманский GPU серии NVIDIA Pascal, то его конфигурация является максимальной. То есть в обычных массовых видеокартах мы не увидим большего количества структурных компонентов.

NVIDIA GP100

Официальная блок-схема GPU NVIDIA GP100. Любопытно, что на диаграмме изображено 60 SM-блоков, хотя для NVIDIA GP100 заявлено лишь 56

Начнем с того, что переход с 28-нм на 16-нм техпроцесс позволил компании NVIDIA практически удвоить количество транзисторов (с 8 млрд. до 15,3 млрд.) по сравнению с предыдущим флагманом, сохранив общую площадь кристалла практически неизменной (601 мм2 против 610 мм2).

NVIDIA GP100

Второе важное изменении касается количества структурных компонентов в одном SM-модуле. Микроархитектура NVIDIA Maxwell предполагала использование 128 обычных CUDA-ядер (FP32) и 4 CUDA-ядер для вычислений двойной точности. В результате общее количество этих структурных блоков в GPU NVIDIA GM200 составляло 3072 и 96 соответственно. Микроархитектура NVIDIA GP100 предполагает интеграцию в каждый SM-модуль 64 обычных CUDA-ядер и 32 CUDA-ядер для вычислений двойной точности. Соответственно, максимальное общее количество первых достигнет 3584, а вторых – 1792. Этим объясняется громадный скачек в скорости вычислений двойной точности: с 213 до 5304 GFLOPS.

Впечатлили и тактовые частоты работы графического процессора NVIDIA GP100: в номинальном режиме она составляет 1328 МГц, а в динамическом достигает 1480 МГц. При этом показатель TDP новинки вырос на 50 Вт: с 250 до 300 Вт. Сравнительная таблица технической спецификации видеокарты NVIDIA Tesla P100 со своими предшественниками:

Модель

NVIDIA Tesla K40

NVIDIA Tesla M40

NVIDIA Tesla P100

GPU

NVIDIA GK110

NVIDIA GM200

NVIDIA GP100

Микроархитектура

NVIDIA Kepler

NVIDIA Maxwell

NVIDIA Pascal

Техпроцесс, нм

28

28

16

Площадь GPU, мм2

551

601

610

Количество транзисторов, млрд.

7,1

8

15,3

Количество SM-модулей

15

24

56

Количество CUDA-ядер

2880

3072

3584

Количество CUDA-ядер для вычислений двойной точности

960

96

1792

Количество текстурных блоков

240

192

224

Базовая / динамическая тактовая частота, МГц

745 / 875

948 / 1114

1328 / 1480

Тип видеопамяти

GDDR5

GDDR5

HBM2

Объем памяти, ГБ

12

24

16

Разрядность шины, бит

384

384

4096

Скорость вычислений двойной точности, GFLOPS

1680

213

5304

TDP, Вт

235

250

300

http://www.pcworld.com
Сергей Будиловский

Постоянная ссылка на новость

Серия видеокарт EVGA GeForce GTX 950 Low Power включает в себя четыре модели

Компания EVGA презентовала сразу четыре новые видеокарты серии EVGA GeForce GTX 950 Low Power, ключевым преимуществом которых является пониженное энергопотребление, поэтому для корректной работы они не требуют подключения 6-контактного кабеля PCIe.

EVGA GeForce GTX 950 Low Power

Также представленные новинки характеризуются компактными размерами и одновентиляторной фирменной системой охлаждения ACX 2.0. В результате они отлично подойдут для использования в компактных среднепроизводительных игровых системах.

EVGA GeForce GTX 950 Low Power

Что же касается технических характеристик, то базовая и динамическая частоты графического процессора моделей EVGA GeForce GTX 950 (02G-P4-0952) и EVGA GeForce GTX 950 (02G-P4-0954) находятся на уровне 1025 и 1190 МГц соответственно. В версиях EVGA GeForce GTX 950 SC (02G-P4-0956) и EVGA GeForce GTX 950 SC (02G-P4-0958) аналогичные показатели составляют 1076 и 1253 МГц. А вот подсистема оперативной памяти у них одинаковая – 2 ГБ GDDR5 с эффективной частотой 6608 МГц и 128-битной шиной.

EVGA GeForce GTX 950 Low Power

Сравнительная таблица технической спецификации видеокарт серии EVGA GeForce GTX 950 Low Power:

Модель

EVGA GeForce GTX 950 (02G-P4-0952)

EVGA GeForce GTX 950 (02G-P4-0954)

EVGA GeForce GTX 950 SC (02G-P4-0956)

EVGA GeForce GTX 950 SC (02G-P4-0958)

GPU

NVIDIA GM206-250

Микроархитектура

NVIDIA Maxwell

Техпроцесс, нм

28

Количество CUDA-ядер

768

Количество текстурных блоков

48

Количество растровых блоков

32

Тактовая частота GPU, МГц

1025 / 1190

1076 / 1253

Тип видеопамяти

GDDR5

Объем, ГБ

2

Номинальная / эффективная частота памяти, МГц

1652 / 6608

Ширина шины памяти, бит

128

Пропускная способность памяти, ГБ/с

105,73

Внешние интерфейсы

1 x DVI-I
1 x HDMI
1 x DisplayPort

1 x DVI-I
1 x DVI-D
1 x HDMI
1 x DisplayPort

1 x DVI-I
1 x HDMI
1 x DisplayPort

1 x DVI-I
1 x DVI-D
1 x HDMI
1 x DisplayPort

http://www.techpowerup.com
http://www.evga.com
Сергей Будиловский

Постоянная ссылка на новость

NVIDIA на GTC 2016: анонс микроархитектуры NVIDIA Pascal и ряд других инноваций

В калифорнийском городе Сан-Хосе успешно стартовала GPU Technology Conference (GTC), в рамках которой компания NVIDIA сделала ряд важных анонсов своих будущих продуктов. В первую очередь многих интересует микроархитектура NVIDIA Pascal, поэтому с нее и начнем.

NVIDIA Tesla P100

NVIDIA Tesla P100

Первым официальным анонсом новой микроархитектуры стали не массовые пользовательские видеокарты, а ускоритель для сверхмасштабируемых дата-центров − NVIDIA Tesla P100. С его помощью можно создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Мощности подобных решений будет достаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.

NVIDIA Tesla P100

Модель NVIDIA Tesla P100 использует пять передовых технологий для обеспечения высокой производительности и эффективности использования ресурсов:

  • Микроархитектура NVIDIA Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе NVIDIA Maxwell.
  • Высокоскоростной интерфейс NVIDIA NVLink используется для связи между несколькими графическими процессорами. Он более эффективно распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVIDIA NVLink позволяет связать до восьми GPU NVIDIA Tesla P100. IBM уже внедрила этот интерфейс в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
  • 16-нм FinFET-технология позволила интегрировать в процессор 15,3 млрд. транзисторов, что гарантирует высочайшую производительность и энергоэффективность.
  • Инновационный подход к строению памяти Chip-on-Wafer-on-Substrate (CoWoS) с HBM2 повышает пропускную способность в 3 раза (до 720 ГБ/с) по сравнению с архитектурой NVIDIA Maxwell.
  • Новые алгоритмы искусственного интеллекта обеспечивают пиковую производительность свыше 21 TFLOPS в задачах глубокого обучения.

Использование ускорителя NVIDIA Tesla P100 позволяет достичь феноменальных результатов. Например, приложение молекулярной динамики AMBER работает быстрее на одном сервере с NVIDIA Tesla P100, чем на 48 обычных двухсокетных серверных узлах. А для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU NVIDIA Tesla P100.

Ключевые характеристики NVIDIA Tesla P100:

Модель

NVIDIA Tesla P100

Тип памяти

CoWoS HBM2

Объем памяти

16 ГБ

Полоса пропускания

720 ГБ/с

Интерфейс

Двунаправленный NVIDIA NVLink

Пропускная способность интерфейса

160 ГБ/с

Скорость вычислений двойной точности

5,3 TFLOPS

Скорость вычислений одинарной точности

10,6 TFLOPS

Скорость вычислений половинной точности

21,2 TFLOPS

Дополнительные преимущества

Улучшенная программируемость с движком перехода по страницам и унифицированной памятью
Защита ECC для повышенной надежности
Оптимизация под сервер для высокой пропускной способности и надежности дата-центра

Обновления в NVIDIA SDK

Возросшая вычислительная мощность и расширенные функциональные возможности потребовали обновления платформы NVIDIA SDK. В число ключевых изменений входит NVIDIA CUDA 8. Новейшая версия платформы параллельных вычислений NVIDIA представляет разработчикам прямой доступ к новым возможностям микроархитектуры NVIDIA Pascal, включая унифицированную память и интерфейс NVIDIA NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

NVIDIA SDK

Для сетей глубокого обучения NVIDIA анонсировала GPU-ускоряемую библиотеку примитивов cuDNN версии 5. Она включает в себя поддержку GPU NVIDIA Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для применения в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.

NVIDIA DGX-1

NVIDIA DGX-1 – это первый в мире суперкомпьютер для глубокого обучения, который обладает достаточной вычислительной мощью для развития искусственного интеллекта (ИИ). Он разработан специально для задач глубокого обучения (Deep Learning). Система NVIDIA DGX-1 оснащена всем необходимым аппаратным и программным обеспечением для глубокого обучения и инструментами разработки для быстрого и легкого развертывания.

NVIDIA DGX-1

В основе новинки находятся графические ускорители NVIDIA Tesla P100 с высокоскоростным интерфейсом NVIDIA NVLink и 16 ГБ памяти CoWoS HBM2. В результате вычислительную мощность NVIDIA DGX-1 можно сопоставить с 250 традиционными серверами на базе CPU.

В свою очередь набор комплектного ПО включает в себя NVIDIA Deep Learning GPU Training System (DIGITS), полноценную интерактивную систему для создания глубоких нейронных сетей (DNN), а также NVIDIA CUDA Deep Neural Network (cuDNN) версии 5 − GPU-ускоряемую библиотеку примитивов для создания DNN.

В США системы глубокого обучения NVIDIA DGX-1 будут доступны напрямую у NVIDIA и у некоторых партнеров в июне, в других регионах − в третьем квартале текущего года. Также ожидается, что ускоритель NVIDIA Tesla P100 появится в составе серверов от ведущих производителей в начале 2017 года.

Ключевые характеристики системы NVIDIA DGX-1:

Название

NVIDIA DGX-1

Используемые ускорители

8 х NVIDIA Tesla P100

Объем памяти каждого ускорителя

16 ГБ

Интерфейс

NVLink Hybrid Cube Mesh

Постоянная память

7 ТБ SSD

Пиковая производительность вычислений половинной точности

170 TFLOPS

Сетевые интерфейсы

Dual 10 GbE, Quad InfiniBand 100Gb

Формат

3U

Мощность

3200 Вт

http://www.nvidia.com
Сергей Будиловский

Постоянная ссылка на новость

AMD FirePro S9300 x2 – первый в мире серверный графический ускоритель с поддержкой HBM-памяти

Компания AMD с гордостью представила свой флагманский графический ускоритель для серверных систем – AMD FirePro S9300 x2. Он предназначен для использования в сложных вычислительных задачах, например, для анализа больших массивов данных, в сфере молекулярной динамики, при изучении астрономических процессов, в глубоких нейронных сетях и других.

AMD FirePro S9300 x2

Новинка построена на основе двух GPU AMD Fiji в максимальной их конфигурации (4096 потоковых процессоров в каждом), которые работают на частоте 850 МГц. Каждый из них использует собственные 4 ГБ HBM-памяти с эффективной частотой 1000 МГц и пропускной способностью 512 ГБ/с. Благодаря этому вычислительная мощность достигает 13,9 TFLOPS, что существенно выше конкурентных аналогов в виде NVIDIA Tesla K80 (5,6 TFLOPS) и NVIDIA Tesla M60 (7,4 TFLOPS).

AMD FirePro S9300 x2

Важным преимуществом AMD FirePro S9300 x2 является поддержка программного стека AMD GPUOpen, который реализует аппаратное ускорение программного кода, написанного на C++ или OpenCL. В продажу новинка поступит во втором квартале по ориентировочной стоимости $5999.

AMD FirePro S9300 x2

Сводная таблица технической спецификации графического адаптера AMD FirePro S9300 x2:

Модель

AMD FirePro S9300 x2

Используемая микроархитектура

AMD GCN

Количество графических процессоров

2

Тип графических процессоров

AMD Fiji

Количество потоковых процессоров

2 x 4096

Тактовая частота GPU, МГц

850

Тип видеопамяти

HBM

Объем, ГБ

2 x 4

Базовая / эффективная частота памяти, МГц

500 / 1000

Пропускная способность, ГБ/с

2 х 512

Максимальная вычислительная мощность (одиночная точность), TFLOPS

13,9

Максимальная вычислительная мощность (двойная точность), GFLOPS

870

Тип системы охлаждения

Двухслотовая, пассивная

Внутренний интерфейс

PCI Express 3.0 x16

Дополнительные разъемы питания

2 х 8-контактные

Потребляемая мощность, Вт

300

Ориентировочная стоимость, $

5999

http://www.techpowerup.com
http://www.amd.com
Сергей Будиловский

Постоянная ссылка на новость

Видеокарта ASUS Radeon R7 250 (R7250-2GD5) с поддержкой технологии AUTO-EXTREME

В данный момент бюджетный сегмент рынка графических адаптеров компании AMD представляет линейка AMD Radeon R7 200. Поэтому особого удивления дебют модели ASUS Radeon R7 250 (R7250-2GD5) не вызывает. Она построена на основе графического чипа AMD Oland XT и оснащена поддержкой 2 ГБ GDDR5-памяти, поэтому сможет использоваться даже нетребовательными геймерами.

ASUS Radeon R7 250 R7250-2GD5

Базовая тактовая частота графического процессора новинки составляет 725 МГц. В динамическом режиме она может повышаться до 925 МГц. В свою очередь видеопамять работает на эффективной частоте 4500 МГц. Для охлаждения внутренних компонентов используется достаточно компактная система на основе алюминиевого радиатора и одного осевого вентилятора с дизайном Dust-proof fan.

ASUS Radeon R7 250 R7250-2GD5

Особого внимания в ASUS Radeon R7 250 (R7250-2GD5) заслуживает использование технологии ASUS AUTO-EXTREME при ее производстве, а также применение надежной элементной базы Super Alloy Power II. А в комплект поставки новинки входит полезная фирменная утилита GPU Tweak II. Более подробная таблица технической спецификации видеокарты ASUS Radeon R7 250 (R7250-2GD5):

Модель

ASUS Radeon R7 250 (R7250-2GD5)

GPU

AMD Oland XT

Микроархитектура

AMD GCN

Техпроцесс, нм

28

Количество потоковых процессоров

384

Количество текстурных блоков

24

Количество растровых блоков

8

Базовая / динамическая тактовая частота GPU, МГц

725 / 925

Тип видеопамяти

GDDR5

Объем, ГБ

2

Номинальная / эффективная частота памяти, МГц

1125 / 4500

Ширина шины памяти, бит

128

Внешние интерфейсы

1 x DVI-I
1 x HDMI
1 x DisplayPort

Размеры, мм

168 x 121 x 37 мм

http://www.asus.com
Сергей Будиловский

Постоянная ссылка на новость

AMD Greenland – это AMD Vega 10 с 4096 потоковыми процессорами

Очередная порция неофициальной, но весьма любопытной информации поступила благодаря профилю одного из сотрудников компании AMD в сети LikenIn, который сообщил некоторые подробности о следующем флагманском графическом процессоре поколения v9.0. В нем будет использоваться 4096 потоковых процессоров архитектуры v15.

AMD Greenland

Очевидно, что «v9.0» и «v15» − это внутренние обозначения для нового флагманского GPU. Ранее он был известен как «AMD Greenland». Дата его релиза ожидалась в 2016 году. Но в свете новой дорожной карты многие предполагают, что это будет чип AMD Vega 10 с поддержкой памяти HBM2, который выйдет в начале 2017 года.

AMD Vega 10

В текущем же году на рынке появятся менее производительные модели линейки AMD Polaris. Речь идет о шести GPU серии AMD Polaris 11 (AMD Baffin), которые предположительно займут мейнстрим-сегмент (ранее предполагалось, что AMD Baffin будет высокопроизводительным чипом), и о двух графических процессорах серии AMD Polaris 10 (AMD Ellesmere), которые нацелены на рынок производительных систем. Одна из версий AMD Polaris 10 с кодовым обозначением «67DF» оснащена 2304 потоковыми процессорами и 8 ГБ GDDR5-памяти с эффективной частотой 6 ГГц и 256-битной шиной.

В результате именно AMD Vega 10 заменит модели серии AMD Fiji, в то время как серия AMD Polaris 10 придет на смену моделям серии AMD Radeon R9 390. Любопытно, что количество потоковых процессоров у них одинаковое, но использование улучшенной микроархитектуры должно обеспечить заметный прирост производительности.

http://videocardz.com
Сергей Будиловский

Постоянная ссылка на новость

Показать еще