Компьютерные новости

Видеокарты

08-04-2016 15:28

Предположительные сроки появления AMD Polaris и NVIDIA Pascal

Похоже, что лето 2016 года будет очень жарким в сегменте графических адаптеров. Согласно неофициальной информации из источников, близких к производителям видеокарт, компании AMD и NVIDIA наметили релиз новых продуктов именно на лето.

Cообщается, что высокопроизводительные видеокарты AMD Radeon R9 490 и AMD Radeon R9 490X, основанные на 14-нм микроархитектуре AMD Polaris 10, могут быть анонсированы уже в рамках выставки Computex 2016 в начале июня. Полноценный релиз ожидается в конце июня, но пока неизвестно, поступят ли они сразу в продажу. Дело в том, что некоторые источники упоминают об использовании в них памяти GDDR5X, массовое производство которой начнется летом.

В свою очередь компания NVIDIA хочет еще быстрее вывести на рынок свою 16-нм микроархитектуру NVIDIA Pascal. Дебют производительных моделей NVIDIA GeForce GTX 1070 и NVIDIA GeForce GTX 1080 может предположительно состоятся уже в конце мая – в начале июня. На рынке они появятся в июле.

http://www.dvhardware.net
Сергей Будиловский

Постоянная ссылка на новость

08-04-2016 08:36

Сроки появления видеокарты AMD Radeon Pro Duo в продаже

В середине марта был представлен графический адаптер AMD Radeon Pro Duo. Теперь же стало известно, что в продажу он поступит с 26 апреля по ориентировочной стоимости $1499, то есть займет ценовой сегмент своего предшественника – AMD Radeon R9 295X2. Партнеры компании AMD смогут продавать новинку под собственным брендом, но при этом должны использовать референсный ее дизайн. То есть существенных изменений в компоновке печатной платы или системы охлаждения не предвидится.

Напомним, что AMD Radeon Pro Duo в первую очередь предназначена для использования в высокопроизводительных игровых системах, а также для просмотра и создания VR-контента. Она состоит из двух графических процессоров AMD Fiji XT, каждый из которых оснащен 4 ГБ HBM-памяти. Вычислительная мощь подобной связки достигает 16 TFLOPS. Однако для корректной работы новинка требует подключения трех 8-контактных коннекторов PCIe, поэтому мощный блок питания в такой системе является обязательным элементом.

Сводная таблица технической спецификации видеокарты AMD Radeon Pro Duo:

Модель	AMD Radeon Pro Duo
GPU	2 х AMD Fiji XT
Микроархитектура	AMD GCN
Техпроцесс, нм	28
Количество потоковых процессоров	8192 (2 x 4096)
Количество текстурных блоков	512 (2 x 256)
Количество растровых блоков	128 (2 x 64)
Тактовая частота GPU, МГц	730 / 1000
Тип видеопамяти	HBM
Объем, ГБ	8 (2 x 4)
Номинальная / эффективная частота памяти, МГц	500 / 1000
Ширина шины памяти, бит	8192 (2 x 4096)
Пропускная способность памяти, ГБ/с	1024 (2 х 512)
Внутренний интерфейс	PCI Express 3.0 x16
Вычислительная мощность, TFLOPS	16
Дополнительные разъемы питания PCIe	3 x 8-контактные
Ориентировочная стоимость, $	1499

http://www.techpowerup.com
Сергей Будиловский

Постоянная ссылка на новость

06-04-2016 12:21

Подробный взгляд на графический процессор NVIDIA GP100 (Pascal)

После официальной презентации ускорителя NVIDIA Tesla P100 появились очень интересные подробности используемого в нем графического процессора NVIDIA GP100. Поскольку это флагманский GPU серии NVIDIA Pascal, то его конфигурация является максимальной. То есть в обычных массовых видеокартах мы не увидим большего количества структурных компонентов.

Официальная блок-схема GPU NVIDIA GP100. Любопытно, что на диаграмме изображено 60 SM-блоков, хотя для NVIDIA GP100 заявлено лишь 56

Начнем с того, что переход с 28-нм на 16-нм техпроцесс позволил компании NVIDIA практически удвоить количество транзисторов (с 8 млрд. до 15,3 млрд.) по сравнению с предыдущим флагманом, сохранив общую площадь кристалла практически неизменной (601 мм² против 610 мм²).

Второе важное изменении касается количества структурных компонентов в одном SM-модуле. Микроархитектура NVIDIA Maxwell предполагала использование 128 обычных CUDA-ядер (FP32) и 4 CUDA-ядер для вычислений двойной точности. В результате общее количество этих структурных блоков в GPU NVIDIA GM200 составляло 3072 и 96 соответственно. Микроархитектура NVIDIA GP100 предполагает интеграцию в каждый SM-модуль 64 обычных CUDA-ядер и 32 CUDA-ядер для вычислений двойной точности. Соответственно, максимальное общее количество первых достигнет 3584, а вторых – 1792. Этим объясняется громадный скачек в скорости вычислений двойной точности: с 213 до 5304 GFLOPS.

Впечатлили и тактовые частоты работы графического процессора NVIDIA GP100: в номинальном режиме она составляет 1328 МГц, а в динамическом достигает 1480 МГц. При этом показатель TDP новинки вырос на 50 Вт: с 250 до 300 Вт. Сравнительная таблица технической спецификации видеокарты NVIDIA Tesla P100 со своими предшественниками:

Модель	NVIDIA Tesla K40	NVIDIA Tesla M40	NVIDIA Tesla P100
GPU	NVIDIA GK110	NVIDIA GM200	NVIDIA GP100
Микроархитектура	NVIDIA Kepler	NVIDIA Maxwell	NVIDIA Pascal
Техпроцесс, нм	28	28	16
Площадь GPU, мм²	551	601	610
Количество транзисторов, млрд.	7,1	8	15,3
Количество SM-модулей	15	24	56
Количество CUDA-ядер	2880	3072	3584
Количество CUDA-ядер для вычислений двойной точности	960	96	1792
Количество текстурных блоков	240	192	224
Базовая / динамическая тактовая частота, МГц	745 / 875	948 / 1114	1328 / 1480
Тип видеопамяти	GDDR5	GDDR5	HBM2
Объем памяти, ГБ	12	24	16
Разрядность шины, бит	384	384	4096
Скорость вычислений двойной точности, GFLOPS	1680	213	5304
TDP, Вт	235	250	300

http://www.pcworld.com
Сергей Будиловский

Постоянная ссылка на новость

06-04-2016 09:50

Серия видеокарт EVGA GeForce GTX 950 Low Power включает в себя четыре модели

Компания EVGA презентовала сразу четыре новые видеокарты серии EVGA GeForce GTX 950 Low Power, ключевым преимуществом которых является пониженное энергопотребление, поэтому для корректной работы они не требуют подключения 6-контактного кабеля PCIe.

Также представленные новинки характеризуются компактными размерами и одновентиляторной фирменной системой охлаждения ACX 2.0. В результате они отлично подойдут для использования в компактных среднепроизводительных игровых системах.

Что же касается технических характеристик, то базовая и динамическая частоты графического процессора моделей EVGA GeForce GTX 950 (02G-P4-0952) и EVGA GeForce GTX 950 (02G-P4-0954) находятся на уровне 1025 и 1190 МГц соответственно. В версиях EVGA GeForce GTX 950 SC (02G-P4-0956) и EVGA GeForce GTX 950 SC (02G-P4-0958) аналогичные показатели составляют 1076 и 1253 МГц. А вот подсистема оперативной памяти у них одинаковая – 2 ГБ GDDR5 с эффективной частотой 6608 МГц и 128-битной шиной.

Сравнительная таблица технической спецификации видеокарт серии EVGA GeForce GTX 950 Low Power:

Модель	EVGA GeForce GTX 950 (02G-P4-0952)	EVGA GeForce GTX 950 (02G-P4-0954)	EVGA GeForce GTX 950 SC (02G-P4-0956)	EVGA GeForce GTX 950 SC (02G-P4-0958)
GPU	NVIDIA GM206-250
Микроархитектура	NVIDIA Maxwell
Техпроцесс, нм	28
Количество CUDA-ядер	768
Количество текстурных блоков	48
Количество растровых блоков	32
Тактовая частота GPU, МГц	1025 / 1190		1076 / 1253
Тип видеопамяти	GDDR5
Объем, ГБ	2
Номинальная / эффективная частота памяти, МГц	1652 / 6608
Ширина шины памяти, бит	128
Пропускная способность памяти, ГБ/с	105,73
Внешние интерфейсы	1 x DVI-I 1 x HDMI 1 x DisplayPort	1 x DVI-I 1 x DVI-D 1 x HDMI 1 x DisplayPort	1 x DVI-I 1 x HDMI 1 x DisplayPort	1 x DVI-I 1 x DVI-D 1 x HDMI 1 x DisplayPort

http://www.techpowerup.com
http://www.evga.com
Сергей Будиловский

Постоянная ссылка на новость

06-04-2016 09:18

NVIDIA на GTC 2016: анонс микроархитектуры NVIDIA Pascal и ряд других инноваций

В калифорнийском городе Сан-Хосе успешно стартовала GPU Technology Conference (GTC), в рамках которой компания NVIDIA сделала ряд важных анонсов своих будущих продуктов. В первую очередь многих интересует микроархитектура NVIDIA Pascal, поэтому с нее и начнем.

NVIDIA Tesla P100

Первым официальным анонсом новой микроархитектуры стали не массовые пользовательские видеокарты, а ускоритель для сверхмасштабируемых дата-центров − NVIDIA Tesla P100. С его помощью можно создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Мощности подобных решений будет достаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.

Модель NVIDIA Tesla P100 использует пять передовых технологий для обеспечения высокой производительности и эффективности использования ресурсов:

Микроархитектура NVIDIA Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе NVIDIA Maxwell.
Высокоскоростной интерфейс NVIDIA NVLink используется для связи между несколькими графическими процессорами. Он более эффективно распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVIDIA NVLink позволяет связать до восьми GPU NVIDIA Tesla P100. IBM уже внедрила этот интерфейс в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
16-нм FinFET-технология позволила интегрировать в процессор 15,3 млрд. транзисторов, что гарантирует высочайшую производительность и энергоэффективность.
Инновационный подход к строению памяти Chip-on-Wafer-on-Substrate (CoWoS) с HBM2 повышает пропускную способность в 3 раза (до 720 ГБ/с) по сравнению с архитектурой NVIDIA Maxwell.
Новые алгоритмы искусственного интеллекта обеспечивают пиковую производительность свыше 21 TFLOPS в задачах глубокого обучения.

Использование ускорителя NVIDIA Tesla P100 позволяет достичь феноменальных результатов. Например, приложение молекулярной динамики AMBER работает быстрее на одном сервере с NVIDIA Tesla P100, чем на 48 обычных двухсокетных серверных узлах. А для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU NVIDIA Tesla P100.

Ключевые характеристики NVIDIA Tesla P100:

Модель	NVIDIA Tesla P100
Тип памяти	CoWoS HBM2
Объем памяти	16 ГБ
Полоса пропускания	720 ГБ/с
Интерфейс	Двунаправленный NVIDIA NVLink
Пропускная способность интерфейса	160 ГБ/с
Скорость вычислений двойной точности	5,3 TFLOPS
Скорость вычислений одинарной точности	10,6 TFLOPS
Скорость вычислений половинной точности	21,2 TFLOPS
Дополнительные преимущества	Улучшенная программируемость с движком перехода по страницам и унифицированной памятью Защита ECC для повышенной надежности Оптимизация под сервер для высокой пропускной способности и надежности дата-центра

Обновления в NVIDIA SDK

Возросшая вычислительная мощность и расширенные функциональные возможности потребовали обновления платформы NVIDIA SDK. В число ключевых изменений входит NVIDIA CUDA 8. Новейшая версия платформы параллельных вычислений NVIDIA представляет разработчикам прямой доступ к новым возможностям микроархитектуры NVIDIA Pascal, включая унифицированную память и интерфейс NVIDIA NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

Для сетей глубокого обучения NVIDIA анонсировала GPU-ускоряемую библиотеку примитивов cuDNN версии 5. Она включает в себя поддержку GPU NVIDIA Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для применения в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.

NVIDIA DGX-1

NVIDIA DGX-1 – это первый в мире суперкомпьютер для глубокого обучения, который обладает достаточной вычислительной мощью для развития искусственного интеллекта (ИИ). Он разработан специально для задач глубокого обучения (Deep Learning). Система NVIDIA DGX-1 оснащена всем необходимым аппаратным и программным обеспечением для глубокого обучения и инструментами разработки для быстрого и легкого развертывания.

В основе новинки находятся графические ускорители NVIDIA Tesla P100 с высокоскоростным интерфейсом NVIDIA NVLink и 16 ГБ памяти CoWoS HBM2. В результате вычислительную мощность NVIDIA DGX-1 можно сопоставить с 250 традиционными серверами на базе CPU.

В свою очередь набор комплектного ПО включает в себя NVIDIA Deep Learning GPU Training System (DIGITS), полноценную интерактивную систему для создания глубоких нейронных сетей (DNN), а также NVIDIA CUDA Deep Neural Network (cuDNN) версии 5 − GPU-ускоряемую библиотеку примитивов для создания DNN.

В США системы глубокого обучения NVIDIA DGX-1 будут доступны напрямую у NVIDIA и у некоторых партнеров в июне, в других регионах − в третьем квартале текущего года. Также ожидается, что ускоритель NVIDIA Tesla P100 появится в составе серверов от ведущих производителей в начале 2017 года.

Ключевые характеристики системы NVIDIA DGX-1:

Название	NVIDIA DGX-1
Используемые ускорители	8 х NVIDIA Tesla P100
Объем памяти каждого ускорителя	16 ГБ
Интерфейс	NVLink Hybrid Cube Mesh
Постоянная память	7 ТБ SSD
Пиковая производительность вычислений половинной точности	170 TFLOPS
Сетевые интерфейсы	Dual 10 GbE, Quad InfiniBand 100Gb
Формат	3U
Мощность	3200 Вт

http://www.nvidia.com
Сергей Будиловский

Постоянная ссылка на новость

01-04-2016 16:09

AMD FirePro S9300 x2 – первый в мире серверный графический ускоритель с поддержкой HBM-памяти

Компания AMD с гордостью представила свой флагманский графический ускоритель для серверных систем – AMD FirePro S9300 x2. Он предназначен для использования в сложных вычислительных задачах, например, для анализа больших массивов данных, в сфере молекулярной динамики, при изучении астрономических процессов, в глубоких нейронных сетях и других.

Новинка построена на основе двух GPU AMD Fiji в максимальной их конфигурации (4096 потоковых процессоров в каждом), которые работают на частоте 850 МГц. Каждый из них использует собственные 4 ГБ HBM-памяти с эффективной частотой 1000 МГц и пропускной способностью 512 ГБ/с. Благодаря этому вычислительная мощность достигает 13,9 TFLOPS, что существенно выше конкурентных аналогов в виде NVIDIA Tesla K80 (5,6 TFLOPS) и NVIDIA Tesla M60 (7,4 TFLOPS).

Важным преимуществом AMD FirePro S9300 x2 является поддержка программного стека AMD GPUOpen, который реализует аппаратное ускорение программного кода, написанного на C++ или OpenCL. В продажу новинка поступит во втором квартале по ориентировочной стоимости $5999.

Сводная таблица технической спецификации графического адаптера AMD FirePro S9300 x2:

Модель	AMD FirePro S9300 x2
Используемая микроархитектура	AMD GCN
Количество графических процессоров	2
Тип графических процессоров	AMD Fiji
Количество потоковых процессоров	2 x 4096
Тактовая частота GPU, МГц	850
Тип видеопамяти	HBM
Объем, ГБ	2 x 4
Базовая / эффективная частота памяти, МГц	500 / 1000
Пропускная способность, ГБ/с	2 х 512
Максимальная вычислительная мощность (одиночная точность), TFLOPS	13,9
Максимальная вычислительная мощность (двойная точность), GFLOPS	870
Тип системы охлаждения	Двухслотовая, пассивная
Внутренний интерфейс	PCI Express 3.0 x16
Дополнительные разъемы питания	2 х 8-контактные
Потребляемая мощность, Вт	300
Ориентировочная стоимость, $	5999

http://www.techpowerup.com
http://www.amd.com
Сергей Будиловский

Постоянная ссылка на новость

29-03-2016 14:27

Видеокарта ASUS Radeon R7 250 (R7250-2GD5) с поддержкой технологии AUTO-EXTREME

В данный момент бюджетный сегмент рынка графических адаптеров компании AMD представляет линейка AMD Radeon R7 200. Поэтому особого удивления дебют модели ASUS Radeon R7 250 (R7250-2GD5) не вызывает. Она построена на основе графического чипа AMD Oland XT и оснащена поддержкой 2 ГБ GDDR5-памяти, поэтому сможет использоваться даже нетребовательными геймерами.

Базовая тактовая частота графического процессора новинки составляет 725 МГц. В динамическом режиме она может повышаться до 925 МГц. В свою очередь видеопамять работает на эффективной частоте 4500 МГц. Для охлаждения внутренних компонентов используется достаточно компактная система на основе алюминиевого радиатора и одного осевого вентилятора с дизайном Dust-proof fan.

Особого внимания в ASUS Radeon R7 250 (R7250-2GD5) заслуживает использование технологии ASUS AUTO-EXTREME при ее производстве, а также применение надежной элементной базы Super Alloy Power II. А в комплект поставки новинки входит полезная фирменная утилита GPU Tweak II. Более подробная таблица технической спецификации видеокарты ASUS Radeon R7 250 (R7250-2GD5):

Модель	ASUS Radeon R7 250 (R7250-2GD5)
GPU	AMD Oland XT
Микроархитектура	AMD GCN
Техпроцесс, нм	28
Количество потоковых процессоров	384
Количество текстурных блоков	24
Количество растровых блоков	8
Базовая / динамическая тактовая частота GPU, МГц	725 / 925
Тип видеопамяти	GDDR5
Объем, ГБ	2
Номинальная / эффективная частота памяти, МГц	1125 / 4500
Ширина шины памяти, бит	128
Внешние интерфейсы	1 x DVI-I 1 x HDMI 1 x DisplayPort
Размеры, мм	168 x 121 x 37 мм

http://www.asus.com
Сергей Будиловский

Постоянная ссылка на новость

28-03-2016 11:55

AMD Greenland – это AMD Vega 10 с 4096 потоковыми процессорами

Очередная порция неофициальной, но весьма любопытной информации поступила благодаря профилю одного из сотрудников компании AMD в сети LikenIn, который сообщил некоторые подробности о следующем флагманском графическом процессоре поколения v9.0. В нем будет использоваться 4096 потоковых процессоров архитектуры v15.

Очевидно, что «v9.0» и «v15» − это внутренние обозначения для нового флагманского GPU. Ранее он был известен как «AMD Greenland». Дата его релиза ожидалась в 2016 году. Но в свете новой дорожной карты многие предполагают, что это будет чип AMD Vega 10 с поддержкой памяти HBM2, который выйдет в начале 2017 года.

В текущем же году на рынке появятся менее производительные модели линейки AMD Polaris. Речь идет о шести GPU серии AMD Polaris 11 (AMD Baffin), которые предположительно займут мейнстрим-сегмент (ранее предполагалось, что AMD Baffin будет высокопроизводительным чипом), и о двух графических процессорах серии AMD Polaris 10 (AMD Ellesmere), которые нацелены на рынок производительных систем. Одна из версий AMD Polaris 10 с кодовым обозначением «67DF» оснащена 2304 потоковыми процессорами и 8 ГБ GDDR5-памяти с эффективной частотой 6 ГГц и 256-битной шиной.

В результате именно AMD Vega 10 заменит модели серии AMD Fiji, в то время как серия AMD Polaris 10 придет на смену моделям серии AMD Radeon R9 390. Любопытно, что количество потоковых процессоров у них одинаковое, но использование улучшенной микроархитектуры должно обеспечить заметный прирост производительности.

http://videocardz.com
Сергей Будиловский

Постоянная ссылка на новость

Поиск по сайту

Компьютерные новости

Видеокарты

Предположительные сроки появления AMD Polaris и NVIDIA Pascal

Сроки появления видеокарты AMD Radeon Pro Duo в продаже

Подробный взгляд на графический процессор NVIDIA GP100 (Pascal)

Серия видеокарт EVGA GeForce GTX 950 Low Power включает в себя четыре модели

NVIDIA на GTC 2016: анонс микроархитектуры NVIDIA Pascal и ряд других инноваций

AMD FirePro S9300 x2 – первый в мире серверный графический ускоритель с поддержкой HBM-памяти

Видеокарта ASUS Radeon R7 250 (R7250-2GD5) с поддержкой технологии AUTO-EXTREME

AMD Greenland – это AMD Vega 10 с 4096 потоковыми процессорами