Поиск по сайту

up

Компьютерные новости

Все разделы

GPU проектируемые в NVIDIA PrefixRL станут на 25% меньше и более эффективными

При проектировании интегральных схем инженеры стремятся создать эффективную и простую в изготовлении конструкцию. Если им удастся уменьшить размер схемы, затраты на ее производство также уменьшатся. NVIDIA опубликовала в своем техническом блоге метод, в котором компания применила модель искусственного интеллекта под названием PrefixRL. Используя глубокое обучение с поддержкой, NVIDIA использует модель PrefixRL, это поможет превзойти традиционные инструменты EDA (автоматизация проектирования электроники) от крупных поставщиков, таких как Cadence, Synopsys или Siemens/Mentor. Поставщики EDA обычно внедряют собственное решение искусственного интеллекта для размещения и маршрутизации микросхем (PnR); однако решение PrefixRL от NVIDIA, кажется, творит чудеса в рабочем процессе компании.

Целью PrefixRL является создание модели глубокого, усиленного обучения, с сохранением задержек как у EDA PnR, но с уменьшением площади кристалла. Согласно техническому блогу, последняя архитектура графического процессора Hopper H100 использует 13 000 экземпляров арифметических схем, разработанных моделью искусственного интеллекта PrefixRL. NVIDIA выпустила модель, которая имеет на 25% меньшую площадь, чем сопоставимая полученная в EDA. И все это при достижении аналогичной или лучшей производительности. Ниже вы можете сравнить дизайн 64-битного сумматора, созданный PrefixRL, и такой же дизайн, созданный ведущим в отрасли инструментом EDA.

 Обучение такой модели требует больших вычислительных ресурсов. NVIDIA сообщает, что для обучения проектированию 64-битной схемы сумматора потребовалось 256 ядер ЦП для каждого графического процессора и 32 000 часов работы графического процессора. Компания разработала Raptor, собственную распределенную платформу усиленного обучения, которая использует уникальные преимущества оборудования NVIDIA для такого рода промышленного усиленного обучения, которое вы можете увидеть ниже, а также схему его работы. В целом, система довольно сложна и требует много аппаратного обеспечения и ввода данных; однако в результате получается графический процессор меньшей площади, но с большей эффективностью работы.

https://www.techpowerup.com
Паровышник Валерий