Компьютерные новости
Все разделы
AMD представила блок-схему графического процессора для высокопроизводительных вычислений CDNA2 MI250X «Aldebaran»
AMD в своей презентации HotChips 22 опубликовала блок-схему своего самого большого процессора AI-HPC, Instinct MI250X. Он основан на вычислительной архитектуре CDNA2, MI250X базируется на «Aldebaran» MCM (многочиповый модуль). Этот MCM содержит два логических кристалла (кристаллы графического процессора) и восемь стеков HBM2E, по четыре на кристалл графического процессора. Два кристалла графического процессора соединены каналом Infinity Fabric со скоростью 400 ГБ/с. Каждый из них имеет до 500 ГБ/с внешней пропускной способности Infinity Fabric для межсокетной связи; и PCI-Express 4.0 x16 в качестве главной системной шины для форм-факторов AIC. Два кристалла графического процессора вместе составляют 58 миллиардов транзисторов и производятся на узле TSMC N6 (6 нм).
В иерархии компонентов каждого кристалла графического процессора восемь шейдерных движков совместно используют кеш L2 последнего уровня. Всего восемь шейдерных движков имеют 112 вычислительных блоков или 14 CU на каждый движок. Вычислительный блок CDNA2 содержит 64 потоковых процессора, составляющих Shader Core, и четыре Matrix Core Unit. Это специализированное оборудование для матричных/тензорных математических операций. Таким образом, на кристалл графического процессора приходится 7 168 потоковых процессоров и 14 336 на пакет. AMD заявляет о 100-процентном увеличении производительности вычислений с двойной точностью по сравнению с CDNA (MI100). AMD объясняет это увеличением частоты, эффективными путями данных, обширным повторным использованием операндов и пересылкой; и оптимизацией энергопотребления, благодаря которой появилась возможность повысить частоты. MI200 уже работает на суперкомпьютере Frontier и работает над достижением новых побед в сфере дизайна в области высокопроизводительных вычислений. Компания также намекнула, что MI300, основанный на CDNA3, будет APU. Он будет включать в себя кристаллы графического процессора, логику ядра и ПЗС-матрицы ЦП в одном корпусе, что является конкурирующим решением для суперчипа NVIDIA Grace Hopper.