Поиск по сайту

up

Компьютерные новости

Все разделы

Суперкомпьютер Frontier на базе AMD сталкивается с трудностями, ни дня без проблем в работе

Когда AMD объявила, что поставит самый быстрый в мире суперкомпьютер Frontier, компания также взяла на себя масштабную задачу по созданию машины, способной производить один ExaFLOP с общей устойчивой способностью выполнять вычислительные задачи. Хотя система, наконец, запущена и работает, заставить машину такого размера работать должным образом непросто. В мире высокопроизводительных вычислений поставка аппаратного обеспечения — это только часть работы центра высокопроизводительных вычислений. В интервью InsideHPC Джастин Уитт, директор программы Oak Ridge Leadership Computing Facility (OLCF), рассказал, каково это — управлять самым быстрым в мире суперкомпьютером и с какими проблемами он сталкивается.

Система Frontier оснащена 64-ядерными процессорами AMD EPYC 7A53s «Trento» с тактовой частотой 2,0 ГГц и графическими процессорами Instinct MI250X. Все это соединяет 64-портовый коммутатор HPE (Cray) Slingshot, который отвечает за отправку данных в вычислительные блейды и из них. Недавнее интервью указывает на довольно интересный вывод: именно графические процессоры AMD Instinct MI250X и интерконнект Slingshot вызывают проблемы с оборудованием для Frontier. «В основном это проблемы масштаба вычислений в сочетании с разнообразием приложений, поэтому проблемы, с которыми мы сталкиваемся, в основном связаны с выполнением очень, очень больших заданий с использованием всей системы и обеспечением согласованной работы всего оборудования для таких задач», — говорит Джастин Уитт. В дополнение к ограничениям масштаба «Проблемы охватывают множество различных категорий, графические процессоры — лишь одна из них. Многие проблемы сосредоточены вокруг них, но это не большинство проблем, которые мы наблюдаем», — сказал он. «Это довольно хороший разброс среди общих проблем в отказе деталей, которые и составляют их большую часть. Я не думаю, что на данный момент у нас есть много беспокойства по поводу продуктов AMD. Мы имеем дело с большим количеством оборудования еще в стадии раннего периода работы, такое всегда случается с новыми решениями такого масштаба, которые и ранее мы разворачивали и вводили в работу, так что в этом нет ничего необычного».

Многие приложения не могут работать на оборудовании такого масштаба, поэтому необходима уникальная настройка. Из-за аппаратных проблем, возникающих с графическими процессорами AMD, немного сложнее своевременно установить и настроить операционную среду. Тем не менее, команда из Ок-Риджа уверена в своих силах и без проблем соблюдает сроки. Для получения дополнительной информации прочитайте интервью InsideHPC.

https://www.techpowerup.com
Паровышник Валерий

ТОП-10 Материалов
  1. Тест процессора Core i5-14500 по сравнению с Core i5-14400, Core i5-13600K, Core i5-13500 и Ryzen 7 7700X: быстрее за те же деньги!
  2. Тест GeForce GTX 1060 6GB и 3GB в 20 играх в 2024 году: это живая классика?
  3. Геймплей на интегрированной графике Radeon 760M в Ryzen 5 8600G: серая посредственность или золотая середина?
  4. Тест процессора Ryzen 7 8700F по сравнению с Ryzen 7 7700, Core i7-12700K и Core i5-13400: когда будет дешевле?
  5. Обзор материнской платы MSI B650M GAMING PLUS WIFI: что получаем по цене менее $200?
  6. Обзор материнской платы ASUS TUF GAMING B850-PLUS WIFI на AMD B850: для Ryzen 9000 и не только
  7. Тест процессора AMD Ryzen 9 9950X по сравнению с Ryzen R9 9900X, Ryzen R9 7950X и Core i9-13900KF: флагман на Zen 5
  8. Обзор системы жидкостного охлаждения ARCTIC Liquid Freezer III 360 A-RGB (White): многочисленные оптимизации
  9. Тест GeForce RTX 4060 в 20 играх: лучшая народная видеокарта в 2024 году
  10. Тест процессора AMD Ryzen 7 9700X по сравнению с R7 7700X, R5 9600X, R7 5800X3D и Core i7-14700K: оптимальный для работы и развлечений?