Ускоритель AMD Instinct MI400 предложит 8 XCD и новые схемы ввода-вывода

AMD продолжает развитие линейки Instinct для дата-центров. По данным из базы Freedesktop, в работе над новым ускорителем Instinct MI400 упоминаются ключевые характеристики, которые существенно расширят вычислительный потенциал. Сообщается, что кристаллы MI400 будут организованы вокруг двух AID, каждый из которых содержит по четырём XCD, в сумме получаются восемь XCD. Такой состав обеспечивает двукратное увеличение числа вычислительных блоков по сравнению с MI300. Также отмечается наличие отдельных кристаллов, предназначенных для задач мультимедиа и для ввода-вывода.

Ускоритель AMD Instinct MI400: 8 XCD и новые матрицы ввода-вывода

Дополнительно для каждого вспомогательного устройства планируется выделение отдельного MID, что значительно ускорит обмен данными между вычислительными блоками и интерфейсами. В нынешних версиях AMD применяет шину Infinity Fabric для соединения нескольких кристаллов, однако в задачах искусственного интеллекта, где критично минимальные задержки и максимальная пропускная способность, такая конфигурация может стать ограничивающим фактором. Ожидается, что MI400 будет использовать более продвинутую схему межсоединений, что позволит сократить задержки и повысить скорость передачи данных между кристаллами и контроллерами ввода-вывода.

MI400: 8 XCD и новые матрицы ввода-вывода

Плановый выпуск MI400 запланирован на 2026 год, и новинка, как ожидается, будет построена на архитектуре CDNA следующего поколения. При этом компания может применить более универсальную архитектуру под названием UDNA, которая теоретически найдёт применение не только в дата-центрах, но и в игровых решениях следующего поколения.

Ниже — примеры того, как MI400 может быть полезен целевой аудитории приложений:

  • Обучение крупных языковых моделей: восьми XCD-подразделения позволяют распараллеливать обработку слоев и ускорить этапы тренировки на больших наборах данных.
  • Инференс в режиме реального времени: разделение мультимедийных и вычислительных блоков снижает задержку и улучшает пропускную способность при обработке видеопотоков и аудиосигналов.
  • Масштабируемые кластеры: сочетание MI400 с несколькими ускорителями упрощает горизонтальное масштабирование обучения и инференса в кластерах, оптимизируя маршрутизацию между CPU, памятью и устройствами ввода-вывода.
  • Энергоэффективность и охлаждение: возросшая плотность вычислений требует продуманных решений по охлаждению и управлению энергопотреблением, что влияет на общую стоимость эксплуатации дата-центра.
  • Совместимость и инструменты разработки: поддержка популярных ML/AI фреймворков и инструментов программирования поможет быстрее переходить на новый ускоритель без кардинальных изменений в коде.
Читайте также:  Пользователь рассказал о прошивке BIOS, длящейся дольше двух суток
Понравилась статья? Поделиться с друзьями:
CyberSafe: компьютерная безопасность