Компания Pegatron, один из ведущих мировых OEM-производителей серверного оборудования, официально анонсировала выход нового флагманского ИИ-сервера AS501-4A1-16I1. Это решение ориентировано на задачи высокопроизводительных вычислений (HPC) и масштабные ИИ-нагрузки, включая как обучение, так и инференс больших языковых моделей (LLM). Особое внимание разработчики уделили системе охлаждения — сервер оснащён жидкостным охлаждением (СЖО) и поддерживает установку до 16 ускорителей AMD Instinct MI355X в одном корпусе форм-фактора 5OU.
Архитектура нового ИИ-сервера: мощность и масштабируемость
Сервер AS501-4A1-16I1 построен на базе новейшей аппаратной платформы AMD и представляет собой симметричную двухсекционную систему. В конструкции предусмотрены:
- Два CPU-узла;
- Два GPU-лотка;
- Модульная система охлаждения;
- Высокоскоростная сеть и расширенные возможности управления.
Такая архитектура позволяет достичь беспрецедентной плотности вычислений в стойке. В одном 42U-стойке RA5100-128I1 можно разместить до восьми серверов AS501-4A1-16I1, что в сумме даёт:
- До 32 процессоров AMD EPYC 9005;
- До 128 ускорителей Instinct MI355X.
Это делает решение особенно привлекательным для дата-центров, ориентированных на ИИ-инфраструктуру следующего поколения.
Процессорная подсистема: до четырёх EPYC 9005 Turin
Каждый CPU-узел поддерживает установку двух процессоров AMD EPYC 9005 Turin, что в совокупности даёт возможность использовать до четырёх CPU в одном сервере. Эти чипы относятся к последнему поколению архитектуры Zen 5 и обладают рядом ключевых преимуществ:
- TDP до 500 Вт — обеспечивает максимальную производительность при высоких нагрузках;
- Поддержка памяти DDR5-6400 RDIMM — высокая пропускная способность и низкие задержки;
- Возможность установки до 24 модулей ОЗУ на CPU, то есть до 48 модулей на весь сервер.
Такая конфигурация идеально подходит для задач, требующих как вычислительной мощности, так и большого объёма оперативной памяти — например, для обучения многомиллиардных параметрических моделей или выполнения сложных симуляций в реальном времени.
Графическая подсистема: 16 ускорителей Instinct MI355X
Сердце сервера — два GPU-лотка, каждый из которых вмещает по восемь ускорителей AMD Instinct MI355X. Эти GPU основаны на архитектуре CDNA 4 и обладают следующими характеристиками:
- 288 ГБ памяти HBM3E на каждый ускоритель;
- Пропускная способность памяти до 8 ТБ/с;
- Поддержка технологии AMD Infinity Fabric для высокоскоростного межчипового взаимодействия;
- Оптимизация под ИИ-фреймворки, включая ROCm, PyTorch и TensorFlow.
В совокупности система может оперировать более чем 4,5 ТБ высокоскоростной HBM3E-памяти, что позволяет загружать и обрабатывать огромные модели без необходимости частой подгрузки данных с диска.
Сетевая инфраструктура и расширяемость
Для обеспечения высокой пропускной способности между узлами и внешними системами в AS501-4A1-16I1 реализовано 12 слотов PCIe 5.0 x16 FHHL. В стандартной конфигурации они заняты следующими сетевыми адаптерами:
- 10 однопортовых адаптеров 400GbE — для высокоскоростного соединения с ИИ-кластером;
- 2 двухпортовых адаптера 10GbE — для служебного трафика и управления.
Такая схема позволяет строить масштабируемые ИИ-кластеры с минимальными задержками и максимальной пропускной способностью, что критично для распределённого обучения и инференса.
Система охлаждения и энергоснабжение
Учитывая тепловыделение от 16 ускорителей и четырёх процессоров с TDP до 500 Вт, Pegatron применила комбинированную систему охлаждения:
- Основное — жидкостное охлаждение (СЖО), обеспечивающее эффективный отвод тепла от CPU и GPU;
- Дополнительно — 10 вентиляторов для охлаждения периферийных компонентов и обеспечения циркуляции воздуха в корпусе.
Питание осуществляется через шину ORv3 на 48 В постоянного тока, что соответствует современным стандартам энергоэффективности дата-центров и позволяет снизить потери при передаче энергии.
Управление и мониторинг
Сервер оснащён современным контроллером Aspeed AST2600, который обеспечивает:
- Два порта управления 1GbE (RJ45);
- Выделенный порт управления (dedicated RJ45);
- Последовательный порт через Micro-USB;
- Интерфейсы USB 2.0 Type-C и Mini-DP для локального доступа.
Это позволяет администраторам осуществлять полный контроль над сервером даже при отключённой основной системе — от диагностики до перезагрузки и обновления прошивки.
Почему это важно для российского рынка?
На фоне глобальных технологических ограничений и стремления к импортозамещению в ИТ-инфраструктуре, решения на базе AMD становятся всё более востребованными в России. Серверы, подобные AS501-4A1-16I1, предлагают:
- Высокую производительность без зависимости от NVIDIA;
- Открытую экосистему ROCm, совместимую с большинством ИИ-фреймворков;
- Гибкость в построении собственных ИИ-кластеров.
Для российских дата-центров, исследовательских институтов и крупных корпораций это открывает путь к созданию независимой и мощной ИИ-инфраструктуры.
Как собрать аналогичную систему сегодня?
Хотя готовые серверы Pegatron поставляются только OEM-партнёрам, в России уже доступны компоненты для сборки высокопроизводительных ИИ-систем на базе AMD EPYC и Instinct. Компания Server360.ru предлагает:
- Серверные платформы с поддержкой EPYC 9004/9005;
- Процессоры AMD EPYC с TDP до 500 Вт;
- Оперативную память DDR5-6400 RDIMM с ECC;
- Накопители для хранения обучающих датасетов и моделей;
- Готовые сборки под заказ — от одиночных узлов до полноценных ИИ-кластеров.
Специалисты Server360.ru помогут подобрать оптимальную конфигурацию с учётом ваших задач, бюджета и требований к охлаждению и энергопотреблению.
Как оценить потребности вашей организации в ИИ-инфраструктуре
- Определите тип задач: обучение LLM, fine-tuning, инференс или HPC-симуляции.
- Оцените объём модели и требуемый объём GPU-памяти (например, для 70B-модели потребуется минимум 140 ГБ VRAM).
- Рассчитайте необходимую пропускную способность сети между узлами (рекомендуется не менее 200 GbE на узел для распределённого обучения).
- Выберите архитектуру: CPU-only, GPU-accelerated или гибридную.
- Обратитесь к специалистам Server360.ru для подбора оборудования и проектирования системы.
Сравнение с конкурентами: AMD vs NVIDIA
| Параметр | AMD Instinct MI355X | NVIDIA H100 (аналог) |
|---|---|---|
| Память HBM | 288 ГБ HBM3E | 80 ГБ HBM3 |
| Пропускная способность памяти | 8 ТБ/с | 3,35 ТБ/с |
| Поддержка ИИ-фреймворков | ROCm, PyTorch, TensorFlow | CUDA, cuDNN, TensorRT |
| Экосистема | Открытая, но менее зрелая | Зрелая, но проприетарная |
| Доступность в РФ | Высокая | Ограничена |
Как видно из таблицы, AMD предлагает не только конкурентоспособные технические характеристики, но и стратегическое преимущество в условиях санкционных ограничений.
Часто задаваемые вопросы
Можно ли использовать Instinct MI355X для инференса в production?
Да, ускорители MI355X оптимизированы как для обучения, так и для инференса. Благодаря 288 ГБ HBM3E памяти на GPU, даже самые крупные модели (до 100B параметров) могут размещаться целиком в памяти одного ускорителя, что значительно ускоряет обработку запросов.
Поддерживает ли ROCm российские ИИ-фреймворки?
ROCm активно развивается и уже поддерживает большинство open-source фреймворков, включая те, что используются в российских разработках (например, Yandex GPT, SberDevices и др.). При необходимости интеграция может быть выполнена совместно с разработчиками.
Нужно ли использовать СЖО для работы с такими серверами?
Для полной загрузки 16 ускорителей и 4 CPU с TDP 500 Вт воздушного охлаждения недостаточно. СЖО — обязательное условие стабильной работы. Однако Server360.ru предлагает решения с гибридным охлаждением для средних нагрузок.
Сколько стоит сборка на базе EPYC 9005 и Instinct MI355X?
Цена зависит от конфигурации. Базовый узел с 2 CPU, 16 модулями DDR5 и 4 ускорителями начинается от 12 млн рублей. Точную стоимость можно рассчитать в разделе готовых сборок или по запросу через форму обратной связи.
