Компания Supermicro, один из ведущих мировых производителей серверного оборудования, представила новую высокопроизводительную GPU-систему AS-A126GS-TNMR. Это решение в форм-факторе 10U создано специально для задач искусственного интеллекта, научных вычислений и других HPC-нагрузок и отличается использованием новейших компонентов от AMD, включая ускорители AMD Instinct MI355X и процессоры EPYC 9005 Turin/9004 Genoa.
В отличие от многих конкурентов, Supermicro делает ставку на эффективное воздушное охлаждение даже при плотной компоновке: сервер поддерживает до восьми ИИ-акселераторов и двух 192-ядерных процессоров с TDP до 500 Вт. Это делает модель AS-A126GS-TNMR привлекательной для центров обработки данных, где жидкостное охлаждение либо недоступно, либо экономически нецелесообразно.
Архитектура и производительность
Серверная платформа AS-A126GS-TNMR построена на новом поколении чипсетов AMD SP5 и полностью совместима с процессорами EPYC 9004 (Genoa) и EPYC 9005 (Turin). Это позволяет использовать до двух 192-ядерных процессоров с поддержкой 4 Тбайт оперативной памяти при использовании 3-уровневых стеков (3DS) и до 6 Тбайт при конфигурации с обычными модулями. Общая пропускная способность памяти достигает 512 Гбайт/с на процессор.
Оперативная память реализована через 24 слота DDR5-6400 (12 на канал), что обеспечивает не только высокую плотность, но и широкие возможности для настройки баланса между производительностью и энергоэффективностью. Все модули поддерживают технологии ECC и memory mirroring, что критично для корпоративных и HPC-сценариев.
Однако настоящая «изюминка» сервера — его GPU-подсистема. В AS-A126GS-TNMR устанавливаются восемь ускорителей AMD Instinct MI355X, каждый из которых оснащён:
- 288 Гбайт памяти HBM3E
- пропускной способностью до 8 Тбайт/с
- вычислительной мощностью до 1,5 PetaFLOPS в формате FP8/INT8
Ускорители соединены через высокоскоростной интерконнект AMD Infinity Fabric, что обеспечивает минимальные задержки и максимальную пропускную способность между GPU и CPU. Архитектура Infinity Fabric также позволяет объединять ускорители в кластеры для распределённого обучения ИИ-моделей без узких мест на этапе обмена данными.
Хранилище и расширяемость
Сервер предлагает гибкую и масштабируемую систему хранения:
- 10 отсеков SFF с возможностью горячей замены: 8 × NVMe PCIe 5.0 x4 + 2 × SATA
- 2 слота M.2 (NVMe) на передней панели
Такая конфигурация позволяет одновременно использовать высокоскоростные NVMe-накопители для обработки данных и SATA-диски — для архивации или буферизации. Поддержка PCIe 5.0 обеспечивает скорость до 14 Гбайт/с на один NVMe-накопитель, что особенно важно для ИИ-пайплайнов с интенсивным вводом-выводом.
Помимо накопителей, AS-A126GS-TNMR предлагает обширные возможности расширения:
- 8 слотов PCIe 5.0 x16 для низкопрофильных (LP) карт
- 2 слота PCIe 5.0 x16 для полноразмерных FHHL-устройств
Это позволяет подключать дополнительные сетевые адаптеры, интеллектуальные контроллеры RAID, FPGA-акселераторы или специализированные ИИ-чипы от сторонних производителей.
Система охлаждения и надёжность
Одним из главных вызовов при разработке такого мощного сервера стало обеспечение стабильного температурного режима. Supermicro реализовала эффективную схему воздушного охлаждения с резервированием вентиляторов:
- 5 вентиляторных блоков спереди
- 10 блоков сзади
- все вентиляторы — с возможностью горячей замены
Рабочий диапазон температур составляет +10…+35 °C, что соответствует стандартам большинства ЦОДов в России и странах СНГ. Несмотря на воздушное охлаждение, система способна стабильно работать под 100% нагрузкой даже при максимальной комплектации — благодаря продуманному airflow и интеллектуальному управлению скоростью вращения вентиляторов.
Для питания используются шесть блоков мощностью 5250 Вт с резервированием по схеме 3+3. Все блоки имеют сертификацию 80 Plus Titanium, что гарантирует КПД выше 96% даже при частичной нагрузке — критически важный параметр для снижения TCO в условиях роста тарифов на электроэнергию.
Сетевые и управляющие интерфейсы
Сервер оснащён встроенным сетевым контроллером Intel X710 с двумя портами 10GbE RJ45, что достаточно для большинства HPC-кластеров. Для задач, требующих более высокой скорости или RDMA, можно установить отдельные сетевые карты в слоты расширения (например, InfiniBand или 100/200GbE).
Управление сервером осуществляется через выделенный порт 1GbE BMC (IPMI 2.0), поддерживающий:
- удалённый мониторинг состояния компонентов
- KVM-over-IP
- виртуальные носители
- интеграцию с Redfish API
Дополнительно в комплект входят два порта USB 3.0 Type-A, аналоговый видеовыход D-Sub и модуль TPM 2.0 для обеспечения доверенной загрузки и шифрования данных.
Физические характеристики и доставка
Габариты системы: 438,8 × 449 × 843,28 мм (Ш×Г×В), масса — 133 кг. Такие размеры требуют использования усиленных стоек и, возможно, специального крепежа — особенно при установке в ряд с другими 10U-серверами.
Supermicro уже начала поставки AS-A126GS-TNMR на рынок. Российские компании могут приобрести готовую сборку или отдельные компоненты для интеграции через партнёров, таких как Server360.ru.
Для каких задач подходит AS-A126GS-TNMR?
Эта система ориентирована на следующие сценарии использования:
- Обучение больших языковых моделей (LLM) — благодаря высокой плотности памяти HBM3E и эффективному интерконнекту
- Генеративный ИИ — текст, изображения, видео
- Научные симуляции — вычислительная биология, молекулярное моделирование, гидродинамика
- Анализ данных в реальном времени — финасовые системы, логистика, телеметрия
- Гибридные облачные среды — в качестве выделенного узла для ИИ-нагрузок
При этом система остаётся совместимой с популярными фреймворками: PyTorch, TensorFlow, ROCm, OpenMP, CUDA (через эмуляцию), а также с Kubernetes и Slurm для оркестрации кластеров.
Сравнение с аналогами
| Параметр | Supermicro AS-A126GS-TNMR | NVIDIA DGX H100 | Dell PowerEdge XE9680 |
|---|---|---|---|
| Форм-фактор | 10U | 6U | 8U |
| GPU | 8 × AMD MI355X | 8 × NVIDIA H100 | 8 × NVIDIA H100 |
| Оперативная память | до 6 Тбайт DDR5 | до 5 Тбайт DDR5 | до 8 Тбайт DDR5 |
| Охлаждение | воздушное | жидкостное | воздушное / жидкостное |
| Энергопотребление (макс.) | ~28 кВт | ~35 кВт | ~30 кВт |
| Готовая поставка | Да | Долгие сроки | Под заказ |
Как видно из таблицы, AS-A126GS-TNMR предлагает отличную альтернативу дорогим и дефицитным решениям от NVIDIA. Хотя пиковая производительность MI355X может уступать H100 в некоторых задачах, разница компенсируется более низкой стоимостью, лучшей доступностью и отсутствием зависимости от CUDA-экосистемы.
Как собрать аналог самостоятельно?
Если готовая платформа Supermicro не соответствует вашим бюджетным или техническим требованиям, можно собрать аналог на базе совместимых компонентов. На сайте Server360.ru доступны готовые серверные платформы и отдельные комплектующие:
- Серверные процессоры AMD EPYC — до 192 ядер
- Оперативная память DDR5 ECC — до 6400 МГц
- NVMe/SATA-накопители — для баланса скорости и ёмкости
Эксперты Server360.ru помогут подобрать оптимальную конфигурацию под ваши задачи — от ИИ-стартапа до корпоративного ЦОДа.
Пошаговая инструкция: развертывание ИИ-кластера на базе AS-A126GS-TNMR
Как развернуть ИИ-кластер с Supermicro AS-A126GS-TNMR
- Проверьте совместимость вашей ИИ-инфраструктуры с экосистемой ROCm. Убедитесь, что фреймворки поддерживают архитектуру CDNA3.
- Закажите сервер в конфигурации с нужным объёмом памяти и типами накопителей через партнёра или напрямую у Supermicro.
- Подготовьте стойку: убедитесь, что пол выдержит 133 кг, и обеспечьте достаточный airflow (минимум 300 CFM на 1U).
- Настройте IPMI для удалённого управления. Обновите BMC и BIOS до последней версии.
- Установите операционную систему с поддержкой ROCm (Ubuntu 22.04 LTS, RHEL 9).
- Настройте сетевое взаимодействие между узлами (InfiniBand или RoCEv2 для мульти-нодных конфигураций).
- Запустите тестовую модель (например, Llama 3 8B) и измерьте время обучения по сравнению с предыдущей инфраструктурой.
Часто задаваемые вопросы
Можно ли использовать Supermicro AS-A126GS-TNMR для обучения LLM?
Да, сервер оптимизирован именно для таких задач. Память HBM3E объёмом 288 Гбайт на ускоритель позволяет загружать даже крупные модели (до 70B параметров) без постоянной подгрузки с диска. Интеграция с ROCm и поддержка FP8 обеспечивают высокую скорость обучения.
Требуется ли специальное ПО для работы с AMD Instinct MI355X?
Да, рекомендуется использовать стек ROCm (Radeon Open Compute). Большинство современных фреймворков (PyTorch, TensorFlow) уже поддерживают ROCm. Однако CUDA-код придётся портировать — прямая совместимость отсутствует.
Где в России можно купить этот сервер?
Supermicro работает через дистрибьюторов. В России сборку и поставку серверов на базе AS-A126GS-TNMR осуществляют компании вроде Server360.ru, которые предлагают как готовые решения, так и индивидуальные конфигурации под задачи клиента.
Подходит ли сервер для задач, не связанных с ИИ?
Абсолютно. Благодаря 384 ядрам CPU, 6 Тбайт RAM и высокой пропускной способности PCIe 5.0, сервер отлично подходит для расчётов в CFD, биоинформатике, обработке геоданных и других HPC-нагрузок.
