Что такое Edgecore AGS8600 — новая эра в вычислениях для ИИ
Компания Edgecore Networks, известная своими решениями в области телекоммуникаций и сетевой инфраструктуры, сделала важный шаг в сегмент высокопроизводительных серверов для искусственного интеллекта. На этой неделе была официально анонсирована новая модель — AGS8600, мощный 8U-сервер, построенный на передовых технологиях AMD: процессорах EPYC поколения Turin и GPU-ускорителях Instinct MI325X. Устройство уже доступно для заказа и позиционируется как универсальное решение для задач глубокого обучения, научных расчётов (HPC), анализа больших данных и разработки масштабируемых ИИ-моделей.
Сервер представляет собой законченную систему, ориентированную на максимальную производительность при работе с параллельными вычислениями. Его ключевое преимущество — полная интеграция аппаратной платформы AMD с оптимизированным программным стеком, что делает AGS8600 привлекательным выбором для исследовательских центров, университетов, ИТ-компаний и провайдеров облачных сервисов, заинтересованных в эффективной обработке ИИ-нагрузок.
Процессорная платформа: AMD EPYC 9575F Turin — сердце сервера
В основе сервера Edgecore AGS8600 лежат два 64-ядерных процессора AMD EPYC 9575F из серии Genoa Refresh, также известной под кодовым названием Turin. Это одно из самых производительных решений в линейке EPYC, специально адаптированных для HPC и ИИ-вычислений. Каждый чип имеет 64 ядра и 128 потоков, работает на частоте до 4,2 ГГц и характеризуется тепловым пакетом (TDP) в 400 Вт — что говорит о высокой энергоёмкости и необходимости эффективного охлаждения.
Архитектура Zen 4 обеспечивает значительный прирост IPC (инструкций за такт) по сравнению с предыдущими поколениями, а поддержка PCIe 5.0 и DDR5 позволяет максимально использовать пропускную способность всех компонентов системы. Процессоры оснащены большим объёмом кэш-памяти (до 512 МБ L3 на CPU), что особенно важно при работе с большими наборами данных и сложными матричными операциями.
Для специалистов, выбирающих оборудование под конкретные проекты, стоит обратить внимание на совместимость EPYC с экосистемой ПО от AMD ROCm. Это даёт возможность запускать современные фреймворки машинного обучения без необходимости переписывания кода под CUDA. Подробнее о возможностях серверных процессоров можно узнать в разделе процессоры серверные.
Память и хранение: баланс скорости и ёмкости
Сервер поддерживает до 24 модулей оперативной памяти DDR5, что позволяет установить до 6 ТБ RAM (при использовании модулей по 256 ГБ). Такой объём памяти необходим для обработки крупных датасетов в памяти, минимизации задержек при обращении к данным и эффективного выполнения многопоточных задач. Поддержка ECC гарантирует целостность данных, что критично для научных и финансовых приложений.
Во фронтальной части корпуса расположены восемь отсеков для SFF-накопителей формата U.2 NVMe. Базовая конфигурация включает:
- 6 SSD по 7,68 Тбайт — общая ёмкость 46,08 Тбайт;
- 2 SSD по 1,92 Тбайт — резервные или служебные диски.
Это обеспечивает суммарно более 48 Тбайт сверхбыстрого хранилища с интерфейсом NVMe, что идеально подходит для быстрой загрузки моделей, кэширования данных и работы с временной информацией. Все диски поддерживают горячую замену, что повышает отказоустойчивость и удобство обслуживания в продакшене.
Подробнее о типах серверных накопителей и их применении — в материале по внутренним жёстким дискам.
| Компонент | Технология | Количество | Ёмкость / Объём |
|---|---|---|---|
| Оперативная память | DDR5 | 24 слота | до 6 ТБ |
| NVMe SSD | U.2, NVMe | 8 шт. | 6×7,68 ТБ + 2×1,92 ТБ = 48 ТБ |
| GPU-память (общая) | HBM3e | 8 ускорителей | 256 ГБ |
Графические ускорители: Instinct MI325X — мощь для ИИ
Главной «изюминкой» сервера AGS8600 являются восемь GPU-ускорителей AMD Instinct MI325X. Эти устройства — одни из самых производительных в текущей линейке AMD для data center. Каждый ускоритель оснащён 32 ГБ памяти HBM3e с пропускной способностью до 5,3 ТБ/с, что в совокупности даёт 256 ГБ высокоскоростной видеопамяти — критически важный параметр для обучения крупных нейросетей.
Производительность одного MI325X достигает 2,6 Пфлопс в режиме FP8 — формате, активно используемом в современных ИИ-моделях для баланса между точностью и скоростью. Такие показатели позволяют эффективно обучать модели класса LLM (Large Language Models), генеративного ИИ и компьютерного зрения.
Для обеспечения беспрепятственной коммуникации между GPU используется архитектура Infinity Fabric. В сервере задействовано семь линий Infinity Fabric на каждый ускоритель, что гарантирует минимальные задержки и высокую пропускную способность при межпроцессорном взаимодействии. Это особенно важно при распределённом обучении, где данные активно передаются между узлами.
Программная поддержка со стороны AMD включает стек ROCm (Radeon Open Compute), который предоставляет открытые инструменты для разработки и оптимизации ИИ-приложений. Поддержка таких фреймворков, как PyTorch и TensorFlow, делает переход с других платформ более гладким.
Поддерживаемое ПО: готовая экосистема для разработчиков
Edgecore AGS8600 поставляется с предустановленной ОС на базе ядра Linux, что обеспечивает стабильность и совместимость с большинством ИИ-инструментов. Среди официально поддерживаемого программного обеспечения указаны:
- ROCm 6.2.4 — открытая платформа для GPGPU-вычислений;
- RCCL 2.20.5 — библиотека коллективных коммуникаций для многопроцессорных систем;
- PyTorch версий 2.3, 2.2, 2.1, 2.0, 1.13;
- TensorFlow 2.16.1, 2.15.1, 2.14.1;
- JAX 0.4.26 — библиотека от Google для высокопроизводительных численных вычислений;
- ONNX Runtime 1.17.3 — движок для выполнения моделей в формате ONNX.
Такая широкая поддержка ПО означает, что разработчики могут сразу начинать работу без необходимости длительной настройки окружения. Это снижает время вывода продуктов на рынок и упрощает интеграцию в существующие CI/CD-пайплайны.
Сетевые возможности: 400G Ethernet и управление
Сервер оснащён мощной сетевой подсистемой, рассчитанной на высокую нагрузку. В состав входят:
- 8 однопортовых сетевых адаптеров BCM957608-P1400GDF00 400G QSFP112-DD PCIe Ethernet NIC — обеспечивают суммарную пропускную способность до 3,2 Тбит/с;
- 2 двухпортовых адаптера BCM957608-P2200GQF00 200GbE QSFP112 PCIe Ethernet NIC — дополнительные каналы связи;
- Выделенный порт управления 1GbE — для удалённого администрирования через IPMI;
- Контроллер ASPEED AST2600 — обеспечивает функции BMC (Baseboard Management Controller) для мониторинга состояния сервера, включения/выключения, диагностики и обновления прошивок.
Такая конфигурация позволяет организовать отказоустойчивые сети хранения (SAN), кластеры распределённых вычислений и высокоскоростные соединения между серверами. Поддержка 400GbE делает AGS8600 подходящим для центров обработки данных нового поколения, где требуется минимальная задержка и максимальная плотность передачи данных.
Расширяемость и питание: надёжность в деталях
Сервер предлагает широкие возможности для модернизации и подключения дополнительных устройств. Для этого предусмотрено:
- 8 слотов PCIe 5.0 x16 для карт половинной высоты;
- 4 разъёма PCIe 5.0 x16 для карт полной высоты.
Эти слоты можно использовать для установки дополнительных GPU, FPGA, ускорителей инференса, специализированных NIC или устройств хранения. PCIe 5.0 удваивает пропускную способность по сравнению с PCIe 4.0, что особенно важно при работе с данными высокой интенсивности.
Питание сервера обеспечивается шестью блоками питания мощностью по 3300 Вт каждый, имеющими сертификат 80 Plus Titanium — самый высокий уровень энергоэффективности. Такая избыточная конфигурация (N+1 или N+N) гарантирует бесперебойную работу даже при выходе одного или нескольких БП из строя. Все блоки поддерживают горячую замену.
Система охлаждения — воздушная, с 15 вентиляторами, также допускающими горячую замену. Это обеспечивает стабильную температуру компонентов даже под полной нагрузкой. Диапазон рабочих температур составляет от +10 до +35 °C, что соответствует стандартным условиям для большинства дата-центров.
Габариты сервера: 448 × 850 × 351 мм — типичный размер для 8U-решения, требующего достаточного пространства в стойке. При этом Edgecore удалось сохранить баланс между плотностью компоновки и ремонтопригодностью.
Как выбрать и развернуть ИИ-сервер на базе AMD: пошаговое руководство
-
Оцените свои вычислительные потребности
Определите тип задач: обучение LLM, инференс, HPC, анализ видео и т.д. Рассчитайте требуемую производительность в TFLOPS, объём памяти GPU и RAM, а также ёмкость хранилища. Для ИИ-обучения важна не только пиковая производительность, но и энергоэффективность и стоимость владения (TCO).
-
Выберите подходящую конфигурацию
Рассмотрите готовые решения, такие как готовые серверные сборки, или соберите систему самостоятельно. Убедитесь в совместимости компонентов: процессор, материнская плата, охлаждение, БП. Для ИИ-задач предпочтительны решения с несколькими GPU и поддержкой NVLink или Infinity Fabric.
-
Настройте программное окружение
Установите ОС (например, Ubuntu LTS или RHEL), драйверы GPU (AMD ROCm), библиотеки (cuDNN аналог — MIOpen) и фреймворки (PyTorch, TensorFlow). Протестируйте производительность с помощью бенчмарков, таких как MLPerf.
-
Интегрируйте в инфраструктуру
Подключите сервер к сети 100/400GbE, настройте кластеризацию (если нужно), добавьте в систему мониторинга. Убедитесь, что система охлаждения и электропитания соответствуют требованиям.
-
Запустите тестовые модели
Загрузите предобученные модели (например, BERT или ResNet) и выполните инференс и переобучение. Оцените время выполнения, использование памяти и энергопотребление. При необходимости оптимизируйте конфигурацию.
Где купить и получить консультацию по серверам Edgecore
Серверы Edgecore Networks, включая модель AGS8600, доступны для поставки через авторизованных партнёров и дистрибьюторов. Для получения технической документации, ценового предложения и помощи в подборе конфигурации рекомендуется обращаться напрямую к поставщикам, специализирующимся на серверном оборудовании.
Один из надёжных поставщиков серверных решений в России — компания Server360. Здесь можно найти как готовые сборки, так и комплектующие для самостоятельной сборки. Особенно полезны следующие разделы сайта:
- Серверные платформы — информация о совместимых решениях и архитектурах;
- Готовые сборки — варианты pre-configured серверов;
- Серверные процессоры — подборка CPU от AMD и Intel;
- Оперативная память — модули DDR4/DDR5 с ECC;
- Внутренние жёсткие диски — SSD и HDD для серверов.
По всем вопросам можно связаться с менеджерами компании через страницу контакты. Они помогут подобрать оборудование под ваши задачи, рассчитают TCO и организуют доставку.
FAQ: Часто задаваемые вопросы о сервере Edgecore AGS8600
Чем отличается Edgecore AGS8600 от серверов на базе NVIDIA?
Основное отличие — в экосистеме. Сервер использует GPU AMD Instinct MI325X и программную платформу ROCm, которая является открытой и бесплатной. В то время как NVIDIA полагается на закрытую CUDA. Хотя CUDA исторически доминирует в ИИ, ROCm активно развивается и поддерживает все основные фреймворки. Кроме того, решения на базе AMD часто предлагают лучшее соотношение цены и производительности.
Подходит ли AGS8600 для обучения LLM?
Да, благодаря наличию восьми GPU MI325X с 256 ГБ HBM3e и поддержке PyTorch/TensorFlow, сервер идеально подходит для обучения и тонкой настройки крупных языковых моделей. Высокая пропускная способность Infinity Fabric и PCIe 5.0 обеспечивает эффективное взаимодействие между ускорителями.
Можно ли использовать AGS8600 в обычном дата-центре?
Да, сервер спроектирован для стандартных условий ЦОД: 8U-формфактор, воздушное охлаждение, диапазон температур +10…+35 °C. Однако из-за высокого энергопотребления (до 19,8 кВт при полной нагрузке) необходимо обеспечить достаточную мощность и охлаждение в стойке.
Какова стоимость владения (TCO) такого сервера?
Благодаря сертификату 80 Plus Titanium блоки питания работают с КПД до 96%, что снижает расходы на электроэнергию. Открытая платформа ROCm не требует лицензионных отчислений. В долгосрочной перспективе это может сделать решение более экономичным по сравнению с конкурентами на базе NVIDIA.
Где можно получить техническую поддержку?
Техническая поддержка предоставляется как со стороны производителя Edgecore, так и со стороны дистрибьюторов и интеграторов. Рекомендуется заключать договор на сервисное обслуживание. За консультацией можно обратиться на сайт контакты Server360.
