Компания Dell Technologies представила революционное решение для инфраструктуры искусственного интеллекта — модульные серверные стойки на базе открытых спецификаций OCP (Open Compute Project), способные обеспечивать до 480 кВт вычислительной мощности в одном шкафу. Эта разработка, анонсированная на мероприятии 2025 OCP Global Summit, знаменует собой новый этап в эволюции дата-центров, ориентированных на экстремальные ИИ-нагрузки и высокопроизводительные вычисления (HPC).
Модульность как ключ к масштабируемости ИИ-инфраструктуры
В условиях стремительного роста спроса на вычислительные ресурсы для обучения и инференса больших языковых моделей (LLM), традиционные подходы к построению дата-центров уже не справляются. Dell предлагает полностью модульную архитектуру, разработанную в соответствии со спецификациями OCP ORv3 (Open Rack Version 3). Такой подход позволяет независимо обновлять вычислительные узлы, системы хранения данных и сетевые компоненты без полной замены стойки.
Как отметил Ихаб Тарази (Ihab Tarazi), главный технический директор и старший вице-президент Dell Technologies, компания уже установила сотни тысяч GPU-ускорителей в кластерах, построенных на основе OCP ORv3. Это подтверждает зрелость технологии и её готовность к промышленному внедрению.
Модульность даёт критически важное преимущество: сокращение времени обновления инфраструктуры с нескольких лет до нескольких недель. Для организаций, стремящихся поддерживать конкурентоспособность в ИИ-гонке, это может стать решающим фактором.
Жидкостное охлаждение — основа высокой плотности мощности
Ключевым элементом новой архитектуры Dell является интегрированная система жидкостного охлаждения (СЖО). Для достижения плотности 480 кВт на стойку традиционного воздушного охлаждения недостаточно — даже при использовании горячих и холодных коридоров.
Dell внедрила ряд инноваций в области СЖО:
- Водоблоки нового поколения с улучшенной теплопередачей;
- Термоинтерфейсы, минимизирующие термическое сопротивление между чипом и охладителем;
- Блоки распределения охлаждающей жидкости (CDU), обеспечивающие стабильный поток хладагента;
- Быстроразъёмные коллекторы, упрощающие обслуживание и замену компонентов без остановки системы.
Эти решения позволяют эффективно отводить тепло от высокоплотных GPU-кластеров, таких как NVIDIA GB200, и обеспечивать стабильную работу даже при пиковых нагрузках.
Характеристики новой OCP-стойки Dell: 27 000 ядер и 144 GPU
Совместно с Национальной лабораторией имени Лоуренса в Беркли (LBNL), входящей в Министерство энергетики США (DoE), Dell разработала стойку, способную поддерживать:
- До 27 000 CPU-ядер;
- До 144 ускорителей NVIDIA GB200;
- Пиковую мощность до 480 кВт с возможностью масштабирования до 1 МВт в будущем.
Такие характеристики делают стойку идеальной платформой для обучения мультимодальных ИИ-моделей, симуляций в области вычислительной биологии, климатического моделирования и других ресурсоёмких задач.
При этом архитектура остаётся гибкой: в перспективе планируется поддержка не только NVIDIA, но и ускорителей следующего поколения от AMD, таких как Instinct MI450, а также специализированные чипы вроде Vera Rubin.
Практическое применение: от суперкомпьютеров до суверенных облаков
Разработка Dell уже выходит за рамки лабораторных прототипов. Аналогичная архитектура используется в рамках суперкомпьютерной программы Техасского университета в Остине (UT Austin), что подтверждает её пригодность для научных и исследовательских задач мирового уровня.
Кроме того, модульные OCP-стойки становятся основой для развёртывания суверенных облаков — национальных ИТ-инфраструктур, контролируемых государством или крупными корпорациями. Такие облака требуют максимальной автономности, масштабируемости и энергоэффективности, что полностью соответствует философии открытых вычислений и жидкостного охлаждения.
Как это влияет на российский рынок ИТ-инфраструктуры?
Хотя анонс сделан в США, тренды, задаваемые Dell и OCP, неизбежно распространяются и на российский рынок. Особенно в условиях импортозамещения и стремления к технологической независимости.
Российские компании и государственные структуры всё чаще обращаются к решениям на базе готовых сборок, которые можно быстро развернуть и масштабировать. Например, на сайте Server360.ru представлены предварительно собранные серверные платформы, оптимизированные под ИИ-нагрузки и совместимые с современными стандартами охлаждения.
При этом ключевыми компонентами таких систем остаются:
- Серверные процессоры от Intel и AMD с поддержкой большого числа ядер и каналов памяти;
- Оперативная память DDR5 ECC RDIMM с высокой пропускной способностью;
- Внутренние накопители NVMe и SAS для быстрого доступа к данным.
Использование модульных принципов, заложенных в OCP, позволяет российским интеграторам создавать гибкие и масштабируемые решения без привязки к конкретному вендору.
Сравнение: традиционные стойки vs OCP-модульные
| Параметр | Традиционная стойка (19″) | OCP-модульная стойка (ORv3) |
|---|---|---|
| Макс. мощность на стойку | 20–40 кВт | до 480 кВт (с масштабированием до 1 МВт) |
| Тип охлаждения | Воздушное (иногда частичное СЖО) | Полностью жидкостное (direct-to-chip) |
| Модульность | Ограниченная (замена серверов целиком) | Полная (вычисления, сеть, хранилище — независимо) |
| Время обновления инфраструктуры | 1–3 года | 2–6 недель |
| Поддержка GPU-плотности | 4–8 GPU на сервер | до 144 GPU на стойку |
| Энергоэффективность (PUE) | 1.4–1.8 | 1.05–1.15 |
Как видно из таблицы, OCP-архитектура предлагает не просто эволюционное, а революционное улучшение по всем ключевым параметрам.
Как подготовить инфраструктуру к переходу на OCP?
Переход на модульные OCP-решения требует пересмотра подходов к проектированию дата-центров. Однако начать можно уже сегодня — с оптимизации существующих компонентов.
Пошаговая подготовка к OCP-совместимой инфраструктуре
- Оцените текущую плотность мощности и тепловыделение в ваших стойках. Если вы уже используете серверы с 4+ GPU, пора задуматься о СЖО.
- Проверьте совместимость существующих серверных платформ с жидкостным охлаждением. Многие современные серверные платформы поддерживают установку водоблоков.
- Проанализируйте потребление оперативной памяти. Для ИИ-нагрузок критична не только ёмкость, но и пропускная способность — выбирайте память DDR5 с поддержкой скоростей 4800+ МГц.
- Рассмотрите возможность перехода на NVMe-накопители. Они снижают задержки при работе с большими датасетами и ускоряют этапы препроцессинга данных.
- Свяжитесь со специалистами по интеграции ИТ-инфраструктуры. На странице контактов Server360 можно получить консультацию по совместимости компонентов и проектированию СЖО.
Часто задаваемые вопросы (FAQ)
Можно ли использовать OCP-стойки в обычном дата-центре?
Нет, OCP-архитектура требует специальной инфраструктуры: усиленных полов (из-за веса), систем подачи и возврата охлаждающей жидкости, а также повышенной электрической мощности. Однако гибридные решения (частичное СЖО + воздушное охлаждение) могут быть внедрены поэтапно.
Поддерживает ли Dell российские процессоры и компоненты?
Dell фокусируется на глобальных компонентах (Intel, AMD, NVIDIA). Однако российские интеграторы могут использовать принципы OCP для сборки совместимых систем на базе доступных компонентов — например, процессоров Intel Xeon или AMD EPYC, которые поставляются на российский рынок через легальные каналы.
Сколько стоит такая стойка?
Точные цены не раскрываются, но стоимость одной OCP-стойки мощностью 480 кВт может превышать $2–3 млн. Однако TCO (общая стоимость владения) оказывается ниже за счёт энергоэффективности и упрощённого обслуживания.
Что такое OCP и почему это важно?
Open Compute Project — это инициатива, запущенная Facebook (ныне Meta) в 2011 году, направленная на создание открытых, эффективных и масштабируемых стандартов для дата-центров. Сегодня в OCP участвуют Microsoft, Intel, NVIDIA, Dell и десятки других компаний. Открытые спецификации снижают зависимость от вендоров и ускоряют инновации.
