Андрей Мельников, эксперт в области серверных решений и высокопроизводительных вычислений, Server360. В ходе международной конференции «Суперкомпьютерные дни в России», прошедшей на базе Московского государственного университета имени М.В. Ломоносова, компания РСК официально представила новое поколение своей архитектуры — внешний массив JBOG (Just a Bunch Of GPUs) под названием RSC ScaleStream-C. Это решение кардинально меняет подход к построению гибких и эффективных ИИ-инфраструктур, предлагая российским организациям современную альтернативу зарубежным аналогам.
Массив предназначен для интеграции с существующими серверами через стандартный интерфейс PCIe 4.0 и позволяет централизованно размещать до десяти высокопроизводительных ускорителей GPU или TPU. Такой подход обеспечивает беспрецедентную гибкость в распределении вычислительных ресурсов и повышает общую утилизацию оборудования — ключевую метрику для ЦОД и исследовательских центров, где каждый ватт энергии должен работать на результат.
Что такое JBOG и почему это важно для ИИ и HPC?
Традиционно графические процессоры и тензорные ускорители устанавливаются непосредственно в серверные платформы. Однако такой подход имеет ограничения: количество слотов PCIe, тепловыделение, потребление энергии и, главное, жесткая привязка ускорителя к конкретному серверу. Если один сервер простаивает, его GPU не может быть использован другой задачей, даже если она запущена на соседнем узле.
JBOG (Just a Bunch Of GPUs) — это архитектура, при которой группа GPU размещается во внешнем корпусе, подключаемом к нескольким серверам через высокоскоростной интерфейс. Это позволяет:
- Динамически перераспределять ресурсы между серверами в зависимости от текущей нагрузки;
- Повышать утилизацию GPU за счет объединения пула ускорителей;
- Упрощать масштабирование — добавлять новые GPU без замены серверов;
- Централизовать охлаждение и питание, снижая TCO (общую стоимость владения).
Решение RSC ScaleStream-C реализует именно эту концепцию, адаптированную под российские реалии и требования отечественных заказчиков из сферы науки, образования, финансов и госсектора.
Технические характеристики RSC ScaleStream-C: мощь в 3U форм-факторе
Новый массив выполнен в компактном шасси высотой 3U, что позволяет разместить его в любой стандартной 19-дюймовой серверной стойке. При этом внутри сосредоточена значительная вычислительная мощность.
| Параметр | Характеристика |
|---|---|
| Форм-фактор | 3U, 19″ стойка |
| Количество ускорителей | до 10 карт PCIe x16 (до 600 Вт каждая) |
| Интерконнект между GPU | NVLink |
| Подключение к серверам | до 4 серверов по PCIe 4.0 x16 (внешние кабели) |
| Блоки питания | 4 × 2200 Вт (горячая замена, N+1) |
| Система охлаждения | гибридная (для GPU), воздушная (для TPU) |
| Управление и мониторинг | Redfish, RESTful API, GUI от РСК |
Особое внимание уделено системе охлаждения. Для работы с мощными GPU используется гибридное решение — сочетание жидкостного и воздушного охлаждения, что позволяет эффективно отводить тепло при плотной компоновке. При использовании TPU применяется оптимизированная воздушная система, обеспечивающая надежную работу при высоких нагрузках.
Производительность: до 300 ТФлопс FP64 и 960 TOPS INT8
Производительность массива зависит от установленных ускорителей. РСК демонстрирует два сценария:
- На базе NVIDIA H200: при установке десяти ускорителей суммарная производительность достигает 300 ТФлопс в двойной точности (FP64). Это делает RSC ScaleStream-C конкурентоспособным решением для научных расчетов, моделирования физических процессов и других HPC-задач, требующих высокой точности вычислений.
- На базе LinQ HPQ от «ХайТэк»: при работе с операциями целочисленной арифметики (INT8), которые доминируют в задачах инференса и обработки больших языковых моделей, производительность составляет 960 триллионов операций в секунду (TOPS). Это открывает возможности для создания отечественных ИИ-платформ, не зависящих от импортных решений.
Поддержка NVLink между ускорителями внутри массива обеспечивает высокую пропускную способность обмена данными, что критично для обучения глубоких нейросетей и параллельных вычислений. Благодаря этому массив работает как единый вычислительный узел, а не просто набор изолированных GPU.
Как работает подключение и динамическое распределение ресурсов?
Одним из главных преимуществ RSC ScaleStream-C является возможность подключения до четырёх серверов через внешние кабели PCIe 4.0 x16. Каждый сервер получает доступ к пулу GPU, управляемому через программно-определяемую среду.
Рассмотрим типичный сценарий использования:
- В ЦОДе работают четыре сервера: два заняты обучением ИИ-моделей, один выполняет HPC-расчеты, четвертый — в режиме ожидания.
- Массив RSC ScaleStream-C подключен ко всем четырем серверам и содержит 10 GPU.
- Через GUI или API администратор назначает 6 GPU первому серверу, 3 — второму, 1 — третьему.
- При завершении задачи первый сервер освобождает свои GPU, которые автоматически переходят в общий пул.
- Новая задача, запущенная на четвертом сервере, получает доступ к 5 свободным GPU.
Такой подход позволяет достичь утилизации GPU на уровне 70–80%, тогда как в традиционных серверах с внутренними GPU этот показатель часто не превышает 30–40%. Это прямо влияет на экономику ЦОД: меньше простоя, выше производительность на ватт и на рубль инвестиций.
Сферы применения RSC ScaleStream-C
Новое решение от РСК ориентировано на широкий спектр задач, где требуется высокая вычислительная плотность и гибкость. Основные направления включают:
Машинное обучение и искусственный интеллект
Обучение и инференс больших языковых моделей (LLM), компьютерное зрение, обработка естественного языка. Возможность динамического выделения GPU позволяет эффективно использовать ресурсы как для длительных задач обучения, так и для быстрых запросов инференса.
Для организаций, создающих собственные LLM на базе отечественных чипов, поддержка российских процессоров и ускорителей становится стратегическим преимуществом. Интеграция с решениями от «ХайТэк» позволяет строить полностью импортонезависимые ИИ-платформы.
Высокопроизводительные вычисления (HPC)
Научные исследования, климатическое моделирование, биоинформатика, квантовая химия, CFD-расчеты. Высокая производительность в FP64 и поддержка NVLink делают массив идеальным решением для университетов, академических институтов и промышленных лабораторий.
Специалисты, работающие с серверными платформами для HPC, могут использовать RSC ScaleStream-C как универсальное ускоряющее звено, совместимое с различными архитектурами.
Анализ больших данных и виртуализация
Обработка потоковых данных, аналитика в реальном времени, ускорение баз данных. В виртуализированных средах массив позволяет предоставлять GPU как сервис (GPU-as-a-Service), что особенно актуально для VDI и облачных платформ.
Криптография и блокчейн
Хотя майнинг криптовалют сегодня не является основной целью таких решений, архитектура RSC ScaleStream-C теоретически может применяться для задач, требующих массового параллелизма. Однако РСК делает акцент на легальных и научных применениях, соответствующих политике цифрового суверенитета.
Преимущества перед традиционными серверами с GPU
По сравнению с классическими серверами, где GPU установлены напрямую на материнскую плату, RSC ScaleStream-C предлагает ряд ключевых преимуществ:
| Критерий | Традиционный сервер с GPU | RSC ScaleStream-C (JBOG) |
|---|---|---|
| Гибкость распределения ресурсов | Жесткая привязка GPU к серверу | Динамическое распределение между серверами |
| Утилизация GPU | 30–50% | 70–85% |
| Масштабируемость | Ограничена слотами сервера | Линейное увеличение пула GPU |
| TCO (стоимость владения) | Высокая из-за простоя | Ниже за счет эффективного использования |
| Охлаждение | Требует усиленной вентиляции сервера | Централизованное, оптимизированное |
| Совместимость | Зависит от платформы сервера | Универсальный доступ через PCIe |
Эта таблица наглядно демонстрирует, почему переход к JBOG-архитектурам становится трендом среди ведущих ЦОД мира. РСК не просто следует тренду — она адаптирует его под российскую инфраструктуру и требования к информационной безопасности.
Интеграция с экосистемой РСК и сторонним оборудованием
Массив RSC ScaleStream-C не является «замкнутым решением». Он может быть интегрирован с любыми серверами, поддерживающими внешнее подключение GPU через PCIe 4.0. Однако максимальный эффект достигается при использовании в связке с другими продуктами РСК — серверами, системами хранения и ПО для управления.
Для заказчиков, предпочитающих готовые решения, компания предлагает готовые сборки серверов, оптимизированные под работу с JBOG-массивами. Такие системы проходят полную тестовую проверку, что исключает проблемы совместимости и сокращает время вывода инфраструктуры в эксплуатацию.
Управление осуществляется через единую панель на базе Redfish и RESTful API, что позволяет интегрировать массив в существующие системы мониторинга и оркестрации, такие как Kubernetes, OpenStack или VMware vSphere.
Экологичность и энергоэффективность
С ростом вычислительных мощностей возрастает и энергопотребление. RSC ScaleStream-C учитывает этот вызов: централизованное охлаждение и высокая утилизация GPU позволяют снизить PUE (коэффициент энергоэффективности ЦОД).
Гибридная система охлаждения уменьшает нагрузку на общецентровую вентиляцию, а использование горячей замены блоков питания (N+1) повышает отказоустойчивость. Все это делает решение более устойчивым и соответствующим современным стандартам «зеленых» ЦОД.
Как выбрать комплектацию под свои задачи?
При планировании внедрения RSC ScaleStream-C важно учитывать несколько факторов. Ниже — пошаговая инструкция для ИТ-руководителей и инженеров.
Как подобрать конфигурацию RSC ScaleStream-C под ваши задачи
- Определите тип рабочих нагрузок: обучение ИИ, инференс, HPC, анализ данных. Это повлияет на выбор ускорителей (GPU/TPU).
- Оцените количество серверов, которым потребуется доступ к GPU. Максимум — 4 сервера на один массив.
- Выберите тип ускорителей: NVIDIA H200 (для FP64 и универсальных задач) или LinQ HPQ (для INT8 и импортозамещения).
- Рассчитайте потребность в количестве GPU: от 4 до 10 штук. Учтите пиковые нагрузки и необходимый запас мощности.
- Убедитесь, что серверы поддерживают внешнее подключение GPU через PCIe 4.0 x16 с использованием специальных кабелей.
- Оцените требования к охлаждению: гибридное охлаждение требует подключения к системе жидкостного охлаждения ЦОД.
- Запланируйте интеграцию с системами управления: настройте доступ через Redfish и REST API для автоматизации.
Для сложных проектов рекомендуется обратиться к инженерам компании Server360, которые помогут с аудитом инфраструктуры, подбором оборудования и тестированием совместимости.
Перспективы развития и поддержка отечественных технологий
Презентация RSC ScaleStream-C — не просто анонс нового продукта, а сигнал о взрослении российской ИТ-индустрии. Решение демонстрирует способность отечественных компаний создавать сложные, конкурентоспособные системы в условиях технологической изоляции.
Особое значение имеет поддержка ускорителей LinQ HPQ от компании «ХайТэк». Это подтверждает стратегию импортозамещения на уровне не только компонентов, но и целых архитектур. В будущем можно ожидать появления версий RSC ScaleStream-C, оптимизированных под другие российские GPU и TPU, а также интеграции с отечественными файловыми системами и СХД.
Для специалистов, работающих с серверной оперативной памятью и внутренними накопителями, важно понимать, что JBOG-массивы не заменяют, а дополняют серверную инфраструктуру. Они становятся частью гибридной архитектуры, где каждый элемент выполняет свою роль: CPU — общие вычисления, RAM — оперативная обработка, SSD — быстрый доступ к данным, а GPU — ускорение специализированных задач.
FAQ: ответы на частые вопросы о RSC ScaleStream-C
Что означает JBOG и чем он отличается от JBOD?
JBOG (Just a Bunch Of GPUs) — это внешний массив графических ускорителей, аналогично тому, как JBOD (Just a Bunch Of Disks) — массив дисков. Основное отличие в том, что JBOG предоставляет вычислительные ресурсы, а не хранилище данных.
Можно ли использовать RSC ScaleStream-C с серверами других производителей?
Да, массив совместим с любыми серверами, поддерживающими внешнее подключение GPU через интерфейс PCIe 4.0 x16. Главное условие — наличие соответствующего порта и поддержка в BIOS/UEFI.
Какова задержка при передаче данных между сервером и массивом?
Задержка определяется протоколом PCIe 4.0. При использовании качественных кабелей длина которых не превышает 3 метра, задержка минимальна и не оказывает существенного влияния на производительность большинства приложений.
Поддерживает ли массив отказоустойчивость и горячую замену?
Да, блоки питания и вентиляторы поддерживают горячую замену. Архитектура N+1 обеспечивает отказоустойчивость. Ускорители также можно заменять без полного отключения массива, при условии корректной остановки задач.
Какие операционные системы поддерживаются?
RSC ScaleStream-C работает с любыми ОС, поддерживающими драйверы выбранных GPU (например, NVIDIA CUDA или драйверы LinQ HPQ). Поддерживаются Linux (включая российские дистрибутивы), Windows Server и гипервизоры.
