На фоне стремительного роста сложности и масштабов искусственного интеллекта индустрия ИИ-инфраструктуры переживает очередной кризис роста. Компании вынуждены строить целые дата-центры, чтобы обучать и запускать современные большие языковые модели (LLM), но сталкиваются с всё более ощутимым узким местом — памятью. В этой ситуации стартап Majestic Labs объявил о выходе из режима скрытности и представил концепцию сервера нового поколения с 128 Тбайт оперативной памяти на борту — в десятки раз больше, чем у современных решений.
Кто стоит за Majestic Labs и почему это важно
Компания была основана бывшими инженерами и исследователями из Google и Meta — тех самых организаций, которые первыми столкнулись с масштабными проблемами масштабирования ИИ-систем. Их опыт в проектировании инфраструктуры для обучения моделей вроде PaLM и Llama сыграл ключевую роль в понимании ограничений современных архитектур. Именно поэтому Majestic Labs не просто анонсирует «ещё один сервер», а предлагает принципиально изменить подход к распределению ресурсов вычислительной системы.
Стартап уже привлёк $100 млн инвестиций, включая $71 млн в раунде Series A под руководством Bow Wave Capital. В числе ранних инвесторов — Lux Capital, SBI, Upfront, Grove Ventures, Hetz Ventures, QP Ventures, Aidenlair Global и TAL Ventures. Такая поддержка со стороны венчурных фондов, специализирующихся на deep tech и hardware, говорит о серьёзности намерений и технологической зрелости проекта.
Почему память стала «узким горлышком» в ИИ-инфраструктуре
По данным Стэнфордского университета, объёмы кластеров для обучения ИИ-моделей удваиваются каждые пять месяцев, размеры датасетов — каждые восемь, а энергопотребление растёт ежегодно. Однако, несмотря на экспоненциальный рост вычислительных мощностей GPU и TPU, объём доступной памяти на один ускоритель увеличивается значительно медленнее. В результате компании вынуждены:
- Покупать избыточное количество ИИ-карт, чтобы получить доступ к большему объёму RAM;
- Использовать сложные механизмы шардирования (разделения модели по нескольким устройствам);
- Применять оптимизации памяти, такие как квантование и offloading, что снижает производительность и точность;
- Строить громоздкие и дорогие кластеры, требующие десятков стоек, тысяч серверов и сложной сетевой инфраструктуры.
Это не только увеличивает капитальные затраты (CapEx), но и операционные расходы (OpEx): охлаждение, обслуживание, энергопотребление и управление сетями становятся всё более обременительными.
Архитектура Majestic Labs: память отделена от вычислений
Ключевая инновация Majestic Labs — архитектура с разделённой памятью и вычислениями. Вместо того чтобы привязывать объём RAM к конкретному GPU или TPU, стартап предлагает создавать «пул» памяти, доступный всем вычислительным узлам через высокоскоростную шину. Это позволяет:
- Гибко распределять вычислительные ресурсы;
- Минимизировать простои ускорителей из-за нехватки данных;
- Сократить задержки при обработке больших контекстных окон;
- Упростить архитектуру системы — меньше коммутаторов, меньше кабелей, меньше стендов.
Серверы Majestic Labs будут оснащены «чрезвычайно быстрой и энергоэффективной памятью с высокой пропускной способностью». Хотя тип памяти не раскрывается, эксперты предполагают использование сочетания HBM (High Bandwidth Memory), CXL (Compute Express Link) и специализированных решений на базе DRAM-технологий нового поколения. Это позволит достичь до 128 Тбайт RAM на один сервер — объём, сопоставимый с 10–15 современными стойками ИИ-кластера.
Преимущества новой архитектуры для бизнеса и науки
Такой прорыв открывает новые горизонты не только для гиперскейлеров, но и для компаний из других отраслей:
- Финансовые учреждения смогут запускать сложные модели для анализа рисков и алгоритмической торговли прямо в своём дата-центре, без зависимости от облачных провайдеров.
- Фармацевтические компании получат возможность обучать модели, предсказывающие взаимодействие молекул и белков, в реальном времени на одном сервере.
- Исследовательские лаборатории смогут экспериментировать с моделями с контекстом в миллионы токенов, что невозможно в традиционных системах без гигантских затрат.
- Операторы дата-центров сократят площадь, энергопотребление и TCO (Total Cost of Ownership) на единицу вычислительной мощности.
Согласно заявлению генерального директора Majestic Labs Офера Шахама: «Серверы Majestic будут обладать всеми вычислительными возможностями современных устройств на базе GPU и TPU в сочетании с 1000-кратным увеличением объёма памяти». Это не гипербола — при переходе от стандартных 128–512 Гбайт на GPU к 128 Тбайт на сервер, прирост действительно достигает трёх порядков в пересчёте на единицу инфраструктуры.
Сравнение: традиционные ИИ-кластеры vs серверы Majestic Labs
| Параметр | Традиционный кластер (2025) | Сервер Majestic Labs (ожидаемый, 2027) |
|---|---|---|
| Объём RAM на систему | ~10–12 Тбайт (10–12 стоек) | 128 Тбайт (1 сервер) |
| Количество GPU/TPU | 96–192 шт. | 8–16 шт. |
| Энергопотребление | 80–120 кВт | ~20–25 кВт |
| Занимаемая площадь | 10–12 стоек (30+ м²) | 1–2 стойки (3–6 м²) |
| Сетевая инфраструктура | До 50 коммутаторов, >1000 кабелей | Минимум, внутриблочная связь |
| Сложность управления | Высокая (кластер, оркестрация) | Низкая (единый сервер) |
Когда ждать первые серверы и кому они подойдут
Majestic Labs планирует выпустить первые коммерческие образцы в 2027 году. Это реалистичный срок: стартапу нужно завершить разработку как аппаратной, так и программной части. В частности, будет улучшен стек ПО для управления распределённой памятью, интеграции с фреймворками вроде PyTorch и TensorFlow, а также оптимизации под работу с LLM.
Целевая аудитория — это гиперскейлеры (Google, AWS, Azure), крупные дата-центры, а также корпоративные клиенты в финтехе, биотехе и оборонной промышленности. Для них снижение TCO и повышение производительности на ватт станет решающим фактором при выборе поставщика ИИ-инфраструктуры.
Как это повлияет на российский рынок серверов
Хотя Majestic Labs пока ориентирована на глобальный рынок, её прорыв окажет влияние и на Россию. Отрасль серверных решений в РФ активно развивается, и компании всё чаще ищут альтернативы импортным компонентам. На рынке уже представлены готовые сборки, оптимизированные под задачи ИИ и машинного обучения:
- Готовые серверные сборки с балансом CPU, RAM и NVMe-накопителей;
- Серверные платформы на базе Intel Xeon Scalable и AMD EPYC;
- Серверные процессоры с поддержкой DDR5 и PCIe 5.0;
- Оперативная память объёмом до 4 Тбайт на сервер;
- Внутренние жёсткие диски и SSD для хранения больших датасетов.
Российские компании могут использовать такие решения как основу для построения собственных ИИ-кластеров уже сегодня. А в перспективе — интегрировать принципы разделения памяти и вычислений, заложенные в архитектуре Majestic Labs, в локальные разработки.
FAQ: Вопросы и ответы о серверах Majestic Labs
Какой тип памяти использует Majestic Labs?
Компания пока не раскрывает подробностей, но, скорее всего, речь идёт о специализированной архитектуре на базе технологий CXL и HBM, возможно, с элементами оптической памяти или 3D-stacked DRAM. Ключевой акцент сделан на пропускную способность и энергоэффективность.
Поддерживает ли архитектура Majestic Labs существующие ИИ-фреймворки?
Да, стартап активно работает над интеграцией с PyTorch, TensorFlow и другими популярными платформами. Будет выпущен собственный runtime и драйверы, совместимые с CUDA и ROCm.
Почему именно 128 Тбайт RAM?
Этот объём выбран как оптимальный баланс между стоимостью, тепловыделением и практической полезностью. 128 Тбайт позволяют загрузить в память полностью любую современную LLM (включая модель с 100+ триллионами параметров в сжатом виде) и обрабатывать контекст в миллионы токенов без offloading.
Будут ли серверы Majestic Labs доступны в России?
Пока компания не анонсировала географическое расширение, но российские заказчики могут следить за обновлениями и консультироваться по альтернативным решениям через контакты Server360.ru.
Как подготовиться к следующему поколению ИИ-инфраструктуры уже сегодня
Даже если серверы Majestic Labs появятся только через два года, компаниям стоит начать готовиться уже сейчас. Вот пошаговая инструкция, как оптимизировать текущую ИИ-инфраструктуру под будущие требования:
Как модернизировать ИИ-инфраструктуру под требования 2027 года
- Проведите аудит текущих узких мест: определите, где именно происходит «задавливание» — в памяти, вычислениях или сети.
- Обновите серверные платформы до поколений, поддерживающих DDR5 и PCIe 5.0 — это обеспечит совместимость с будущими ускорителями.
- Максимально увеличьте объём оперативной памяти на сервер: используйте модули DDR5 RDIMM/LRDIMM по 128–256 Гбайт.
- Внедрите NVMe-накопители с высокой скоростью чтения/записи для быстрого загрузки датасетов и checkpoint’ов.
- Оцените возможность перехода на готовые сборки, оптимизированные под ИИ-нагрузки: готовая сборка сбалансирует CPU, RAM и хранилище.
- Свяжитесь с инженерами через контакты, чтобы получить индивидуальную консультацию по масштабированию ИИ-инфраструктуры.
