Стартап Majestic Labs представил ИИ-серверы с 128 Тбайт RAM — прорыв в архитектуре для LLM

На фоне стремительного роста сложности и масштабов искусственного интеллекта индустрия ИИ-инфраструктуры переживает очередной кризис роста. Компании вынуждены строить целые дата-центры, чтобы обучать и запускать современные большие языковые модели (LLM), но сталкиваются с всё более ощутимым узким местом — памятью. В этой ситуации стартап Majestic Labs объявил о выходе из режима скрытности и представил концепцию сервера нового поколения с 128 Тбайт оперативной памяти на борту — в десятки раз больше, чем у современных решений.

Кто стоит за Majestic Labs и почему это важно

Компания была основана бывшими инженерами и исследователями из Google и Meta — тех самых организаций, которые первыми столкнулись с масштабными проблемами масштабирования ИИ-систем. Их опыт в проектировании инфраструктуры для обучения моделей вроде PaLM и Llama сыграл ключевую роль в понимании ограничений современных архитектур. Именно поэтому Majestic Labs не просто анонсирует «ещё один сервер», а предлагает принципиально изменить подход к распределению ресурсов вычислительной системы.

Стартап уже привлёк $100 млн инвестиций, включая $71 млн в раунде Series A под руководством Bow Wave Capital. В числе ранних инвесторов — Lux Capital, SBI, Upfront, Grove Ventures, Hetz Ventures, QP Ventures, Aidenlair Global и TAL Ventures. Такая поддержка со стороны венчурных фондов, специализирующихся на deep tech и hardware, говорит о серьёзности намерений и технологической зрелости проекта.

Почему память стала «узким горлышком» в ИИ-инфраструктуре

По данным Стэнфордского университета, объёмы кластеров для обучения ИИ-моделей удваиваются каждые пять месяцев, размеры датасетов — каждые восемь, а энергопотребление растёт ежегодно. Однако, несмотря на экспоненциальный рост вычислительных мощностей GPU и TPU, объём доступной памяти на один ускоритель увеличивается значительно медленнее. В результате компании вынуждены:

Покупать избыточное количество ИИ-карт, чтобы получить доступ к большему объёму RAM;
Использовать сложные механизмы шардирования (разделения модели по нескольким устройствам);
Применять оптимизации памяти, такие как квантование и offloading, что снижает производительность и точность;
Строить громоздкие и дорогие кластеры, требующие десятков стоек, тысяч серверов и сложной сетевой инфраструктуры.

Это не только увеличивает капитальные затраты (CapEx), но и операционные расходы (OpEx): охлаждение, обслуживание, энергопотребление и управление сетями становятся всё более обременительными.

Архитектура Majestic Labs: память отделена от вычислений

Ключевая инновация Majestic Labs — архитектура с разделённой памятью и вычислениями. Вместо того чтобы привязывать объём RAM к конкретному GPU или TPU, стартап предлагает создавать «пул» памяти, доступный всем вычислительным узлам через высокоскоростную шину. Это позволяет:

Гибко распределять вычислительные ресурсы;
Минимизировать простои ускорителей из-за нехватки данных;
Сократить задержки при обработке больших контекстных окон;
Упростить архитектуру системы — меньше коммутаторов, меньше кабелей, меньше стендов.

Серверы Majestic Labs будут оснащены «чрезвычайно быстрой и энергоэффективной памятью с высокой пропускной способностью». Хотя тип памяти не раскрывается, эксперты предполагают использование сочетания HBM (High Bandwidth Memory), CXL (Compute Express Link) и специализированных решений на базе DRAM-технологий нового поколения. Это позволит достичь до 128 Тбайт RAM на один сервер — объём, сопоставимый с 10–15 современными стойками ИИ-кластера.

Преимущества новой архитектуры для бизнеса и науки

Такой прорыв открывает новые горизонты не только для гиперскейлеров, но и для компаний из других отраслей:

Финансовые учреждения смогут запускать сложные модели для анализа рисков и алгоритмической торговли прямо в своём дата-центре, без зависимости от облачных провайдеров.
Фармацевтические компании получат возможность обучать модели, предсказывающие взаимодействие молекул и белков, в реальном времени на одном сервере.
Исследовательские лаборатории смогут экспериментировать с моделями с контекстом в миллионы токенов, что невозможно в традиционных системах без гигантских затрат.
Операторы дата-центров сократят площадь, энергопотребление и TCO (Total Cost of Ownership) на единицу вычислительной мощности.

Согласно заявлению генерального директора Majestic Labs Офера Шахама: «Серверы Majestic будут обладать всеми вычислительными возможностями современных устройств на базе GPU и TPU в сочетании с 1000-кратным увеличением объёма памяти». Это не гипербола — при переходе от стандартных 128–512 Гбайт на GPU к 128 Тбайт на сервер, прирост действительно достигает трёх порядков в пересчёте на единицу инфраструктуры.

Сравнение: традиционные ИИ-кластеры vs серверы Majestic Labs

Сравнение архитектур ИИ-инфраструктуры
Параметр	Традиционный кластер (2025)	Сервер Majestic Labs (ожидаемый, 2027)
Объём RAM на систему	~10–12 Тбайт (10–12 стоек)	128 Тбайт (1 сервер)
Количество GPU/TPU	96–192 шт.	8–16 шт.
Энергопотребление	80–120 кВт	~20–25 кВт
Занимаемая площадь	10–12 стоек (30+ м²)	1–2 стойки (3–6 м²)
Сетевая инфраструктура	До 50 коммутаторов, >1000 кабелей	Минимум, внутриблочная связь
Сложность управления	Высокая (кластер, оркестрация)	Низкая (единый сервер)

Когда ждать первые серверы и кому они подойдут

Majestic Labs планирует выпустить первые коммерческие образцы в 2027 году. Это реалистичный срок: стартапу нужно завершить разработку как аппаратной, так и программной части. В частности, будет улучшен стек ПО для управления распределённой памятью, интеграции с фреймворками вроде PyTorch и TensorFlow, а также оптимизации под работу с LLM.

Целевая аудитория — это гиперскейлеры (Google, AWS, Azure), крупные дата-центры, а также корпоративные клиенты в финтехе, биотехе и оборонной промышленности. Для них снижение TCO и повышение производительности на ватт станет решающим фактором при выборе поставщика ИИ-инфраструктуры.

Как это повлияет на российский рынок серверов

Хотя Majestic Labs пока ориентирована на глобальный рынок, её прорыв окажет влияние и на Россию. Отрасль серверных решений в РФ активно развивается, и компании всё чаще ищут альтернативы импортным компонентам. На рынке уже представлены готовые сборки, оптимизированные под задачи ИИ и машинного обучения:

Готовые серверные сборки с балансом CPU, RAM и NVMe-накопителей;
Серверные платформы на базе Intel Xeon Scalable и AMD EPYC;
Серверные процессоры с поддержкой DDR5 и PCIe 5.0;
Оперативная память объёмом до 4 Тбайт на сервер;
Внутренние жёсткие диски и SSD для хранения больших датасетов.

Российские компании могут использовать такие решения как основу для построения собственных ИИ-кластеров уже сегодня. А в перспективе — интегрировать принципы разделения памяти и вычислений, заложенные в архитектуре Majestic Labs, в локальные разработки.

FAQ: Вопросы и ответы о серверах Majestic Labs

Какой тип памяти использует Majestic Labs?

Компания пока не раскрывает подробностей, но, скорее всего, речь идёт о специализированной архитектуре на базе технологий CXL и HBM, возможно, с элементами оптической памяти или 3D-stacked DRAM. Ключевой акцент сделан на пропускную способность и энергоэффективность.

Поддерживает ли архитектура Majestic Labs существующие ИИ-фреймворки?

Да, стартап активно работает над интеграцией с PyTorch, TensorFlow и другими популярными платформами. Будет выпущен собственный runtime и драйверы, совместимые с CUDA и ROCm.

Почему именно 128 Тбайт RAM?

Этот объём выбран как оптимальный баланс между стоимостью, тепловыделением и практической полезностью. 128 Тбайт позволяют загрузить в память полностью любую современную LLM (включая модель с 100+ триллионами параметров в сжатом виде) и обрабатывать контекст в миллионы токенов без offloading.

Будут ли серверы Majestic Labs доступны в России?

Пока компания не анонсировала географическое расширение, но российские заказчики могут следить за обновлениями и консультироваться по альтернативным решениям через контакты Server360.ru.

Как подготовиться к следующему поколению ИИ-инфраструктуры уже сегодня

Даже если серверы Majestic Labs появятся только через два года, компаниям стоит начать готовиться уже сейчас. Вот пошаговая инструкция, как оптимизировать текущую ИИ-инфраструктуру под будущие требования:

Как модернизировать ИИ-инфраструктуру под требования 2027 года

Проведите аудит текущих узких мест: определите, где именно происходит «задавливание» — в памяти, вычислениях или сети.
Обновите серверные платформы до поколений, поддерживающих DDR5 и PCIe 5.0 — это обеспечит совместимость с будущими ускорителями.
Максимально увеличьте объём оперативной памяти на сервер: используйте модули DDR5 RDIMM/LRDIMM по 128–256 Гбайт.
Внедрите NVMe-накопители с высокой скоростью чтения/записи для быстрого загрузки датасетов и checkpoint’ов.
Оцените возможность перехода на готовые сборки, оптимизированные под ИИ-нагрузки: готовая сборка сбалансирует CPU, RAM и хранилище.
Свяжитесь с инженерами через контакты, чтобы получить индивидуальную консультацию по масштабированию ИИ-инфраструктуры.