Intel представила GPU Crescent Island для ИИ-инференса — характеристики, дата выхода, сравнение с NVIDIA и AMD| Server360

Корпорация Intel официально анонсировала новый графический процессор для дата-центров под кодовым названием Crescent Island. Презентация состоялась на международном мероприятии OCP Global Summit в Сан-Хосе (Калифорния, США), где компания раскрыла ключевые особенности ускорителя, специально разработанного для задач ИИ-инференса — то есть для выполнения уже обученных моделей искусственного интеллекта в реальном времени.

Архитектура Xe3P: эволюция для дата-центров

В основе GPU Crescent Island лежит новая архитектура Xe3P — усовершенствованная версия Xe3, которая ранее использовалась в мобильных и компактных настольных процессорах Intel Core Ultra 300 (кодовое имя Panther Lake). Однако в дата-центровой реализации архитектура получила значительные доработки, направленные на повышение энергоэффективности и производительности в сценариях, характерных для инференса ИИ.

Intel делает особый акцент на показателе «производительность на ватт». Это критически важный параметр для современных дата-центров, где стоимость электроэнергии и тепловыделение напрямую влияют на операционные расходы. По заявлению компании, Xe3P обеспечивает существенный прирост эффективности по сравнению с предыдущими поколениями, что делает её конкурентоспособной на фоне решений от NVIDIA и AMD в сегменте ИИ-ускорителей.

Память LPDDR5X: 160 ГБ и нестандартная компоновка

Одной из самых обсуждаемых характеристик нового ускорителя стала его память. Crescent Island оснащается 160 ГБ LPDDR5X — типом памяти, традиционно используемым в мобильных устройствах, но всё чаще появляющимся в серверных решениях благодаря высокой энергоэффективности и плотности размещения.

Как отмечают аналитики ресурса Tom’s Hardware, максимальный объём одного чипа LPDDR5X составляет 8 ГБ. Для достижения суммарного объёма в 160 ГБ требуется 20 таких чипов. При этом каждый чип подключается через два 16-битных канала, что в совокупности даёт 32-битный интерфейс на чип.

Это приводит к двум возможным сценариям компоновки:

Единый GPU с 640-битным интерфейсом памяти (20 × 32 бита), обслуживающий все 20 чипов;
Два GPU-ядра по 320 бит каждый, где каждое ядро управляет 10 чипами памяти.

Пока Intel не раскрывает, какой из вариантов реализован, но оба подхода указывают на стремление к балансу между пропускной способностью памяти и тепловыми ограничениями. Использование LPDDR5X вместо традиционной HBM (High Bandwidth Memory) также говорит о фокусе на воздушное охлаждение — о чём прямо заявила компания.

Оптимизация под воздушное охлаждение и облачные сервисы

Intel подчеркивает, что Crescent Island разработан для эксплуатации в стандартных серверных стойках с воздушным охлаждением. Это важное отличие от многих конкурентов, чьи ИИ-ускорители (например, NVIDIA H100 или AMD MI300X) часто требуют сложных систем жидкостного охлаждения или специализированных шасси.

Такой подход значительно снижает порог входа для облачных провайдеров и корпоративных дата-центров, не готовых инвестировать в инфраструктурные изменения. Это особенно актуально для рынков, где капитальные затраты на ИТ-инфраструктуру строго регулируются — в том числе и в России, где компании ищут решения, совместимые с существующими стойками и системами вентиляции.

Кроме того, GPU поддерживает широкий спектр числовых форматов данных — от FP32 и FP16 до INT8 и специализированных форматов, используемых в трансформерных архитектурах. Это делает Crescent Island универсальным решением для платформ «токен как услуга» (tokens-as-a-service), где заказчики запрашивают генерацию текста, изображений или кода через API без необходимости разворачивать собственные модели.

Сроки поставок и конкурентная среда

Intel объявила, что пробные поставки ускорителей Crescent Island начнутся во второй половине 2026 года. Массовое развертывание и коммерческая доступность ожидаются не ранее 2027 года. Такие сроки могут показаться отдалёнными, но они соответствуют циклам разработки сложных полупроводниковых решений и интеграции их в серверные платформы.

К моменту выхода Crescent Island на рынок ему предстоит конкурировать с новыми поколениями ИИ-ускорителей от NVIDIA (включая архитектуру Rubin и её варианты, такие как Rubin CPX) и AMD (продолжение линейки MI300). Однако Intel делает ставку не на «грубую» производительность, а на энергоэффективность, совместимость с воздушным охлаждением и гибкость в облачных средах.

Это особенно важно в условиях растущего внимания к углеродному следу ИТ-инфраструктур. По оценкам International Energy Agency, дата-центры уже потребляют около 1–1.5% мировой электроэнергии, и эта цифра будет расти с распространением ИИ. Решения вроде Crescent Island могут стать частью стратегии «зелёных» дата-центров.

Как это повлияет на российский рынок серверов?

Для российских компаний, особенно в условиях санкционных ограничений и локализации ИТ-инфраструктур, появление новых архитектур от Intel имеет двойственное значение. С одной стороны, это подтверждает, что Intel продолжает развивать экосистему x86 и ИИ-ускорения. С другой — доступность таких решений на российском рынке будет зависеть от глобальных логистических и регуляторных факторов.

Тем не менее, знание спецификаций и архитектурных решений Crescent Island помогает российским ИТ-специалистам планировать будущие обновления инфраструктуры. Например, при выборе серверных платформ сегодня уже можно учитывать поддержку будущих ускорителей с LPDDR5X и воздушным охлаждением.

Кроме того, многие принципы, заложенные в Crescent Island — энергоэффективность, модульность, поддержка разнообразных форматов данных — уже сейчас можно реализовать с помощью существующих решений от Intel и других вендоров, адаптированных под локальные условия.

Как собрать сервер для ИИ-инференса уже сегодня?

Хотя Crescent Island появится не раньше 2026–2027 годов, компании могут начать подготовку к переходу на новые ИИ-нагрузки уже сейчас. Для этого важно правильно подобрать компоненты сервера, ориентируясь на баланс между CPU, RAM, хранилищем и возможностью интеграции ускорителей.

Ниже — ключевые рекомендации для сборки сервера под задачи инференса:

Как собрать сервер для ИИ-инференса: пошаговая инструкция

Определите тип нагрузки: текстовые модели (LLM), генерация изображений, распознавание речи или компьютерное зрение. От этого зависит выбор CPU и объёма памяти.
Выберите серверную платформу с поддержкой современных процессоров Intel Xeon Scalable (4-го или 5-го поколения) и достаточным количеством PCIe-слотов для будущих GPU.
Установите не менее 128–256 ГБ серверной оперативной памяти DDR5 ECC. Для крупных моделей может потребоваться 512 ГБ и более.
Подберите серверные процессоры с высоким количеством ядер и поддержкой AVX-512 или AMX (Advanced Matrix Extensions) для ускорения ИИ-вычислений на CPU.
Оснастите систему быстрыми NVMe-накопителями (внутренние жёсткие диски формата U.2 или M.2) для хранения моделей и кэширования запросов.
Обеспечьте качественную систему воздушного охлаждения: мощные вентиляторы, оптимизированный воздушный поток, мониторинг температуры.
Рассмотрите возможность заказа готовой сборки у специализированного поставщика — это сократит время развёртывания и гарантирует совместимость компонентов.

Сравнение ключевых параметров ИИ-ускорителей (ожидаемое)

Параметр	Intel Crescent Island	NVIDIA Rubin CPX (ожидаемый)	AMD MI300X
Архитектура	Xe3P	Rubin	CDNA 3
Память	160 ГБ LPDDR5X	~192 ГБ HBM3e	192 ГБ HBM3
Тип охлаждения	Воздушное	Жидкостное / воздушное (ограничено)	Жидкостное / воздушное (ограничено)
Энергоэффективность	Высокая (фокус на Вт/операцию)	Средняя/высокая	Средняя
Дата выхода	2027 (массово)	2025–2026	2023–2024
Основное применение	ИИ-инференс, tokens-as-a-service	Тренировка + инференс	Тренировка + инференс

Часто задаваемые вопросы (FAQ)

Чем ИИ-инференс отличается от обучения нейросети?

Обучение (training) — это процесс, при котором нейросеть «учится» на большом наборе данных, корректируя свои внутренние параметры. Это требует огромных вычислительных ресурсов и времени. Инференс (inference) — это использование уже обученной модели для обработки новых данных: генерации текста, распознавания изображений и т.д. Инференс менее ресурсоёмок, но должен быть быстрым и энергоэффективным, особенно при массовом использовании в облаке.

Почему Intel использует LPDDR5X вместо HBM?

HBM обеспечивает очень высокую пропускную способность, но требует сложной 3D-упаковки и часто жидкостного охлаждения. LPDDR5X менее производительна по пропускной способности, но гораздо энергоэффективнее и совместима с воздушным охлаждением. Intel делает ставку на массовое развёртывание в стандартных дата-центрах, а не на пиковую производительность.

Можно ли использовать Crescent Island для обучения моделей?

Скорее всего, нет. Ускоритель оптимизирован именно под инференс. Для обучения требуются другие архитектурные решения — например, поддержка FP64, высокая пропускная способность памяти и специализированные тензорные ядра, которые есть у NVIDIA и AMD, но не заявлены для Crescent Island.

Будет ли Crescent Island доступен в России?

Это зависит от экспортного регулирования США и логистических решений Intel. Однако даже если прямые поставки будут ограничены, знание архитектуры поможет при выборе совместимых решений на базе существующих компонентов, которые уже доступны на российском рынке через партнёров и дистрибьюторов.