Корпорация Intel официально анонсировала новый графический процессор для дата-центров под кодовым названием Crescent Island. Презентация состоялась на международном мероприятии OCP Global Summit в Сан-Хосе (Калифорния, США), где компания раскрыла ключевые особенности ускорителя, специально разработанного для задач ИИ-инференса — то есть для выполнения уже обученных моделей искусственного интеллекта в реальном времени.
Архитектура Xe3P: эволюция для дата-центров
В основе GPU Crescent Island лежит новая архитектура Xe3P — усовершенствованная версия Xe3, которая ранее использовалась в мобильных и компактных настольных процессорах Intel Core Ultra 300 (кодовое имя Panther Lake). Однако в дата-центровой реализации архитектура получила значительные доработки, направленные на повышение энергоэффективности и производительности в сценариях, характерных для инференса ИИ.
Intel делает особый акцент на показателе «производительность на ватт». Это критически важный параметр для современных дата-центров, где стоимость электроэнергии и тепловыделение напрямую влияют на операционные расходы. По заявлению компании, Xe3P обеспечивает существенный прирост эффективности по сравнению с предыдущими поколениями, что делает её конкурентоспособной на фоне решений от NVIDIA и AMD в сегменте ИИ-ускорителей.
Память LPDDR5X: 160 ГБ и нестандартная компоновка
Одной из самых обсуждаемых характеристик нового ускорителя стала его память. Crescent Island оснащается 160 ГБ LPDDR5X — типом памяти, традиционно используемым в мобильных устройствах, но всё чаще появляющимся в серверных решениях благодаря высокой энергоэффективности и плотности размещения.
Как отмечают аналитики ресурса Tom’s Hardware, максимальный объём одного чипа LPDDR5X составляет 8 ГБ. Для достижения суммарного объёма в 160 ГБ требуется 20 таких чипов. При этом каждый чип подключается через два 16-битных канала, что в совокупности даёт 32-битный интерфейс на чип.
Это приводит к двум возможным сценариям компоновки:
- Единый GPU с 640-битным интерфейсом памяти (20 × 32 бита), обслуживающий все 20 чипов;
- Два GPU-ядра по 320 бит каждый, где каждое ядро управляет 10 чипами памяти.
Пока Intel не раскрывает, какой из вариантов реализован, но оба подхода указывают на стремление к балансу между пропускной способностью памяти и тепловыми ограничениями. Использование LPDDR5X вместо традиционной HBM (High Bandwidth Memory) также говорит о фокусе на воздушное охлаждение — о чём прямо заявила компания.
Оптимизация под воздушное охлаждение и облачные сервисы
Intel подчеркивает, что Crescent Island разработан для эксплуатации в стандартных серверных стойках с воздушным охлаждением. Это важное отличие от многих конкурентов, чьи ИИ-ускорители (например, NVIDIA H100 или AMD MI300X) часто требуют сложных систем жидкостного охлаждения или специализированных шасси.
Такой подход значительно снижает порог входа для облачных провайдеров и корпоративных дата-центров, не готовых инвестировать в инфраструктурные изменения. Это особенно актуально для рынков, где капитальные затраты на ИТ-инфраструктуру строго регулируются — в том числе и в России, где компании ищут решения, совместимые с существующими стойками и системами вентиляции.
Кроме того, GPU поддерживает широкий спектр числовых форматов данных — от FP32 и FP16 до INT8 и специализированных форматов, используемых в трансформерных архитектурах. Это делает Crescent Island универсальным решением для платформ «токен как услуга» (tokens-as-a-service), где заказчики запрашивают генерацию текста, изображений или кода через API без необходимости разворачивать собственные модели.
Сроки поставок и конкурентная среда
Intel объявила, что пробные поставки ускорителей Crescent Island начнутся во второй половине 2026 года. Массовое развертывание и коммерческая доступность ожидаются не ранее 2027 года. Такие сроки могут показаться отдалёнными, но они соответствуют циклам разработки сложных полупроводниковых решений и интеграции их в серверные платформы.
К моменту выхода Crescent Island на рынок ему предстоит конкурировать с новыми поколениями ИИ-ускорителей от NVIDIA (включая архитектуру Rubin и её варианты, такие как Rubin CPX) и AMD (продолжение линейки MI300). Однако Intel делает ставку не на «грубую» производительность, а на энергоэффективность, совместимость с воздушным охлаждением и гибкость в облачных средах.
Это особенно важно в условиях растущего внимания к углеродному следу ИТ-инфраструктур. По оценкам International Energy Agency, дата-центры уже потребляют около 1–1.5% мировой электроэнергии, и эта цифра будет расти с распространением ИИ. Решения вроде Crescent Island могут стать частью стратегии «зелёных» дата-центров.
Как это повлияет на российский рынок серверов?
Для российских компаний, особенно в условиях санкционных ограничений и локализации ИТ-инфраструктур, появление новых архитектур от Intel имеет двойственное значение. С одной стороны, это подтверждает, что Intel продолжает развивать экосистему x86 и ИИ-ускорения. С другой — доступность таких решений на российском рынке будет зависеть от глобальных логистических и регуляторных факторов.
Тем не менее, знание спецификаций и архитектурных решений Crescent Island помогает российским ИТ-специалистам планировать будущие обновления инфраструктуры. Например, при выборе серверных платформ сегодня уже можно учитывать поддержку будущих ускорителей с LPDDR5X и воздушным охлаждением.
Кроме того, многие принципы, заложенные в Crescent Island — энергоэффективность, модульность, поддержка разнообразных форматов данных — уже сейчас можно реализовать с помощью существующих решений от Intel и других вендоров, адаптированных под локальные условия.
Как собрать сервер для ИИ-инференса уже сегодня?
Хотя Crescent Island появится не раньше 2026–2027 годов, компании могут начать подготовку к переходу на новые ИИ-нагрузки уже сейчас. Для этого важно правильно подобрать компоненты сервера, ориентируясь на баланс между CPU, RAM, хранилищем и возможностью интеграции ускорителей.
Ниже — ключевые рекомендации для сборки сервера под задачи инференса:
Как собрать сервер для ИИ-инференса: пошаговая инструкция
- Определите тип нагрузки: текстовые модели (LLM), генерация изображений, распознавание речи или компьютерное зрение. От этого зависит выбор CPU и объёма памяти.
- Выберите серверную платформу с поддержкой современных процессоров Intel Xeon Scalable (4-го или 5-го поколения) и достаточным количеством PCIe-слотов для будущих GPU.
- Установите не менее 128–256 ГБ серверной оперативной памяти DDR5 ECC. Для крупных моделей может потребоваться 512 ГБ и более.
- Подберите серверные процессоры с высоким количеством ядер и поддержкой AVX-512 или AMX (Advanced Matrix Extensions) для ускорения ИИ-вычислений на CPU.
- Оснастите систему быстрыми NVMe-накопителями (внутренние жёсткие диски формата U.2 или M.2) для хранения моделей и кэширования запросов.
- Обеспечьте качественную систему воздушного охлаждения: мощные вентиляторы, оптимизированный воздушный поток, мониторинг температуры.
- Рассмотрите возможность заказа готовой сборки у специализированного поставщика — это сократит время развёртывания и гарантирует совместимость компонентов.
Сравнение ключевых параметров ИИ-ускорителей (ожидаемое)
| Параметр | Intel Crescent Island | NVIDIA Rubin CPX (ожидаемый) | AMD MI300X |
|---|---|---|---|
| Архитектура | Xe3P | Rubin | CDNA 3 |
| Память | 160 ГБ LPDDR5X | ~192 ГБ HBM3e | 192 ГБ HBM3 |
| Тип охлаждения | Воздушное | Жидкостное / воздушное (ограничено) | Жидкостное / воздушное (ограничено) |
| Энергоэффективность | Высокая (фокус на Вт/операцию) | Средняя/высокая | Средняя |
| Дата выхода | 2027 (массово) | 2025–2026 | 2023–2024 |
| Основное применение | ИИ-инференс, tokens-as-a-service | Тренировка + инференс | Тренировка + инференс |
Часто задаваемые вопросы (FAQ)
Чем ИИ-инференс отличается от обучения нейросети?
Обучение (training) — это процесс, при котором нейросеть «учится» на большом наборе данных, корректируя свои внутренние параметры. Это требует огромных вычислительных ресурсов и времени. Инференс (inference) — это использование уже обученной модели для обработки новых данных: генерации текста, распознавания изображений и т.д. Инференс менее ресурсоёмок, но должен быть быстрым и энергоэффективным, особенно при массовом использовании в облаке.
Почему Intel использует LPDDR5X вместо HBM?
HBM обеспечивает очень высокую пропускную способность, но требует сложной 3D-упаковки и часто жидкостного охлаждения. LPDDR5X менее производительна по пропускной способности, но гораздо энергоэффективнее и совместима с воздушным охлаждением. Intel делает ставку на массовое развёртывание в стандартных дата-центрах, а не на пиковую производительность.
Можно ли использовать Crescent Island для обучения моделей?
Скорее всего, нет. Ускоритель оптимизирован именно под инференс. Для обучения требуются другие архитектурные решения — например, поддержка FP64, высокая пропускная способность памяти и специализированные тензорные ядра, которые есть у NVIDIA и AMD, но не заявлены для Crescent Island.
Будет ли Crescent Island доступен в России?
Это зависит от экспортного регулирования США и логистических решений Intel. Однако даже если прямые поставки будут ограничены, знание архитектуры поможет при выборе совместимых решений на базе существующих компонентов, которые уже доступны на российском рынке через партнёров и дистрибьюторов.
