Компания SK hynix официально объявила о завершении разработки шестого поколения высокопроизводительной памяти HBM4 — одного из ключевых компонентов для архитектур искусственного интеллекта нового поколения. Это событие стало настоящим прорывом в мире полупроводников и серверных технологий, особенно на фоне растущих требований к вычислительным мощностям в ЦОДах, нейросетях и гипермасштабируемых системах. SK hynix стала первой компанией в отрасли, которой удалось довести HBM4 до стадии готовности к массовому производству, опередив конкурентов и укрепив свои позиции как лидера в сегменте памяти для ИИ.
Разработка HBM4 знаменует собой важнейший этап в эволюции high-bandwidth memory, начавшейся в 2013 году с первых образцов HBM. За прошедшие годы технологии прошли путь от HBM2 и HBM2E до HBM3 и HBM3E, каждый раз повышая пропускную способность, энергоэффективность и плотность упаковки. Теперь же с выходом HBM4 мы стоим на пороге новой эры — эры масштабного внедрения сверхпроизводительных ИИ-ускорителей, способных обрабатывать триллионы параметров за доли секунды.
Что такое HBM4 и чем она отличается от предыдущих поколений?
HBM4 (High Bandwidth Memory Generation 4) — это не просто улучшенная версия существующих решений, а фундаментальный шаг вперёд в архитектуре памяти для GPU, AI-процессоров и других ускорителей. В отличие от традиционной GDDR-памяти, которая использует широкую шину данных и потребляет много энергии, HBM основана на 3D-стекировании чипов DRAM, соединённых через TSV (Through-Silicon Vias), что позволяет достичь высокой пропускной способности при минимальном энергопотреблении и тепловыделении.
Среди главных технических инноваций HBM4:
- Удвоенная разрядность интерфейса: HBM4 оснащена 2048-битным IO-интерфейсом, что вдвое больше, чем у HBM3 (1024 бита). Это первый случай удвоения шины данных с момента появления HBM в 2015 году.
- Скорость передачи данных более 10 Гбит/с: превышает стандарт JEDEC для HBM4 (8 Гбит/с) на 25%. Такая скорость обеспечивает беспрецедентную пропускную способность на уровне до 1,6 Тбайт/с на стек.
- Двукратное увеличение пропускной способности по сравнению с HBM3E.
- Повышение энергоэффективности на 40%, что критически важно для ЦОДов, где стоимость электропитания и охлаждения составляет значительную часть эксплуатационных расходов.
Эти характеристики делают HBM4 идеальным кандидатом для использования в следующем поколении ИИ-чипов от таких лидеров, как NVIDIA, AMD и Broadcom. Ожидается, что первые продукты с HBM4 появятся уже в 2025 году, в частности — в ускорителях NVIDIA Rubin, которые станут преемниками текущих Blackwell.
Технологические прорывы в производстве HBM4
Создание HBM4 потребовало не только архитектурных изменений, но и внедрения новых производственных процессов. SK hynix активно использует свою 10-нм технологию пятого поколения, известную как 1b nm. Эта литография позволяет повысить плотность транзисторов, снизить энергопотребление и улучшить термостойкость чипов.
Особое внимание компания уделила методике сборки — Advanced Mass Reflow Molded Underfill (MR-MUF). Этот процесс включает:
- Сборку нескольких слоёв DRAM в единую 3D-структуру.
- Соединение чипов с базовым кристаллом (logic die) через микроконтакты.
- Заполнение пространства между слоями специальным формовочным материалом, который обеспечивает механическую устойчивость, защиту от внешних воздействий и улучшенный теплоотвод.
Применение Advanced MR-MUF позволяет поддерживать строгие допуски по высоте стека HBM4, что особенно важно для совместимости с корпусами ускорителей и системами охлаждения. Благодаря этой технологии достигается стабильность работы даже при экстремальных нагрузках, характерных для ИИ-тренировок и inferencing.
По данным Tom’s Hardware, наиболее вероятная конфигурация HBM4 — это 12-Hi стек объёмом 36 Гбайт. Это означает, что один модуль будет состоять из 12 вертикально уложенных чипов DRAM, каждый ёмкостью 3 Гбайт. Такая компоновка оптимальна для баланса между производительностью, тепловыделением и стоимостью производства.
Влияние HBM4 на производительность ИИ-ускорителей
SK hynix заявляет, что переход на HBM4 позволит увеличить общую производительность ИИ-ускорителей на 69% по сравнению с текущими решениями на базе HBM3E. Этот прирост достигается за счёт комбинации факторов:
- Высокая пропускная способность устраняет «узкие места» при обмене данными между ядром GPU и памятью.
- Снижение задержек благодаря улучшенной архитектуре интерфейса.
- Повышенная энергоэффективность позволяет использовать больше модулей памяти без перегрева.
Для примера: современные GPU NVIDIA H100 используют HBM3 с пропускной способностью около 3,35 Тбайт/с. Ускорители следующего поколения с HBM4 могут превысить планку в 5 Тбайт/с, что откроет путь к обучению моделей с сотнями миллиардов и даже триллионами параметров без необходимости декомпозиции задач на множество узлов.
Это особенно важно для российских ЦОДов и компаний, работающих в сфере больших данных и ИИ. Повышение локальной производительности позволяет сократить время вывода продуктов на рынок, снизить зависимость от облачных решений и повысить безопасность обработки данных.
Как HBM4 повлияет на серверные платформы и ЦОДы?
Развёртывание HBM4 напрямую затронет архитектуру серверных платформ. Высокая производительность и энергоэффективность новых модулей памяти потребуют адаптации всей инфраструктуры: от систем питания до охлаждения и управления.
Производители серверов, такие как серверные платформы, уже начинают разрабатывать решения, совместимые с HBM4. Это включает:
- Новые материнские платы с поддержкой интерфейсов CXL (Compute Express Link).
- Модули расширения для GPU-серверов с повышенной плотностью монтажа.
- Системы жидкостного охлаждения, способные отводить тепло от плотно упакованных HBM-стеков.
Для организаций, планирующих модернизацию IT-инфраструктуры, переход на HBM4 станет ключевым элементом стратегии цифровой трансформации. Особенно актуально это для секторов, где требуется обработка больших массивов данных в реальном времени: медицина, финансы, логистика, научные исследования.
Если ваша организация рассматривает внедрение ИИ-решений, рекомендуется обратить внимание на готовые серверные сборки, оптимизированные под работу с новыми ускорителями. Такие решения позволяют сократить сроки развёртывания, минимизировать риски несовместимости и получить гарантированную производительность «из коробки».
Как выбрать подходящее оборудование под HBM4?
Хотя сами модули HBM4 будут поставляться как часть GPU или AI-ускорителей, выбор остального оборудования остаётся за заказчиком. Для эффективной эксплуатации систем с HBM4 необходимо учитывать несколько ключевых компонентов.
Процессоры и чипсеты
Будущие серверы с HBM4 потребуют поддержки высокоскоростных интерфейсов. Наиболее перспективными являются решения на базе:
- AMD EPYC 9004 серии (Genoa, Bergamo) — с поддержкой PCIe 5.0 и CXL 1.1.
- Intel Xeon Scalable 6-го поколения (Sierra Forest, Granite Rapids) — с улучшенной памятной подсистемой и энергоэффективностью.
Подробнее о выборе процессоров — в разделе серверные процессоры.
Оперативная память
Параллельно с HBM4 будет развиваться и основная оперативная память. DDR5 становится стандартом де-факто, а в 2025 году ожидается массовый выход DDR5-8000. Рекомендуется выбирать модули с ECC и поддержкой RDIMM для максимальной стабильности.
Актуальные модели представлены в каталоге серверная оперативная память.
Накопители
Хотя HBM4 используется исключительно для временного хранения данных в ускорителях, быстрый доступ к данным на диске остаётся критически важным. SSD с интерфейсом NVMe U.3 и форм-фактором EDSFF обеспечивают минимальные задержки и высокую пропускную способность.
Подбор подходящих решений — в разделе внутренние жёсткие диски и SSD.
Перспективы развития HBM после HBM4
SK hynix уже работает над HBM5, которая, по прогнозам, появится в 2027–2028 годах. Ожидается, что HBM5 будет использовать:
- Гибридную упаковку с применением microbumps и copper pillars.
- Новые диэлектрические материалы для снижения паразитных ёмкостей.
- Интеграцию с логическими чипами на уровне wafer-on-wafer.
Цель — достичь пропускной способности более 2 Тбайт/с на стек и снизить энергопотребление ещё на 30%. Эти разработки станут основой для создания «AI superchips», способных выполнять функции целого дата-центра в одном корпусе.
FAQ: часто задаваемые вопросы о HBM4
Что такое HBM4 и зачем она нужна?
HBM4 — это шестое поколение памяти с высокой пропускной способностью, предназначенной для ИИ-ускорителей, GPU и высокопроизводительных вычислений. Она нужна для устранения узких мест при обмене данными между процессором и памятью, что критично для обучения нейросетей и обработки больших данных.
Когда начнётся массовое производство HBM4?
SK hynix завершила разработку HBM4 и готовится к массовому производству. Первые поставки ожидаются во второй половине 2024 — начале 2025 года. Серийные ускорители с HBM4 появятся в 2025–2026 годах.
Какие компании будут использовать HBM4?
Основными потребителями HBM4 станут NVIDIA, AMD и Broadcom. Ожидается, что память будет использоваться в ускорителях NVIDIA Rubin, GPU AMD MI300X и сетевых процессорах Broadcom.
На сколько производительнее HBM4 по сравнению с HBM3?
Пропускная способность HBM4 в два раза выше, чем у HBM3. Энергоэффективность повышена на 40%, а общая производительность ИИ-ускорителей может вырасти на 69%.
Нужно ли менять серверы для работы с HBM4?
HBM4 интегрируется в GPU и ускорители, поэтому замена всего сервера не обязательна. Однако для полного раскрытия потенциала потребуется обновление материнской платы, системы охлаждения и, возможно, блока питания. Рекомендуется использовать готовые решения от проверенных поставщиков.
Как подготовиться к переходу на HBM4: пошаговая инструкция
Пошаговое руководство по подготовке серверной инфраструктуры к HBM4
- Оцените текущую производительность своих ИИ-задач и определите «узкие места» — особенно в части обмена данными между CPU/GPU и памятью.
- Проанализируйте планы поставщиков оборудования (NVIDIA, AMD) на 2025 год и узнайте, когда ожидаются ускорители с HBM4.
- Обновите серверную платформу: выберите материнскую плату с поддержкой PCIe 5.0 и CXL, а также процессор с высокой пропускной способностью.
- Убедитесь, что система охлаждения способна работать с повышенным тепловыделением от новых GPU и памяти.
- Выберите готовую серверную сборку, оптимизированную под ИИ-нагрузки, или закажите индивидуальное решение у специалистов.
- Проведите тестирование производительности на пилотной установке перед масштабированием.
Сравнение поколений HBM: таблица характеристик
| Параметр | HBM3 | HBM3E | HBM4 |
|---|---|---|---|
| Ширина шины (бит) | 1024 | 1024 | 2048 |
| Скорость передачи (Гбит/с) | 6.4 – 8.0 | 8.4 | 10.0+ |
| Пропускная способность (Гбайт/с) | 819 | 1075 | 1600+ |
| Энергоэффективность (пДж/бит) | ~4.8 | ~4.5 | ~2.9 |
| Техпроцесс | 1z нм | 1b нм | 1b нм |
| Стек DRAM (Hi) | 8–12 | 12 | 12 (ожид.) |
| Ёмкость (Гбайт) | 24–36 | 36 | 36 (ожид.) |
Как видно из таблицы, HBM4 демонстрирует двукратный прирост пропускной способности при одновременном снижении энергопотребления. Это делает её наиболее перспективным решением для будущих ИИ-систем.
