SK hynix завершила разработку HBM4 для ИИ: что изменится в серверных платформах | Server360

Компания SK hynix официально объявила о завершении разработки шестого поколения высокопроизводительной памяти HBM4 — одного из ключевых компонентов для архитектур искусственного интеллекта нового поколения. Это событие стало настоящим прорывом в мире полупроводников и серверных технологий, особенно на фоне растущих требований к вычислительным мощностям в ЦОДах, нейросетях и гипермасштабируемых системах. SK hynix стала первой компанией в отрасли, которой удалось довести HBM4 до стадии готовности к массовому производству, опередив конкурентов и укрепив свои позиции как лидера в сегменте памяти для ИИ.

Разработка HBM4 знаменует собой важнейший этап в эволюции high-bandwidth memory, начавшейся в 2013 году с первых образцов HBM. За прошедшие годы технологии прошли путь от HBM2 и HBM2E до HBM3 и HBM3E, каждый раз повышая пропускную способность, энергоэффективность и плотность упаковки. Теперь же с выходом HBM4 мы стоим на пороге новой эры — эры масштабного внедрения сверхпроизводительных ИИ-ускорителей, способных обрабатывать триллионы параметров за доли секунды.

Что такое HBM4 и чем она отличается от предыдущих поколений?

HBM4 (High Bandwidth Memory Generation 4) — это не просто улучшенная версия существующих решений, а фундаментальный шаг вперёд в архитектуре памяти для GPU, AI-процессоров и других ускорителей. В отличие от традиционной GDDR-памяти, которая использует широкую шину данных и потребляет много энергии, HBM основана на 3D-стекировании чипов DRAM, соединённых через TSV (Through-Silicon Vias), что позволяет достичь высокой пропускной способности при минимальном энергопотреблении и тепловыделении.

Среди главных технических инноваций HBM4:

Удвоенная разрядность интерфейса: HBM4 оснащена 2048-битным IO-интерфейсом, что вдвое больше, чем у HBM3 (1024 бита). Это первый случай удвоения шины данных с момента появления HBM в 2015 году.
Скорость передачи данных более 10 Гбит/с: превышает стандарт JEDEC для HBM4 (8 Гбит/с) на 25%. Такая скорость обеспечивает беспрецедентную пропускную способность на уровне до 1,6 Тбайт/с на стек.
Двукратное увеличение пропускной способности по сравнению с HBM3E.
Повышение энергоэффективности на 40%, что критически важно для ЦОДов, где стоимость электропитания и охлаждения составляет значительную часть эксплуатационных расходов.

Эти характеристики делают HBM4 идеальным кандидатом для использования в следующем поколении ИИ-чипов от таких лидеров, как NVIDIA, AMD и Broadcom. Ожидается, что первые продукты с HBM4 появятся уже в 2025 году, в частности — в ускорителях NVIDIA Rubin, которые станут преемниками текущих Blackwell.

Технологические прорывы в производстве HBM4

Создание HBM4 потребовало не только архитектурных изменений, но и внедрения новых производственных процессов. SK hynix активно использует свою 10-нм технологию пятого поколения, известную как 1b nm. Эта литография позволяет повысить плотность транзисторов, снизить энергопотребление и улучшить термостойкость чипов.

Особое внимание компания уделила методике сборки — Advanced Mass Reflow Molded Underfill (MR-MUF). Этот процесс включает:

Сборку нескольких слоёв DRAM в единую 3D-структуру.
Соединение чипов с базовым кристаллом (logic die) через микроконтакты.
Заполнение пространства между слоями специальным формовочным материалом, который обеспечивает механическую устойчивость, защиту от внешних воздействий и улучшенный теплоотвод.

Применение Advanced MR-MUF позволяет поддерживать строгие допуски по высоте стека HBM4, что особенно важно для совместимости с корпусами ускорителей и системами охлаждения. Благодаря этой технологии достигается стабильность работы даже при экстремальных нагрузках, характерных для ИИ-тренировок и inferencing.

По данным Tom’s Hardware, наиболее вероятная конфигурация HBM4 — это 12-Hi стек объёмом 36 Гбайт. Это означает, что один модуль будет состоять из 12 вертикально уложенных чипов DRAM, каждый ёмкостью 3 Гбайт. Такая компоновка оптимальна для баланса между производительностью, тепловыделением и стоимостью производства.

Влияние HBM4 на производительность ИИ-ускорителей

SK hynix заявляет, что переход на HBM4 позволит увеличить общую производительность ИИ-ускорителей на 69% по сравнению с текущими решениями на базе HBM3E. Этот прирост достигается за счёт комбинации факторов:

Высокая пропускная способность устраняет «узкие места» при обмене данными между ядром GPU и памятью.
Снижение задержек благодаря улучшенной архитектуре интерфейса.
Повышенная энергоэффективность позволяет использовать больше модулей памяти без перегрева.

Для примера: современные GPU NVIDIA H100 используют HBM3 с пропускной способностью около 3,35 Тбайт/с. Ускорители следующего поколения с HBM4 могут превысить планку в 5 Тбайт/с, что откроет путь к обучению моделей с сотнями миллиардов и даже триллионами параметров без необходимости декомпозиции задач на множество узлов.

Это особенно важно для российских ЦОДов и компаний, работающих в сфере больших данных и ИИ. Повышение локальной производительности позволяет сократить время вывода продуктов на рынок, снизить зависимость от облачных решений и повысить безопасность обработки данных.

Как HBM4 повлияет на серверные платформы и ЦОДы?

Развёртывание HBM4 напрямую затронет архитектуру серверных платформ. Высокая производительность и энергоэффективность новых модулей памяти потребуют адаптации всей инфраструктуры: от систем питания до охлаждения и управления.

Производители серверов, такие как серверные платформы, уже начинают разрабатывать решения, совместимые с HBM4. Это включает:

Новые материнские платы с поддержкой интерфейсов CXL (Compute Express Link).
Модули расширения для GPU-серверов с повышенной плотностью монтажа.
Системы жидкостного охлаждения, способные отводить тепло от плотно упакованных HBM-стеков.

Для организаций, планирующих модернизацию IT-инфраструктуры, переход на HBM4 станет ключевым элементом стратегии цифровой трансформации. Особенно актуально это для секторов, где требуется обработка больших массивов данных в реальном времени: медицина, финансы, логистика, научные исследования.

Если ваша организация рассматривает внедрение ИИ-решений, рекомендуется обратить внимание на готовые серверные сборки, оптимизированные под работу с новыми ускорителями. Такие решения позволяют сократить сроки развёртывания, минимизировать риски несовместимости и получить гарантированную производительность «из коробки».

Как выбрать подходящее оборудование под HBM4?

Хотя сами модули HBM4 будут поставляться как часть GPU или AI-ускорителей, выбор остального оборудования остаётся за заказчиком. Для эффективной эксплуатации систем с HBM4 необходимо учитывать несколько ключевых компонентов.

Процессоры и чипсеты

Будущие серверы с HBM4 потребуют поддержки высокоскоростных интерфейсов. Наиболее перспективными являются решения на базе:

AMD EPYC 9004 серии (Genoa, Bergamo) — с поддержкой PCIe 5.0 и CXL 1.1.
Intel Xeon Scalable 6-го поколения (Sierra Forest, Granite Rapids) — с улучшенной памятной подсистемой и энергоэффективностью.

Подробнее о выборе процессоров — в разделе серверные процессоры.

Оперативная память

Параллельно с HBM4 будет развиваться и основная оперативная память. DDR5 становится стандартом де-факто, а в 2025 году ожидается массовый выход DDR5-8000. Рекомендуется выбирать модули с ECC и поддержкой RDIMM для максимальной стабильности.

Актуальные модели представлены в каталоге серверная оперативная память.

Накопители

Хотя HBM4 используется исключительно для временного хранения данных в ускорителях, быстрый доступ к данным на диске остаётся критически важным. SSD с интерфейсом NVMe U.3 и форм-фактором EDSFF обеспечивают минимальные задержки и высокую пропускную способность.

Подбор подходящих решений — в разделе внутренние жёсткие диски и SSD.

Перспективы развития HBM после HBM4

SK hynix уже работает над HBM5, которая, по прогнозам, появится в 2027–2028 годах. Ожидается, что HBM5 будет использовать:

Гибридную упаковку с применением microbumps и copper pillars.
Новые диэлектрические материалы для снижения паразитных ёмкостей.
Интеграцию с логическими чипами на уровне wafer-on-wafer.

Цель — достичь пропускной способности более 2 Тбайт/с на стек и снизить энергопотребление ещё на 30%. Эти разработки станут основой для создания «AI superchips», способных выполнять функции целого дата-центра в одном корпусе.

FAQ: часто задаваемые вопросы о HBM4

Что такое HBM4 и зачем она нужна?

HBM4 — это шестое поколение памяти с высокой пропускной способностью, предназначенной для ИИ-ускорителей, GPU и высокопроизводительных вычислений. Она нужна для устранения узких мест при обмене данными между процессором и памятью, что критично для обучения нейросетей и обработки больших данных.

Когда начнётся массовое производство HBM4?

SK hynix завершила разработку HBM4 и готовится к массовому производству. Первые поставки ожидаются во второй половине 2024 — начале 2025 года. Серийные ускорители с HBM4 появятся в 2025–2026 годах.

Какие компании будут использовать HBM4?

Основными потребителями HBM4 станут NVIDIA, AMD и Broadcom. Ожидается, что память будет использоваться в ускорителях NVIDIA Rubin, GPU AMD MI300X и сетевых процессорах Broadcom.

На сколько производительнее HBM4 по сравнению с HBM3?

Пропускная способность HBM4 в два раза выше, чем у HBM3. Энергоэффективность повышена на 40%, а общая производительность ИИ-ускорителей может вырасти на 69%.

Нужно ли менять серверы для работы с HBM4?

HBM4 интегрируется в GPU и ускорители, поэтому замена всего сервера не обязательна. Однако для полного раскрытия потенциала потребуется обновление материнской платы, системы охлаждения и, возможно, блока питания. Рекомендуется использовать готовые решения от проверенных поставщиков.

Как подготовиться к переходу на HBM4: пошаговая инструкция

Пошаговое руководство по подготовке серверной инфраструктуры к HBM4

Оцените текущую производительность своих ИИ-задач и определите «узкие места» — особенно в части обмена данными между CPU/GPU и памятью.
Проанализируйте планы поставщиков оборудования (NVIDIA, AMD) на 2025 год и узнайте, когда ожидаются ускорители с HBM4.
Обновите серверную платформу: выберите материнскую плату с поддержкой PCIe 5.0 и CXL, а также процессор с высокой пропускной способностью.
Убедитесь, что система охлаждения способна работать с повышенным тепловыделением от новых GPU и памяти.
Выберите готовую серверную сборку, оптимизированную под ИИ-нагрузки, или закажите индивидуальное решение у специалистов.
Проведите тестирование производительности на пилотной установке перед масштабированием.

Сравнение поколений HBM: таблица характеристик

Сравнение поколений HBM по ключевым параметрам
Параметр	HBM3	HBM3E	HBM4
Ширина шины (бит)	1024	1024	2048
Скорость передачи (Гбит/с)	6.4 – 8.0	8.4	10.0+
Пропускная способность (Гбайт/с)	819	1075	1600+
Энергоэффективность (пДж/бит)	~4.8	~4.5	~2.9
Техпроцесс	1z нм	1b нм	1b нм
Стек DRAM (Hi)	8–12	12	12 (ожид.)
Ёмкость (Гбайт)	24–36	36	36 (ожид.)

Как видно из таблицы, HBM4 демонстрирует двукратный прирост пропускной способности при одновременном снижении энергопотребления. Это делает её наиболее перспективным решением для будущих ИИ-систем.