Китай переходит на A100 и H100 из-за проблем с H20 | Server360

Китайская ИИ-индустрия переживает период глубоких структурных изменений, вызванных геополитическими ограничениями и дефицитом передовых вычислительных мощностей. После введения новых экспортных санкций США против поставок высокопроизводительных чипов в Китай, компании Поднебесной вынуждены искать альтернативы, чтобы сохранить темпы развития в области искусственного интеллекта. На фоне снятия временного запрета на поставки ослабленного ускорителя NVIDIA H20, китайские регуляторы неожиданно поставили под сомнение его безопасность, что фактически исключило этот продукт из широкого коммерческого оборота. В результате, спрос резко сместился в сторону подержанных и восстановленных ускорителей NVIDIA A100 и H100 — решений, которые ещё несколько лет назад считались устаревшими, но сегодня вновь становятся стратегически важными для китайских дата-центров.

Почему H20 провалил ожидания китайского рынка

Ускоритель NVIDIA H20 был разработан специально для китайского рынка как «облегчённая» версия H100, соответствующая экспортным ограничениям США. Компания NVIDIA вложила значительные ресурсы в его адаптацию, надеясь сохранить присутствие в одной из самых быстрорастущих ИИ-экономик мира. Однако, несмотря на формальное снятие запрета на поставки, H20 столкнулся с серьёзными препятствиями на уровне государственной регуляции.

Китайские власти, включая Национальную комиссию по развитию и реформам (NDRC) и Министерство промышленности и информационных технологий (MIIT), выразили обеспокоенность по поводу «потенциальных уязвимостей» и «зависимости от иностранной технологии». Эти заявления, хотя и не были подкреплены техническими доказательствами, создали негативный фон вокруг H20. Крупные государственные и частные ИИ-проекты начали избегать его использования, опасаясь будущих ограничений или репутационных рисков.

С точки зрения производительности, H20 действительно сильно уступает H100. В задачах, связанных с вычислениями в формате FP64, он медленнее более чем в 30 раз. В типичных рабочих нагрузках ИИ — обучении и инференсе — разница составляет от 3 до 7 раз. Это делает его экономически нецелесообразным для многих сценариев, особенно когда доступны более производительные, пусть и подержанные, альтернативы.

Рост спроса на A100 и H100: почему старое оборудование снова в тренде

В условиях дефицита новых ускорителей, китайские компании активно обращаются к вторичному рынку. Спрос на восстановленные и бывшие в употреблении GPU NVIDIA A100 и H100 резко вырос. Эти решения, хотя и морально устарели, обладают рядом преимуществ, делающих их привлекательными даже в 2025 году.

NVIDIA A100, представленный в 2020 году на архитектуре Ampere, по-прежнему остаётся мощным ускорителем. Его 80 Гбайт памяти HBM2e с пропускной способностью 2 Тбайт/с позволяют эффективно работать с крупными моделями ИИ. Хотя он уступает H100 по пиковой производительности, особенно в задачах обучения, его эффективность в инференсе остаётся высокой. А поскольку большинство коммерческих ИИ-приложений — чат-боты, рекомендательные системы, анализ текста — требуют именно инференса, A100 становится идеальным решением с точки зрения «цена/производительность».

H100, представленный в 2022 году, остаётся золотым стандартом для ИИ-вычислений. Даже в подержанном состоянии он значительно превосходит H20. Китайские дата-центры, включая Alibaba Cloud, Tencent и Baidu, активно закупают эти ускорители через косвенные каналы, включая рециркуляцию оборудования из зарубежных ЦОД. В некоторых случаях речь идёт о полной «реконфигурации» серверов, где H100 используются в недорогих, но эффективных системах для инференса.

Преимущества A100 и H100 перед H20

Сравнение ключевых характеристик ускорителей NVIDIA
Параметр	A100 (80 Гб)	H100	H20
Архитектура	Ampere	Hopper	Hopper (ограниченная)
Объём памяти	80 Гб HBM2e	80 Гб HBM3	96 Гб HBM3e
Пропускная способность памяти	2 Тбайт/с	3,35 Тбайт/с	4,0 Тбайт/с
Производительность FP16 (TFLOPS)	312	1979	296
Производительность FP64 (TFLOPS)	9,7	67	2
Энергопотребление (TDP)	400 Вт	700 Вт	700 Вт
Эффективность в инференсе	Высокая	Очень высокая	Средняя

Как видно из таблицы, H20, несмотря на увеличенный объём памяти, демонстрирует крайне низкую производительность в FP64 — ключевом параметре для научных вычислений и некоторых ИИ-задач. Это делает его малоприменимым даже в сравнении с A100, не говоря уже о H100.

Роль экосистемы CUDA в сохранении спроса на старые GPU

Одним из главных факторов, поддерживающих спрос на A100 и H100, является программная экосистема NVIDIA CUDA. Несмотря на активные усилия китайских компаний по созданию альтернатив (например, Baidu PaddlePaddle, Huawei CANN), ни одна из них не достигла уровня зрелости, совместимости и производительности CUDA. Большинство ИИ-фреймворков — PyTorch, TensorFlow, JAX — оптимизированы именно под NVIDIA GPU.

Китайские разработчики продолжают использовать CUDA-библиотеки, такие как cuDNN, TensorRT и NCCL, что делает переход на альтернативные архитектуры экономически и технически невыгодным. Даже при наличии собственных чипов, компаниям приходится тратить огромные ресуры на адаптацию ПО. В этом контексте подержанные A100 и H100 становятся «наименьшим злом» — готовым решением с мгновенной интеграцией и минимальными рисками.

Инференс как ключевой сценарий использования подержанных ускорителей

Стоит понимать, что основной фокус китайских компаний — не на обучении ИИ-моделей, а на их инференсе. Обучение требует огромных вычислительных ресурсов, централизованных в крупных дата-центрах. Инференс же — это выполнение уже обученной модели, что требует значительно меньше мощностей и может быть распределено.

Для таких задач, как генерация ответов в чат-ботах, персонализация контента, анализ изображений в реальном времени, A100 оказывается более чем достаточным. Более того, его энергопотребление (400 Вт) ниже, чем у H100 и H20 (700 Вт), что делает его привлекательным для массового развёртывания. Китайские ЦОД, не испытывающие острых проблем с энергоснабжением, готовы платить за восстановленное оборудование, даже если его надёжность ниже, чем у новых решений.

Этот тренд подтверждается практикой компаний вроде ByteDance, которая использует A100 для обслуживания миллиардов запросов к своим ИИ-сервисам. Экономическая эффективность такого подхода очевидна: стоимость одного A100 на вторичном рынке в 2–3 раза ниже, чем H20, при сопоставимой производительности в реальных рабочих нагрузках.

Риски использования подержанных и восстановленных ускорителей

Несмотря на экономическую привлекательность, использование подержанных GPU сопряжено с рядом рисков:

Надёжность — восстановленные ускорители могут иметь изношенные компоненты, особенно системы охлаждения и память.
Гарантия — большинство таких устройств продаются «как есть», без официальной поддержки от NVIDIA.
Прошивка и безопасность — возможны проблемы с обновлением драйверов и уязвимости в прошивке.
Производительность — после длительной эксплуатации в дата-центрах, GPU могут работать с пониженной частотой из-за деградации кристалла.

Тем не менее, китайские интеграторы разрабатывают собственные методы проверки и тестирования оборудования. Некоторые компании, например, используют A100 в составе готовых серверных решений, где каждый компонент проходит строгий контроль качества.

Как китайские компании модернизируют старое оборудование

Чтобы максимизировать отдачу от A100 и H100, китайские инженеры применяют ряд технических решений:

Рециркуляция серверных платформ — использование старых серверов с заменой CPU и памяти на современные решения.
Оптимизация охлаждения — установка более эффективных систем охлаждения для увеличения срока службы GPU.
Программная оптимизация — использование квантования, спарсификации и других методов для снижения нагрузки на оборудование.
Масштабирование через кластеры — объединение множества A100 в кластеры для распределённых вычислений.

Например, в серверных платформах, предназначенных для ИИ-нагрузок, активно используются комбинации из Intel Xeon или AMD EPYC, дополненные большим объёмом серверной оперативной памяти и интерфейсов PCIe 4.0/5.0 для подключения GPU.

Как организовать инференс-кластер на базе A100

Выберите серверную платформу с поддержкой 4–8 GPU (например, на базе чипсета Intel C621A или AMD SP5).
Установите современные серверные процессоры (Intel Xeon Scalable 4-го поколения или AMD EPYC 9004).
Подключите не менее 512 Гб оперативной памяти DDR5 ECC для буферизации данных.
Установите 4–8 ускорителей NVIDIA A100 (80 Гб) с NVLink для межплатной коммуникации.
Обеспечьте охлаждение: используйте жидкостное охлаждение или высокопроизводительные вентиляторы.
Настройте ПО: установите CUDA, TensorRT, Kubernetes и фреймворк (PyTorch/TensorFlow).
Оптимизируйте модель: примените квантование 8-бит и динамическое масштабирование.
Запустите кластер и настройте балансировку нагрузки.

Стратегия NVIDIA: от списания $5,5 млрд до новых разработок

NVIDIA оказалась в парадоксальном положении. Компания списала $5,5 млрд из-за нераспроданных запасов H20, когда поставки были временно запрещены. После снятия запрета она нарастила производство, но теперь сталкивается с отсутствием спроса со стороны китайских регуляторов и крупных заказчиков.

Тем не менее, ускорители NVIDIA по-прежнему доминируют в китайской ИИ-индустрии — пусть и через теневой рынок. По оценкам аналитиков, до 60% всех ИИ-вычислений в Китае выполняются на GPU NVIDIA, включая подержанные A100 и H100. Это означает, что компания остаётся ключевым катализатором технологического роста в регионе, даже несмотря на ограничения.

Сообщается, что NVIDIA уже работает над новым ускорителем на архитектуре Blackwell, специально адаптированным для китайского рынка. Ожидается, что он будет ослаблен, но сохранит ключевые преимущества: высокую пропускную способность памяти и поддержку CUDA. Это может стать новым витком в гонке за присутствие на рынке Поднебесной.

Перспективы развития: сможет ли Китай создать альтернативу NVIDIA?

Китай активно инвестирует в разработку собственных ИИ-ускорителей. Компании вроде Huawei (Ascend), Biren и Moore Threads создают конкурентоспособные чипы. Однако, основное препятствие — не в «железе», а в программной экосистеме. Без зрелой альтернативы CUDA, переход будет медленным и болезненным.

Государственные программы, такие как «ИИ+» и «Цифровой Китай», стимулируют локализацию цепочек поставок. Но даже при этом, в ближайшие 3–5 лет NVIDIA останется де-факто стандартом. Поддержка со стороны разработчиков, наличие документации, инструментов отладки и сообщества делает её платформу незаменимой.

Тем временем, рынок подержанных GPU продолжает расти. Специализированные компании по рециркуляции, тестированию и ремонту оборудования появляются по всей стране. Это создаёт новую инфраструктуру, которая позволяет Китаю обходить экспортные ограничения и сохранять темпы ИИ-инноваций.

Что это значит для российского рынка

Опыт Китая показывает, что при наличии инженерных компетенций и гибкости, можно эффективно использовать подержанное оборудование для решения современных задач. В России, где также существуют ограничения на поставки передовых чипов, этот путь может быть релевантным.

Компании, работающие в сфере ИИ, машинного обучения и HPC, могут рассмотреть возможность использования восстановленных A100 и H100. При правильной интеграции, такие решения позволяют снизить CAPEX и быстрее выводить продукты на рынок.

Наши специалисты в Server360 помогут подобрать оптимальную конфигурацию сервера, включая внутренние накопители для хранения моделей, оперативную память и процессоры, совместимые с GPU. Мы предлагаем как готовые решения, так и индивидуальную сборку под задачи заказчика.

Почему китайские компании выбирают A100 вместо H20?

A100 предлагает более высокую производительность в задачах инференса и FP64, чем искусственно ослабленный H20. При этом его стоимость на вторичном рынке значительно ниже, а экосистема CUDA обеспечивает полную совместимость с существующими ИИ-фреймворками.

Насколько надёжны подержанные ускорители A100 и H100?

Надёжность зависит от условий предыдущей эксплуатации. При покупке у проверенных поставщиков, прошедших тестирование на износ и производительность, такие GPU могут служить 3–5 лет в дата-центре. Ключевое — контроль охлаждения и питания.

Может ли Китай полностью отказаться от NVIDIA?

В краткосрочной и среднесрочной перспективе — вряд ли. Несмотря на развитие локальных решений, экосистема CUDA остаётся непревзойдённой по уровню поддержки и совместимости. Переход потребует десятилетий и огромных инвестиций.

Какие риски при использовании H20 в Китае?

Основные риски — регуляторные. Китайские власти могут в любой момент ввести дополнительные ограничения на использование H20, особенно в государственных и стратегических проектах. Это делает инвестиции в такие решения рискованными.

Что будет с NVIDIA в Китае в 2025–2026 годах?

Ожидается выпуск нового ослабленного ускорителя на архитектуре Blackwell. Он может частично восстановить позиции NVIDIA на рынке, но основной объём вычислений, вероятно, останется на подержанных A100 и H100, особенно в сегменте инференса.