Компания Macom Technology Solutions совершила прорыв в области высокоскоростной передачи данных, представив новый оптический чипсет, способный транслировать интерфейс PCIe 6.0 на расстояние до 100 метров. Это решение напрямую затрагивает ключевые ограничения современных центров обработки данных и открывает новые возможности для архитектур дезагрегированных вычислений, особенно в сегментах искусственного интеллекта (ИИ) и высокопроизводительных вычислений (HPC).
До недавнего времени использование стандарта PCIe было ограничено физическими свойствами медных трасс: даже при переходе к версии 6.0 с модуляцией PAM4 максимальная длина надежного соединения не превышала нескольких метров. Это делало невозможным гибкое размещение компонентов — GPU, CPU, памяти и хранилищ — вне единого серверного шасси. Новый чипсет от Macom ломает этот барьер, перенося PCIe в оптическую среду и кардинально меняя подход к построению масштабируемых ИТ-инфраструктур.
Как работает новый чипсет Macom?
Сердце технологии — два специализированных полупроводниковых компонента: трансимпедансный усилитель MATA-38794 и драйвер лазера VCSEL MALD-38795. Эти микросхемы работают в паре, обеспечивая двунаправленную конвертацию электрических сигналов PCIe в оптические и обратно.
Принцип работы следующий:
- На передающей стороне: драйвер MALD-38795 принимает электрические данные от контроллера PCIe и управляет излучением VCSEL-лазера, преобразуя биты в световые импульсы.
- По кабелю: данные передаются по паре многомодовых оптоволоконных жил — одна на приём, одна на передачу.
- На принимающей стороне: фотодетектор на входе TIA MATA-38794 улавливает световой сигнал, который затем усиливается и преобразуется обратно в электрический, совместимый с интерфейсом PCIe 6.0.
Чипсет поддерживает скорость передачи данных до 64 Гбит/с на линию с использованием модуляции PAM4, что соответствует требованиям PCIe 6.0. При этом общая пропускная способность может достигать сотен гигабит в секунду при использовании многолинейных конфигураций, таких как x16 или x32.
Ключевые технические характеристики
| Параметр | Значение |
|---|---|
| Стандарт интерфейса | PCIe 6.0 / CXL 3.0 |
| Максимальная длина соединения | до 100 м по многомодовому волокну |
| Скорость передачи данных | 64 Гбит/с на линию (PAM4) |
| Основные компоненты | MATA-38794 (TIA), MALD-38795 (VCSEL Driver) |
| Тип кабеля | Многомодовое оптоволокно (MMF) |
| Дополнительные каналы | Поддержка USB, Ethernet, сигналов синхронизации, сброса, пробуждения |
| Назначение | Дезагрегированные вычисления, HPC, ИИ, центры обработки данных |
Прозрачность шины: почему это важно?
Одним из главных преимуществ решения Macom является его «прозрачность» для протокола PCIe. Это означает, что операционная система и приложения видят удалённое устройство так же, как если бы оно было подключено напрямую к материнской плате через стандартный слот.
Прозрачность достигается за счёт:
- Совместимости на уровне протокола: чипсет не требует изменения драйверов или ПО, работает на уровне физического интерфейса.
- Поддержки служебных сигналов: помимо основного потока данных, чипсет передаёт дополнительные сигналы (сброс, пробуждение, тактирование) по отдельному оптоволокну. Это исключает задержки и рассинхронизацию, которые могли бы возникнуть при их маршрутизации через отдельные сети.
- Интеграции USB и Ethernet: возможность передачи этих интерфейсов позволяет организовать сервисное управление, диагностику и мониторинг удалённых узлов без необходимости в дополнительной инфраструктуре.
Такой уровень интеграции делает возможным создание систем, где GPU-ускорители находятся в отдельном шкафу на другом конце серверной комнаты, но при этом воспринимаются CPU как локальные устройства, что критически важно для производительности в задачах машинного обучения и моделирования.
Дезагрегированные вычисления: новая архитектура ЦОД
Решение от Macom напрямую адресует вызовы, стоящие перед современными центрами обработки данных. Традиционные серверы представляют собой жёстко интегрированные системы: процессор, память, накопители и ускорители физически закреплены вместе. Это приводит к неэффективному использованию ресурсов — например, когда есть свободные GPU, но не хватает памяти, или наоборот.
Дезагрегированные архитектуры решают эту проблему, разделяя ресурсы на пулы:
- Пул CPU: процессорные блоки
- Пул памяти: высокопроизводительная оперативная память
- Пул GPU: графические ускорители
- Пул хранилищ: SSD и HDD массивы
Благодаря оптическому интерконнекту от Macom эти пулы могут быть физически разделены, но логически объединены в любых комбинациях по требованию приложений. Это обеспечивает:
- Гибкое масштабирование: можно добавить только GPU или только память, не заменяя весь сервер.
- Повышенную эффективность использования: ресурсы используются на 80–90%, а не на 30–40%, как в традиционных ЦОД.
- Упрощённое обслуживание и обновление: модульная конструкция позволяет быстро заменять компоненты.
Для компаний, занимающихся серверными платформами, переход к дезагрегации становится стратегическим направлением развития.
Преимущества оптики перед медью и сетевыми протоколами
Почему именно оптика, а не, скажем, ускоренные Ethernet-сети (например, InfiniBand или RoCE)? Ответ в задержках и пропускной способности.
Сравнение технологий:
| Параметр | PCIe по меди | Ethernet (400GbE) | PCIe по оптике (Macom) |
|---|---|---|---|
| Макс. расстояние | 1–3 м | до 100 м (MMF) | до 100 м |
| Задержка | <100 нс | 1–3 мкс | <200 нс |
| Протокольная нагрузка | Нет | Высокая (TCP/IP, RDMA) | Нет (прозрачный доступ) |
| Энергопотребление на Гбит/с | Низкое | Среднее | Низкое |
| Сложность ПО | Низкая | Высокая | Низкая |
Как видно из таблицы, оптический PCIe сочетает преимущества медных соединений (низкая задержка, простота) с возможностями сетевых технологий (большая длина). Это идеальный компромисс для high-end систем.
Применение в задачах искусственного интеллекта и HPC
Обучение нейронных сетей требует огромных объёмов вычислений и быстрого доступа к данным. Современные AI-кластеры строятся на тысячах GPU, соединённых между собой. Чем меньше задержка между ускорителями, тем выше эффективность обучения.
Технология Macom позволяет:
- Создавать крупные GPU-пулы: десятки и сотни видеокарт в одном шкафу, подключённые к разным CPU-узлам через оптический интерконнект.
- Организовывать гибридные вычисления: например, использовать CPU для предобработки данных, а затем передавать их напрямую в пул GPU без маршрутизации через сеть.
- Масштабировать память: подключать большие объёмы серверной оперативной памяти к GPU, преодолевая ограничения объёма видеопамяти.
В HPC-средах, где важна точность расчётов и синхронизация процессов, поддержка сигналов синхронизации и сброса по оптике позволяет избежать рассогласования между узлами, что критично для стабильности длительных вычислений.
Интеграция с существующими серверными компонентами
Новая технология не требует отказа от проверенных решений. Наоборот, она дополняет их, повышая гибкость и производительность.
Рассмотрим, как компоненты сервера взаимодействуют с оптическим интерконнектом:
Процессоры и чипсеты
Современные серверные процессоры, такие как Intel Xeon Scalable и AMD EPYC, уже поддерживают PCIe 5.0 и готовы к переходу на 6.0. Они могут выступать в роли хост-контроллеров, подключаясь к оптическому адаптеру через внутренний PCIe-порт. Это позволяет CPU управлять удалёнными GPU или памятью так же, как и локальными.
Для выбора подходящих решений рекомендуется ознакомиться с каталогом серверных процессоров.
Оперативная память
Оптический интерконнект может использоваться для создания пулов памяти (Memory Pooling), что особенно актуально для баз данных и in-memory аналитики. Удалённая память становится доступной для CPU с минимальной задержкой, что значительно расширяет возможности обработки больших объёмов данных.
Подробнее о типах и характеристиках памяти — в разделе оперативной памяти для серверов.
Хранение данных
Жёсткие диски и SSD могут быть объединены в единый пул хранения, доступный для всех вычислительных узлов. Оптический PCIe обеспечивает скорость, сравнимую с локальным NVMe, что делает возможным использование удалённых накопителей в high-IOPS приложениях.
Ассортимент внутренних жёстких дисков и SSD позволяет собрать хранилище любой ёмкости и производительности.
Как внедрить технологию: пошаговая инструкция
Пошаговое руководство по внедрению оптического PCIe в ЦОД
- Оцените текущую инфраструктуру: определите узкие места в производительности, особенно в задачах ИИ и HPC.
- Выберите целевые сценарии: дезагрегация GPU, памяти или хранилищ.
- Подберите совместимые компоненты: серверы с поддержкой PCIe 6.0, оптические адаптеры на базе чипсета Macom.
- Спроектируйте топологию подключения: определите расположение пулов ресурсов и маршруты оптоволоконных кабелей.
- Разверните тестовый стенд: соберите небольшую систему для проверки производительности и стабильности.
- Интегрируйте с системой управления: настройте оркестрацию (например, через Kubernetes или специализированный ПО-стек).
- Масштабируйте решение: по результатам тестов запустите производственную эксплуатацию.
Для сборки готовых решений можно использовать услуги готовой сборки серверов, где специалисты учтут все особенности совместимости и охлаждения.
FAQ: ответы на ключевые вопросы
Что такое дезагрегированные вычисления?
Дезагрегированные вычисления — это архитектура, при которой ресурсы ЦОД (CPU, GPU, память, хранилище) разделены на независимые пулы и подключаются по требованию через высокоскоростной интерконнект, например, по оптическому PCIe.
Почему нельзя использовать обычную сеть вместо PCIe по оптике?
Сетевые протоколы (Ethernet, InfiniBand) имеют более высокую задержку и требуют дополнительной обработки данных (протокольный стек). PCIe по оптике обеспечивает прозрачный доступ с задержкой, близкой к локальному соединению, что критично для производительности.
Совместим ли чипсет Macom с PCIe 5.0?
Да, благодаря обратной совместимости, чипсет может работать с более ранними версиями PCIe, хотя его основное назначение — PCIe 6.0 и CXL 3.0.
Требуется ли специальное программное обеспечение?
Нет, решение прозрачно для ОС и приложений. Достаточно стандартных драйверов для используемых устройств (GPU, SSD и т.д.).
Где можно получить техническую поддержку по внедрению?
Специалисты компании Server360 оказывают консультации и помощь в проектировании систем на базе новых технологий. Связаться с ними можно через раздел контактов.
