Полезное

Серверное охлаждение: типы систем и выбор для ЦОД

Вадим Заплетин 1 мин чтения
Серверное охлаждение: типы систем и выбор для ЦОД

Серверное оборудование выделяет до 80% потребляемой энергии в виде тепла. Процессор Intel Xeon Gold под нагрузкой нагревается до 85°C, а блоки питания мощностью 750 Вт и выше добавляют ещё 150-200 Вт тепла на каждый сервер. Без охлаждения температура в серверной достигает критических значений за 15-20 минут, после чего оборудование отключается по защите.

Эффективная система охлаждения — это не кондиционер в комнате с серверами. Это спроектированная инфраструктура, которая отводит тепло от процессоров и памяти, распределяет холодный воздух по шкафам и предотвращает появление горячих зон. От правильного выбора зависит стабильность работы оборудования, расходы на электроэнергию и срок службы компонентов.

Почему серверное охлаждение критично для ЦОД

Процессоры, память, диски работают стабильно при температуре до 35°C. Каждые 10°C сверх нормы сокращают срок службы компонентов на 50%. Перегрев вызывает троттлинг — принудительное снижение частоты процессора для охлаждения. Производительность падает на 20-40%, задачи выполняются медленнее, серверы не справляются с нагрузкой.

В ЦОД с плотностью 5-10 кВт на стойку тепловыделение достигает 40-80 кВт на помещение площадью 20-30 м². Без контроля температуры воздух нагревается до 50-60°C за несколько минут. Отказы накопителей, сбои памяти, внезапные перезагрузки — типичные последствия перегрева.

Энергоэффективность охлаждения измеряется коэффициентом PUE (Power Usage Effectiveness). Это отношение общего потребления энергии к потреблению IT-оборудования. Идеальный PUE = 1.0 означает, что вся энергия идёт на работу серверов. PUE = 2.0 означает, что половина энергии тратится на охлаждение, освещение, вспомогательные системы. Современные ЦОД достигают PUE 1.2-1.4 благодаря эффективным системам охлаждения.

Воздушное охлаждение: принципы и ограничения

Воздушное охлаждение — базовый метод для большинства ЦОД. Холодный воздух подаётся в серверную, проходит через оборудование, забирает тепло и отводится в систему кондиционирования. Вентиляторы внутри серверов прокачивают воздух через радиаторы процессоров, памяти, блоков питания.

Эффективность воздушного охлаждения зависит от разницы температур входящего и выходящего воздуха (дельта T). Оптимальная дельта T — 10-15°C. Если входящий воздух +20°C, выходящий должен быть +30-35°C. Превышение дельты означает недостаточный поток воздуха или избыточное тепловыделение.

Типы воздушного охлаждения

Периметральное охлаждение: кондиционеры размещены по периметру серверной, подают холодный воздух в помещение. Простая схема, но неэффективная. Холодный и горячий воздух смешиваются, образуются горячие зоны возле стоек, температура распределяется неравномерно. Подходит для небольших серверных комнат с 2-4 стойками и плотностью до 3 кВт на стойку.

Подпольное охлаждение: холодный воздух подаётся через фальшпол с перфорированными панелями перед стойками. Горячий воздух забирается под потолком и возвращается в кондиционеры. Схема работает при высоте фальшпола 30-60 см и правильном размещении перфорированных панелей — только перед холодными коридорами. Эффективность зависит от герметичности фальшпола и отсутствия препятствий для воздушного потока.

Рядное охлаждение: кондиционеры встроены в ряд серверных стоек. Холодный воздух подаётся непосредственно перед серверами, расстояние до оборудования минимально. Рядное охлаждение справляется с плотностью до 15-20 кВт на стойку, поддерживает стабильную температуру, сокращает длину воздушных путей. Требует больше оборудования, но обеспечивает высокую эффективность.

Холодный и горячий коридор

Разделение на холодный и горячий коридор — стандарт организации охлаждения ЦОД. Стойки устанавливаются так, чтобы передние панели серверов были обращены друг к другу, формируя холодный коридор. Холодный воздух подаётся в этот коридор через фальшпол или рядные кондиционеры. Серверы забирают воздух, прокачивают через компоненты и выбрасывают в горячий коридор — пространство между задними панелями стоек.

Горячий коридор изолируется от холодного. Горячий воздух отводится под потолок или напрямую в систему кондиционирования, не смешиваясь с холодным. Изоляция коридоров повышает эффективность на 20-30%, снижает энергопотребление кондиционеров, устраняет горячие точки.

Для полной изоляции используют раздвижные двери или шторы на торцах коридоров, заглушки на неиспользуемые юниты в стойках, герметизацию кабельных проходов. Даже небольшая утечка холодного воздуха в горячий коридор снижает эффективность.

Ограничения воздушного охлаждения

Воздух переносит меньше тепла, чем жидкость. При плотности выше 20-25 кВт на стойку воздушное охлаждение перестаёт справляться. Скорость воздушного потока достигает предела, шум вентиляторов превышает допустимые нормы, температура процессоров растёт даже при максимальной производительности системы.

Воздушные системы требуют постоянного контроля. Забитые пылью радиаторы снижают тетеплоотвод на 30-50%. Неправильная укладка кабелей блокирует воздушные потоки. Добавление одного сервера с высоким тепловыделением нарушает баланс температуры в стойке.

Жидкостное охлаждение: когда воздуха недостаточно

Жидкостное охлаждение отводит тепло напрямую от процессоров и других компонентов через контакт с хладагентом. Вода или специальные жидкости переносят в 10-20 раз больше тепла, чем воздух. Это позволяет охлаждать серверы с плотностью 30-50 кВт на стойку и выше.

Типы жидкостного охлаждения

Прямое жидкостное охлаждение (Direct-to-Chip): холодные пластины крепятся непосредственно на процессоры. Жидкость циркулирует через пластины, забирает тепло и отводится к теплообменнику. Эффективность — до 90% тепла отводится жидкостью. Система работает бесшумно, не требует мощных вентиляторов. Подходит для высокопроизводительных серверных платформ с процессорами TDP 200-300 Вт.

Иммерсионное охлаждение: серверы полностью погружаются в диэлектрическую жидкость. Жидкость не проводит электричество, напрямую контактирует со всеми компонентами, отводит тепло без вентиляторов. Иммерсионные системы поддерживают плотность до 100 кВт на стойку, работают бесшумно, защищают оборудование от пыли и влаги. Сложность — высокая стоимость, необходимость специальных баков, ограниченный выбор совместимого оборудования.

Гибридное охлаждение: комбинация жидкостного и воздушного методов. Процессоры охлаждаются жидкостью, остальные компоненты — воздухом. Баланс эффективности и стоимости. Подходит для серверов с высокопроизводительными процессорами и стандартными компонентами.

Преимущества и недостатки

Жидкостное охлаждение снижает энергопотребление системы на 20-40% по сравнению с воздушным. PUE улучшается до 1.1-1.2. Отсутствие шумных вентиляторов даёт уровень шума ниже 40 дБ — как в офисе. Высокая плотность размещения экономит пространство в ЦОД.

Недостатки — стоимость внедрения в 2-3 раза выше, чем у воздушного охлаждения. Требуется специальное оборудование, обученный персонал, регулярное обслуживание. Риск утечек жидкости, необходимость контроля качества хладагента, ограниченная совместимость с существующей инфраструктурой.

Охлаждение серверного шкафа: расчёт мощности

Мощность системы охлаждения рассчитывается на основе тепловыделения оборудования в стойке. Каждый компонент выделяет тепло, указанное в спецификациях: процессоры — TDP, блоки питания — до 10% от номинальной мощности, накопители — 5-10 Вт на диск.

Пример расчёта для стандартной стойки

Стойка 42U, содержит:

  • 4 сервера 1U, каждый с двумя процессорами TDP 150 Вт
  • 2 сервера 2U, каждый с двумя процессорами TDP 200 Вт
  • Коммутатор 1U — 50 Вт
  • PDU (блок распределения питания) — 30 Вт

Расчёт тепловыделения:

  • 4 × (2 × 150 Вт) = 1200 Вт (серверы 1U)
  • 2 × (2 × 200 Вт) = 800 Вт (серверы 2U)
  • Блоки питания (10% от общей мощности серверов): (1200 + 800) × 0.1 = 200 Вт
  • Накопители (16 дисков × 8 Вт): 128 Вт
  • Коммутатор: 50 Вт
  • PDU: 30 Вт

Итого: 1200 + 800 + 200 + 128 + 50 + 30 = 2408 Вт ≈ 2.4 кВт

Рекомендуется добавить запас 20-30% на пиковые нагрузки и будущее расширение. Требуемая мощность охлаждения: 2.4 кВт × 1.3 = 3.1 кВт.

Выбор системы охлаждения по плотности

Плотность на стойку Метод охлаждения Особенности
До 5 кВт Периметральное воздушное Простая схема, минимальные затраты
5-10 кВт Подпольное с холодным коридором Фальшпол, изоляция коридоров
10-20 кВт Рядное воздушное Кондиционеры в рядах стоек
20-50 кВт Жидкостное Direct-to-Chip Холодные пластины на процессоры
Выше 50 кВт Иммерсионное охлаждение Погружение в диэлектрическую жидкость

Типовые ошибки при проектировании охлаждения

Недостаточный воздушный поток

Перфорированные панели закрывают 30-40% площади холодного коридора вместо 60-80%. Воздуха не хватает, серверы забирают горячий воздух из соседних зон. Температура процессоров растёт, вентиляторы ускоряются, шум увеличивается, эффективность падает.

Решение: установить перфорированные панели по всей длине холодного коридора, проверить давление под фальшполом (должно быть 50-100 Па), убрать препятствия для воздуха.

Отсутствие изоляции коридоров

Холодный и горячий воздух смешиваются, температура в холодном коридоре поднимается на 5-10°C. Кондиционеры работают на полную мощность, но температура серверов остаётся высокой.

Решение: установить раздвижные двери на торцах коридоров, закрыть неиспользуемые юниты в стойках заглушками, загерметизировать кабельные проходы.

Неправильное размещение серверов в стойке

Серверы с высоким тепловыделением установлены в верхней части стойки, где температура на 3-5°C выше. Горячий воздух от нижних серверов поднимается, нагревает верхние. Процессоры перегреваются, срабатывает троттлинг.

Решение: размещать серверы с максимальным тепловыделением в нижней и средней части стойки, оставлять пустые юниты между серверами для лучшей циркуляции воздуха.

Игнорирование запаса мощности

Система охлаждения рассчитана на текущую нагрузку без запаса. Добавление двух-трёх серверов выводит систему за пределы мощности. Температура растёт, кондиционеры не справляются, оборудование отключается по перегреву.

Решение: закладывать запас мощности 30-50% на расширение, учитывать сезонные изменения температуры окружающей среды.

Мониторинг и контроль температуры

Эффективное охлаждение требует постоянного мониторинга. Датчики температуры размещаются в холодном и горячем коридорах, на входе и выходе стоек, внутри критичных серверов. Данные собираются системой DCIM (Data Center Infrastructure Management), анализируются в реальном времени.

Критичные параметры для контроля:

  • Температура холодного коридора: 18-22°C
  • Температура горячего коридора: 30-38°C
  • Дельта T (разница температур): 10-15°C
  • Температура процессоров: до 80°C под нагрузкой
  • Скорость вентиляторов: 50-70% от максимальной

Превышение пороговых значений — сигнал для проверки системы охлаждения. Резкий рост температуры может указывать на отказ кондиционера, блокировку воздушного потока, перегруженность стойки.

Автоматизация охлаждения

Современные системы охлаждения управляются автоматически. Датчики передают данные о температуре, контроллеры регулируют скорость вентиляторов кондиционеров, меняют подачу холодного воздуха в зависимости от нагрузки. Когда серверы простаивают, система снижает интенсивность охлаждения, экономит электроэнергию.

Интеграция с системой управления серверами позволяет перераспределять нагрузку. Если температура в одной стойке растёт, виртуальные машины мигрируют на серверы в более холодных зонах. Автоматическое управление снижает энергопотребление на 15-25%, продлевает срок службы оборудования.

Частые вопросы о серверном охлаждении

Можно ли охлаждать серверную комнату обычным кондиционером?

Обычный кондиционер подходит только для небольших серверных с 1-2 стойками и плотностью до 2-3 кВт. Бытовые кондиционеры не рассчитаны на круглосуточную работу, не обеспечивают равномерного распределения холодного воздуха, не поддерживают точный контроль температуры и влажности. Для профессиональных серверных используйте прецизионные кондиционеры с горячим резервированием.

Какая оптимальная температура для серверной?

Стандарт ASHRAE рекомендует температуру на входе серверов 18-27°C, оптимум — 20-22°C. Слишком низкая температура увеличивает расходы на охлаждение, слишком высокая снижает надёжность оборудования. Влажность — 40-60%, отклонения приводят к статическому электричеству или конденсату.

Как часто обслуживать систему охлаждения?

Фильтры кондиционеров проверяйте раз в месяц, меняйте каждые 3-6 месяцев в зависимости от запылённости. Радиаторы серверов очищайте раз в полгода. Жидкостные системы требуют проверки уровня и качества хладагента каждые 6 месяцев. Ежегодно проводите полную диагностику: проверку герметичности фальшпола, состояния заглушек, калибровку датчиков температуры.

Как выбрать систему охлаждения для вашего ЦОД

Начните с аудита текущей и планируемой нагрузки. Посчитайте тепловыделение всего оборудования, добавьте запас 30-50% на расширение. Определите плотность на стойку — это ключевой параметр для выбора метода охлаждения.

Для плотности до 10 кВт достаточно воздушного охлаждения с холодным коридором. Правильно организуйте изоляцию коридоров, установите достаточное количество перфорированных панелей, выберите прецизионные кондиционеры с запасом мощности. Дополнительно обратите внимание на системы охлаждения для серверов — процессорные кулеры и вентиляторы для стоек.

Для плотности 10-20 кВт рассмотрите рядное охлаждение. Кондиционеры встраиваются в ряды стоек, подают холодный воздух непосредственно к серверам. Схема дороже, но эффективнее и надёжнее.

Для плотности выше 20 кВт переходите на жидкостное охлаждение. Direct-to-Chip подходит для серверов с мощными процессорами, иммерсионное — для максимальной плотности и минимального энергопотребления. Учитывайте стоимость внедрения, потребность в обученном персонале, совместимость с существующей инфраструктурой.

Не забывайте про мониторинг. Установите датчики температуры, внедрите систему DCIM для контроля в реальном времени, настройте оповещения о превышении пороговых значений. Регулярное обслуживание и своевременная замена компонентов продлят срок службы системы охлаждения и защитят серверы от перегрева.

Правильно спроектированная система охлаждения окупается за 2-3 года за счёт снижения энергопотребления, сокращения отказов оборудования, увеличения плотности размещения. Вложения в качественное охлаждение — это инвестиция в стабильность вашего ЦОД.