Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Дата-центры ИИ выходят за пределы меди

Дата-центры ИИ упираются в пределы медных кабелей, требуя новых решений для плотных соединений GPU. Стартапы Point2 и AttoTude предлагают радио-кабели на миллиметровых и терагерцовых волнах, сочетающие преимущества меди и оптики. Эти системы обеспечивают дальность до 20 метров, низкое энергопотребление и упрощают масштабирование.

вчера
12 мин
20

Краткий обзор

  • Медные кабели сталкиваются с ограничениями на высоких скоростях передачи данных, что требует более толстых проводов и повышенного энергопотребления, усложняя плотные соединения в дата-центрах.
  • Point2 и AttoTude разрабатывают кабели на основе радио, которые обеспечивают большую дальность, меньшее энергопотребление и меньший диаметр по сравнению с медью, без высокой стоимости и сложности оптики.
  • Стартапы планируют прямую интеграцию радио-кабелей с GPU, что упростит охлаждение и повысит эффективность обучения моделей ИИ.

Масштабирование систем ИИ сводится к двум направлениям: увеличению мощности внутри узла и расширению кластера. Первое подразумевает максимальную упаковку GPU в каждый сервер, их объединение в единую супермощную систему и ускорение обработки крупных задач.

Расширение кластера в основном использует фотонные чипы и оптические волокна, способные передавать данные на сотни или тысячи метров. Увеличение мощности внутри узла, где сети в 10 раз плотнее, полагается на простые и дешевые медные кабели длиной обычно не больше метра-двух.

Однако растущие требования к скоростям передачи между GPU упираются в физические пределы меди. По мере приближения пропускной способности к терабитам в секунду кабели приходится укорачивать и утолщать, отмечает Дэвид Куо, вице-президент по маркетингу продуктов и развитию бизнеса в Point2 Technology. Это серьезная проблема в перегруженных стойках серверов, особенно с планами Nvidia увеличить максимальное число GPU в системе с 72 до 576 к 2027 году.

Так называют этот барьер — «медный обрыв».

Отрасль ищет способы продлить жизнь меди и подвести тонкие оптические волокна ближе к GPU. Но Point2 и стартап AttoTude предлагают промежуточное и принципиально новое решение. Оно сочетает низкую стоимость и надежность меди с компактностью и дальностью оптики, полностью отвечая нуждам будущих систем ИИ.

Решение — радио.

В этом году Point2 начнет производство чипов для кабеля на 1,6 Тбит/с из восьми полимерных волноводов e-Tube. Каждый волновод передает 448 Гбит/с на двух частотах — 90 ГГц и 225 ГГц. На концах подключаются модули, преобразующие электронные сигналы в модулированные радиоволны и обратно. AttoTude работает над похожей системой, но на терагерцовых частотах с гибким кабелем меньшего диаметра.

Обе технологии превосходят медь по дальности — 10–20 метров без заметных потерь, что покрывает планы Nvidia по масштабированию. В случае Point2 энергопотребление втрое ниже оптического, стоимость тоже втрое меньше, а задержка может быть в тысячу раз ниже.

Сторонники радио подчеркивают его надежность и простоту производства по сравнению с оптикой. Это позволит радио обогнать фотонику в гонке за низкоэнергетическими соединениями прямо до GPU, вытеснив медь даже с печатных плат.

Проблемы с медью

С медью все в порядке, пока скорости передачи невысоки и расстояния невелики. На высоких скоростях проводники вроде меди страдают от эффекта скин-эффекта.

Сравнение двух кабелей: прямого подключения и e-Tube. e-Tube тоньше и достигает 20 метров.
Кабель e-Tube на 1,6 Тбит/с занимает половину площади медного кабеля 32-го калибра и обеспечивает до 20-кратно большую дальность.

Эффект возникает из-за быстро меняющегося тока сигнала, создающего противодействующее магнитное поле в центре провода. Ток вытесняется к поверхности — «коже» — повышая сопротивление. На частоте 60 Гц (сетевая в многих странах) ток проникает на 8 мм. На 10 ГГц толщина кожи — всего 0,65 мкм. Для высоких частот нужны толще провода и больше мощности, что мешает плотной упаковке соединений.

Чтобы бороться с скин-эффектом и другими искажениями, появились медные кабели с электроникой на концах. Самые продвинутые — активные электрические кабели (AEC) с ретрансляторами (retimer). Чип очищает сигнал данных и тактовый сигнал от процессора, переотправляет по восьми парам проводов (lanes), плюс обратный канал. На другом конце аналогичный чип устраняет накопившиеся помехи. За счет доп. электроники и энергии AEC продлевают дальность меди.

Дон Барнетсон, старший вице-президент и глава продуктов Credo (поставщик сетевого оборудования для дата-центров), сообщает: их AEC обеспечивает 800 Гбит/с на 7 метров — нужная дальность для систем с 500–600 GPU через несколько стоек. Сначала AEC свяжут GPU с сетевыми свитчами scale-out сети. Это критично, так как единственный ненадежный участок: сбой прервет обучение ИИ.

Даже с ретрансляторами физика возьмет верх. Point2 и AttoTude считают, что это случится скоро.

Дальность терагерцового радио

AttoTude вырос из исследований фотонов сооснователя и CEO Дэйва Уэлча. Сооснователь Infinera (куплена Nokia в 2025 году), он десятилетиями работал над фотонными системами и знает их слабости: 10% энергобюджета дата-центра (по Nvidia), чувствительность к температуре, требующая микронной точности при вводе/выводе света, низкая надежность («link flap»).

Клиенты обожают волокно, но ненавидят фотонику, говорит Уэлч. Электроника надежнее оптики.

После сделки Nokia на 2,3 млрд долларов Уэлч задался вопросом: если не оптические длины волн, то какие частоты? Ответ — максимум для чистой электроники: терагерцовый диапазон 300–3000 ГГц.

«Начинайте с пассивной меди и тяните ее как можно дольше.» — Дон Барнетсон, Credo

Команда собрала систему: цифровой чип для GPU, генератор терагерцового сигнала, микшер для кодирования данных, антенна для ввода в узкий гибкий волновод.

Волновод — диэлектрик в центре для канала сигнала, обкладка снаружи. Ранний вариант — тонкая медная трубка. Вторая генерация — волокна 200 мкм, потери 0,3 дБ/м, что куда ниже типичной меди на 224 Гбит/с.

Дальность — до 20 метров, идеально для scale-up в дата-центрах, по Уэлчу.

AttoTude собрала компоненты: чип данных, генератор THz, микшер, волноводы. Интеграция в плагин впереди. Комбо дает минимум 224 Гбит/с, в апреле на конференции Optical Fiber Communications в Сан-Франциско продемонстрировали 4 метра на 970 ГГц.

Радио в дата-центрах

Point2 работает над радио для дата-центров дольше AttoTude. Основана 9 лет назад ветеранами Marvell, Nvidia и Samsung, привлекла 55 млн долларов, в том числе от Molex (производитель кабелей и коннекторов). Поддержка Molex ключева: они подтвердили производство без доработки линий, плюс партнерство с Foxconn Interconnect Technology. Это убедит гиперскейлеров.

Пучки серых кабелей свисают сзади черной стойки сервера.
Система Nvidia GB200 NVL72 на уровне стойки полагается на множество медных кабелей для связи 72 процессоров.

На концах кабеля Point2 (e-Tube) — кремниевый чип, переводящий данные в миллиметровые волны, и антенна для волновода. Волновод — пластиковый сердечник с металлической обкладкой в экране. Кабель ARC 1,6 Тбит/с из 8 e-Tube — диаметр 8,1 мм, половина объема аналогичного AEC.

Работа на СВЧ позволяет использовать стандартные кремниевые фабрики, отмечает Куо. Совместная работа Point2 и Korea Advanced Institute of Science and Technology (опубликовано в IEEE Journal of Solid-State Circuits) применила 28-нм CMOS — технологию 2010 года.

Рынок сетей масштабирования вверх

Несмотря на перспективы, Point2 и AttoTude должны преодолеть инерцию. Жидкостное охлаждение нужно для плотной упаковки GPU на пассивной меди, говорит Барнетсон. ARC на миллиметровых волнах позволят разносить GPU, снижая нужду в охлаждении, предполагает Куо.

Оба стартапа целят в версию для прямого подключения к GPU.

Nvidia и Broadcom ввели оптические трансиверы в одном пакете с процессором, разделяя электронику и оптику микрометрами. Пока для свитчей scale-out. Все стремятся дотянуть до GPU.

Радио-технологии обещают преимущество в таком пакете. Nvidia и Broadcom вложили уйму усилий в надежность и производство. Одна проблема — стыковка волокна с волноводом фотонного чипа с микронной точностью: ИК-лазер с длиной волны требует идеального совпадения с 10-мкм сердцевиной. Миллиметровые и терагерцовые волны длиннее, точность ниже. В демо Point2 стыковку делали вручную, говорит Куо.

Сначала плагины, но настоящий приз — радио-трансиверы в пакете с процессором, считает Уэлч.

Радио-кабели заменят медь в дата-центрах ИИ | AiHub