Высокоскоростное оптическое соединение: решения для центров обработки данных
Apr 27, 2026| В прошлом квартале мы получили от клиентов обратно сорок модулей 400G DR4, заявивших о случайных изменениях каналов на своих коммутаторах Arista 7060X5. Еще до того, как мы открыли документы RMA, наш инженер-испытатель задал один вопрос: вы проверилиРазъемы МПОперед установкой? Они этого не сделали. Мы отправили модули через полную регрессию, глазковые диаграммы чистые, BER ниже 1E-13 по всем четырем дорожкам,Показания DDM номинальные. Затем мы попросили их прислать фотографии торцов магистральных кабелей-под оптоволоконным микроскопом. Каждый разъем имел загрязнение твердыми частицами. Сорок модулей, ноль дефектов. Проблема была в пыли.
Мы видим какую-то версию этого каждый месяц. Развертывание высокоскоростных оптических межсоединений любого масштаба упирается в одну и ту же стену, и цифры подтверждают это: где-то между 65% и 70% всех сбоев линий 400G и 800G связаны с загрязнением разъемов, а не с неисправностями приемопередатчиков. (Полевые данные IEEE 802.3 через AscentOptics) Мы поднимаем этот вопрос в первую очередь, потому что он определяет то, как мы думаем обо всем решении по межсетевому соединению. Модуль почти никогда не является самым слабым звеном. Физический уровень вокруг него есть.

Ваша структура трафика определяет архитектуру оптического межсоединения
Все начинают с номера детали.QSFP-DD или OSFP, SR или DR, многомодовый или одномодовый-режим. Мы тоже это делаем. Но все внедрения, которые прошли успешно для наших клиентов, начались где-то еще: как на самом деле выглядит трафик?
Крупномасштабное-обучение искусственного интеллекта обеспечивает взаимодействие всех-ко-графических процессоров, которое оказывается на удивление предсказуемым в течение времени от нескольких минут до нескольких часов. Google использует это с помощью коммутаторов оптических схем в своей сети Jupiter, переконфигурируя физические пути света между стойками вместо коммутации пакетов. Опубликованные ими результаты десятилетнего производственного использования: снижение энергопотребления на 41%, снижение капитальных затрат на 30% и увеличение времени безотказной работы в 50 раз по сравнению с предыдущей архитектурой Clos. (Google SIGCOMM'22) Эти цифры реальны, но они принадлежат компании, которая за пять лет потратила где-то от 500 до 1 миллиарда долларов на инфраструктуру OCS. Несколько клиентов среднего-бизнеса просили нас оценить возможности OCS для их сред. В каждом случае, как только они прогоняли числа в масштабе менее-500 узлов, требования к капиталу перевешивали преимущества реконфигурации, и они оставались с традиционными корешковыми листами с использованием подключаемых модулей.
Вывод переворачивает уравнение. Трафик является прерывистым и непредсказуемым на уровне потока, а допуск по задержке близок к нулю. Оптические пути нельзя перенастроить для каждого-запроса. Что вам нужно, так это фабрика с постоянным избыточным выделением ресурсов и детерминированной задержкой, которая подталкивает вас к использованию подключаемых трансиверов в топологии позвоночника-листа, где каждый канал всегда горит. Мы продаем модули для обоих сценариев, и инженерные разговоры совершенно разные. Покупатели обучающего кластера хотят знать об совокупной пропускной способности на стойку и мощности на бит. Покупатели логических выводов спрашивают о задержке хвоста и о том, что происходит, когда канал выходит из строя.

Для традиционных корпоративных и колоритных сред ниже гипермасштабирования стоимость порта доминирует, а обратная совместимость с существующими волоконно-оптическими установками имеет большее значение, чем исходная плотность полосы пропускания. Мы протестировали нашуМодули 400G QSFP-DD на 14 платформах коммутатороввключая Cisco Nexus 93600CD, Arista 7060X5 и Juniper QFX5220. В таких условиях доминирующей проблемой является не скорость. Вопрос в том, распознается ли модуль микропрограммой коммутатора без команд ручного управления.
Мертвая зона 800G, которая застает инженеров врасплох
В 400G выбор межсоединения состоял из двух-этапных этапов: измерение расстояния, выбор медного или оптоволокна. Пассивный ЦАП комфортно покрывает расстояние от 3 до 5 метров.. 800G преодолел это расстояние. На каждой полосе используется 112G PAM4. Потери в меди на этих частотах примерно удваиваются по сравнению с 400G, и в результате получается жесткий потолок около 2 метров для пассивного кабеля.

Мы научились этому дорогим путем. Один из первых клиентов заказал нашуПассивные сборки ЦАП 800Gдлиной 3 метра в зависимости от компоновки стойки 400G. Обучение каналов завершилось неудачно на более чем 60% портов. Медь не была дефектной; физика просто не позволит этого. Они перешли на AEC для дистанций от 3 до 5 метров и на подключаемые оптические модули для всего, что дальше, и в течение недели развертывание стабилизировалось. С тех пор мы прекратили принимать заказы на пассивный ЦАП 800G на высоте более 2,5 метров и добавили в процесс подтверждения заказа рекомендации по расстоянию развертывания.
AEC теперь владеет разрывом от 3 до 7 метров. Цифровые ретаймеры восстанавливают сигнал электрически без оптического преобразования, что снижает стоимость, но увеличивает задержку. Только KP4 FEC требует от 50 до 100 наносекунд на каждый переход на частоте 800G, а ретаймер складывает еще больше. Мы измерили общую добавленную задержку от 85 до 110 нс на сборках AEC, которые мы в настоящее время поставляем. Для соединений структуры позвоночника-листа эти издержки незаметны с точки зрения производительности приложения. Для тесно связанных кластеров графических процессоров ситуация другая. Согласно данным профилирования трех клиентских развертываний, на которых используются узлы H100, если затраты на связь в вашем задании по обучению уже превышают 15 %, эти дополнительные сто наносекунд на переход между несколькими уровнями коммутаторов начинают накапливаться в операциях NCCL AllReduce.
На расстоянии более 7 метров подключаемые оптические трансиверы для 800G — единственный возможный путь. Требования физического уровня здесь значительно ужесточаются. Бюджет сквозных--вносимых потерь в соответствии со стандартом IEEE 802.3ck составляет менее 1,5 дБ для большинства классов досягаемости 800G, а уровень каждого сопряженного MPO-соединения должен оставаться ниже 0,35 дБ. Мы видели, как установленное волокно, прошедшее сертификацию на 100G, показывает значения PMD в два-три раза выше номинальных характеристик после нескольких лет сжатия в кабельных лотках, что соответствует тому, что сообщила группа сетевых исследований Juniper в 2023 году. Наша стандартная рекомендация перед развертыванием любого приемопередатчика 800G: выполнить OTDR и определение характеристик PMD на каждом существующем сегменте волокна. Не образец. Каждый сегмент. Стоимость повторного протягивания двух магистральных кабелей составляет небольшую часть стоимости отладки прерывистых колебаний линии связи в течение шести месяцев.
CPO против LPO против подключаемых модулей: где на самом деле будет каждая технология в 2026 году
Совместно-оптическая оптика изменит построение коммутационной инфраструктуры центров обработки данных. Мы говорим это как производитель подключаемых модулей, поэтому воспринимайте нашу точку зрения как информированную, а не нейтральную.
На OFC 2026 данные о надежности прототипов CPO показали, что частота отказов потенциально ниже, чем у традиционных подключаемых модулей. Без циклов механической вставки или открытых поверхностей разъемов основные виды отказов сменных модулей просто не применимы. Коммутационная платформа Bailly 51.2T CPO от Broadcom продемонстрировала примерно на 70 % меньшее энергопотребление на оптическом уровне по сравнению с эквивалентными подключаемыми конфигурациями. (Отчет об оптическом межсоединении DataMIntelligence) NVIDIA продемонстрировала-интегрированные коммутаторы CPO на GTC 2026, планируя масштабное-развертывание в период с 2027 по 2028 год.
Наша позиция: если вы не являетесь гиперскалером, создающим собственные микросхемы коммутаторов, подключаемая оптика — ваш единственный вариант развертывания как минимум до 2027 года. CPO нужны архитектуры плат, которые большинство поставщиков коммутаторов еще не представили, стандарты разъемов, которые еще не доработаны, и совершенно новый сценарий для обработки сбоев, которые вы не можете исправить, вытащив модуль. Экосистемы общекорпоративных закупок пока не существует. В прошлом году два потенциальных клиента отложили обновление 400G-до 800G в ожидании CPO. Оба в конце концов вернулись и разместили сменные заказы после того, как пропускная способность полосы пропускания стала производственным инцидентом. Подробнее о инженерном обосновании такой позиции мы писали на нашем сайте.анализ архитектуры подключаемого трансивера.
LPO находится в другом месте. При удалении DSP из модуля отключается самый энергоемкий-компонент, на который приходится до половины общего энергопотребления модуля. Результатом является снижение потребления на 30–50 % и уменьшение задержки до 15 наносекунд. В конце 2025 года мы начали подавать запросы-по конкретным LPO. Три из четырех поступили от клиентов, создающих кластеры графических процессоров-от одного-поставщика на NVIDIA Spectrum-X. Ни одна не эксплуатируемая сеть-поставщиков, которая расскажет вам все о том, где LPO работает сегодня. Если в вашей сети используются коммутаторы разных производителей, LPO несовместим с вашей средой. Если вы используете ИИ-кластер одного-поставщика, это может оказаться самым разумным доступным обновлением, и мы ожидаем, что к середине 2027 года модули с поддержкой LPO-будут готовы к сертификации.
Что означают температурные запасы 800G при выборе модуля
Тепловая математика 800G застает людей врасплох. Плотность мощности высокоскоростного оптического соединения в этом поколении создает проблемы, которых просто не существовало в 400G. Коммутатор с 64 портами, полностью загруженный модулями 800G по 16 Вт каждый, потребляет примерно 1 кВт мощности одного только приемопередатчика, тогда как собственная ASIC коммутатора потребляет от 400 до 500 Вт. Это от 1,4 до 1,5 кВт на переключатель. Восемь коммутаторов на уровне позвоночника дают вам более 11 кВт только от сетевого оборудования в стойках, которые часто были выделены на общую мощность от 8 до 10 кВт.
Компания Juniper Networks прямо предупреждает, что модули сторонних-производителей с высоким энергопотреблением, особенно типы Coherent ZR и ZR+, могут вызвать термическое повреждение хост-оборудования, ответственность за которое ложится на пользователя. (Часто задаваемые вопросы по оптике Juniper Networks 800G) Это не аргумент против оптических модулей-сторонних производителей. Это аргумент в пользу точного знания того, что вы подключаете. В ходе нашей квалификации по термоциклированию мы тестируем каждую конструкцию модуля 800G при постоянной температуре перехода 85 градусов в течение 2000 часов и отслеживаем дрейф тока смещения лазера как основной индикатор старения. Устройства, дрейф которых превышает 38 мА, снимаются с производственной линии. При плотности 800G разница между модулем мощностью 14 Вт и модулем мощностью 18 Вт определяет, останется ли стойка в пределах теплового диапазона или подаст сигнал об отключении в 2 часа ночи. Ошибка в спецификации всегда раздражала. При таких уровнях мощности это дорого.

Мы поставляем сменные модули от 1G SFP до 800G OSFP и тестируем их на основных платформах коммутаторов. Мы ведем учет того, что работает, а что нет. Если вам нужна проверка совместимости с конкретной коммутационной средой или вам нужны характеристики теплового класса и класса мощности-для стоек 800G с высокой-плотностью, наши инженеры проводят эти обсуждения каждую неделю. НашСтраница трансивера 800G OSFP и QSFP-DD800содержит спецификации, параметры-классов и образцы форм запросов для каждого модуля, который мы поставляем.


