Technologie-Roadmap für optische Module: Von 800G bis 3,2T und darüber hinaus

Einführung

Die Branche der optischen Module befindet sich an einem entscheidenden Wendepunkt. Während 800G-Module den Übergang von der frühen Testphase zum breiten Einsatz vollziehen, entwickelt die Industrie bereits die nächsten Generationen: 1,6T-, 3,2T- und sogar 6,4T-Technologien. Diese umfassende Roadmap beleuchtet die technologische Entwicklung optischer Module im kommenden Jahrzehnt und untersucht die Innovationen bei Modulationstechniken, photonischer Integration, Gehäusetechnik und Systemarchitekturen, die das exponentielle Bandbreitenwachstum ermöglichen, das für KI und andere anspruchsvolle Anwendungen erforderlich ist. Das Verständnis dieser Roadmap ist für Rechenzentrumsarchitekten, die langfristige Infrastrukturinvestitionen planen, unerlässlich.

Aktueller Stand: 800G-Reifung (2023-2025)

Technologiestiftung

Modulation und Codierung: Aktuelle 800G-Module nutzen überwiegend PAM4-Signalisierung (4-stufige Pulsamplitudenmodulation) mit 100 Gbaud pro Lane. Mit 8 Lanes wird so eine Gesamtbandbreite von 800 Gbit/s erreicht. Die Technologie nutzt fortschrittliche digitale Signalverarbeitung (DSP) für Entzerrung, Vorwärtsfehlerkorrektur (FEC) und Taktrückgewinnung.

Hauptkomponenten:

  • Laser : DFB-Laser (Distributed Feedback) oder VCSEL-Laser (Vertical Cavity Surface Emitting Laser) für kurze Reichweiten
  • Modulatoren : Siliziumphotonische Mach-Zehnder-Modulatoren oder elektroabsorptive Modulatoren
  • Fotodetektoren : Germanium-auf-Silizium-PIN- oder APD-Fotodetektoren
  • DSP : 7-nm- oder 5-nm-CMOS-Prozessknoten, Leistungsaufnahme von 5–8 W des gesamten Moduls

Formfaktoren: OSFP und QSFP-DD haben sich als die dominierenden Formfaktoren herauskristallisiert, wobei OSFP eine bessere Wärmeleistung bietet und QSFP-DD Rückwärtskompatibilität gewährleistet.

Marktreife: Ab 2024 werden 800G-Module in Serie gefertigt, und mehrere Anbieter bieten kompatible Produkte an. Die Preise sind von über 2.000 US-Dollar Anfang 2022 auf 1.000–1.400 US-Dollar im Jahr 2024 gesunken und werden voraussichtlich bis 2025 800–1.000 US-Dollar erreichen, da die Produktionsmengen steigen und die Fertigungsausbeute sich verbessert.

Einsatztrends

KI-Trainingscluster: 800G etabliert sich als Standard für neue KI-Trainingsinfrastrukturen, wobei Hyperscaler Zehntausende von Modulen einsetzen. Die Bandbreite ermöglicht das effiziente Training von Modellen mit Hunderten von Milliarden Parametern auf Tausenden von GPUs.

Cloud-Rechenzentren: Große Cloud-Anbieter rüsten ihre Spine-Layer auf 800G auf, um den wachsenden Ost-West-Datenverkehr von Microservices-Architekturen und verteilten Datenbanken zu unterstützen.

Herausforderungen: Das Wärmemanagement bei Installationen mit hoher Dichte, der Stromverbrauch (15-20 W pro Modul) und die Kosten bleiben zentrale Herausforderungen, die eine breitere Akzeptanz über Hyperscale-Umgebungen hinaus einschränken.

Kurzfristige Entwicklung: Entstehung von 1,6 T (2025–2027)

Technologieansätze

Ansatz 1: 8×200G PAM4

  • Mechanismus : Erhöhung der Datenrate pro Spur von 100 Gbaud auf 200 Gbaud bei gleichzeitiger Beibehaltung der PAM4-Modulation
  • Herausforderungen : Erfordert deutliche Verbesserungen der DSP-Leistung, der analogen Bandbreite und der Signalintegrität.
  • Leistungsaufnahme : Erwartet 25-35 W pro Modul aufgrund schnellerer DSP- und Analogschaltungen.
  • Reichweite : Beschränkt auf 500 m bis 2 km für die ersten Produkte aufgrund erhöhter Streuung und Dämpfung bei höheren Frequenzen.
  • Zeitplan : Erste Produkte 2025, Serienproduktion 2026

Ansatz 2: 16×100G PAM4

  • Mechanismus : Verdopplung der Anzahl der Fahrspuren von 8 auf 16 bei gleichbleibender Übertragungsrate von 100 Gbaud pro Fahrspur
  • Vorteile : Nutzt bewährte 100G-Lane-Technologie, potenziell geringerer Stromverbrauch als der 200G-Ansatz
  • Herausforderungen : Erfordert neue Steckverbinderdesigns mit 16 Lanes, erhöhte Leiterplattenkomplexität, größere Modulgröße
  • Formfaktor : Möglicherweise ist ein neuer Formfaktor jenseits von OSFP/QSFP-DD erforderlich.
  • Zeitplan : Prototypen ab 2025, limitierte Produktion 2026-2027

Ansatz 3: Kohärentes 1,6T

  • Mechanismus : Verwendung kohärenter Detektion (ähnlich wie bei Weitverkehrs-Telekommunikation) für überlegene Leistung
  • Vorteile : Ausgezeichnete Reichweite (10–80 km), hohe spektrale Effizienz, robust gegenüber Störungen
  • Herausforderungen : Höherer Stromverbrauch (30–40 W), höhere Kosten, größere Komplexität
  • Anwendung : Verbindung zwischen Rechenzentren, Metronetze
  • Zeitplan : Erste Produkte ab 2025 für spezifische Anwendungen

Fortschritte in der Siliziumphotonik

Integrierte Laserquellen: Ein bedeutender Durchbruch für 1,6 T wird die Integration von III-V-Lasern direkt auf Silizium-Photonikchips mittels heterogener Integration oder Quantenpunkttechnologie sein. Dadurch entfällt die Notwendigkeit separater Laserchips, was Kosten, Leistungsaufnahme und Montageaufwand reduziert.

  • Quantenpunktlaser auf Silizium : Diese Laser werden direkt auf Siliziumsubstraten hergestellt, sind temperaturunempfindlich und hocheffizient.
  • Hybridintegration : Hochpräzise Verbindung von III-V-Laserchips mit Siliziumphotonikchips.
  • Auswirkungen : Könnte die Modulkosten um 20-30 % und den Stromverbrauch um 15-25 % senken.
  • Zeitplan : Kommerzielle Produkte werden voraussichtlich 2026-2027 verfügbar sein.

Fortschrittliche Modulatoren: Modulatoren der nächsten Generation werden Dünnschicht-Lithiumniobat oder andere elektrooptische Materialien verwenden, die eine höhere Leistung als Silizium bieten:

  • Bandbreite : >100 GHz (gegenüber 40-60 GHz bei Silizium)
  • Ansteuerspannung : <1 V (gegenüber 2–4 V bei Silizium), wodurch der Stromverbrauch reduziert wird
  • Linearität : Eine bessere Linearität ermöglicht Modulationsformate höherer Ordnung.
  • Integration : Kann heterogen mit Siliziumphotonik integriert werden.

Marktprognosen

Preisgestaltung: Die ersten 1,6-Tbit/s-Module werden voraussichtlich 2025 zwischen 2.500 und 3.500 US-Dollar kosten und bis 2027 mit steigenden Produktionsmengen auf 1.500 bis 2.000 US-Dollar sinken. Die Kosten pro Gigabit werden weiter sinken: von 1,75 US-Dollar/Gbit/s für 800G (2024) auf 1,25 US-Dollar/Gbit/s für 1,6T (2027).

Einführung: Hyperscaler werden die frühe Einführung von KI-Trainingsclustern und Spine-Layern vorantreiben. Die Einführung in Unternehmen wird aufgrund von Kosten und der Reife des Ökosystems um 2-3 Jahre verzögert sein.

Mittelfristige Vision: Entwicklung im Umfang von 3,2 Billionen US-Dollar (2027–2030)

Technologische Wege

Modulation höherer Ordnung: Vom PAM4-Verfahren hin zu PAM6, PAM8 oder sogar QAM (Quadraturamplitudenmodulation):

  • PAM6 : 6 Amplitudenstufen, 2,58 Bit pro Symbol (gegenüber 2 bei PAM4)
  • PAM8 : 8 Amplitudenstufen, 3 Bit pro Symbol
  • 16-QAM : 4 Bit pro Symbol unter Verwendung von Amplituden- und Phasenmodulation
  • Herausforderung : Modulationsverfahren höherer Ordnung erfordern ein deutlich besseres Signal-Rausch-Verhältnis (SNR), was den Leistungsbedarf und die Komplexität erhöht.
  • Vorteil : Mit 8×400G-Lanes unter Verwendung von PAM8 oder 8×533G unter Verwendung von 16-QAM lassen sich 3,2 Tbit/s erreichen.

Wellenlängenmultiplex-Skalierung (WDM): Erhöhung der Anzahl der Wellenlängenkanäle:

  • Aktuell : 8 Wellenlängen für 800G (CWDM oder LAN-WDM)
  • Zukunft : 16–32 Wellenlängen mittels DWDM (Dense WDM) mit 50 GHz oder 25 GHz Wellenlängenabstand
  • Vorteil : Nutzt bewährte WDM-Technologie aus dem Telekommunikationssektor.
  • Herausforderung : Erfordert temperaturstabilisierte Laser und komplexere Multiplexer/Demultiplexer
  • Anwendung : 3,2T mit 16×200G Wellenlängen

Räumliches Multiplexing: Verwendung mehrerer Faserkerne oder Moden:

  • Mehrkernfaser : Einzelfaser mit 4-12 unabhängigen Kernen
  • Multimode-Faser : Nutzung mehrerer räumlicher Moden in speziell entwickelten Fasern
  • Vorteil : Massive Bandbreitenskalierung ohne Erhöhung der Geschwindigkeit pro Spur
  • Herausforderung : Erfordert eine neue Glasfaserinfrastruktur, die nicht mit bestehenden Singlemode-Fasern kompatibel ist.
  • Zeitplan : Forschungsphase, voraussichtlich vor 2030 für Rechenzentrumsanwendungen

Revolution der Co-Packaged Optics (CPO)

CPO stellt einen grundlegenden Wandel in der Architektur optischer Module dar, indem es die Optik direkt in die Switch-ASICs integriert:

Architektur:

  • Traditionell : Steckbares Modul wird über einen elektrischen SerDes (Serialisierer/Deserialisierer) mit dem Switch-ASIC verbunden.
  • CPO : Optische Module (Laser, Modulatoren, Detektoren) direkt auf dem Switch-ASIC-Substrat integriert
  • Eliminierung : Entfernt elektrische SerDes, Steckverbinder und das Gehäuse des steckbaren Moduls.

Vorteile:

  • Leistungsreduzierung : 50-70 % geringerer Stromverbrauch (5-10 W für 800G-Äquivalent gegenüber 15-20 W für steckerfertige Geräte)
  • Latenzreduzierung : 50-100 ns geringere Latenz (eliminiert elektrische SerDes)
  • Bandbreitendichte : 10-mal höhere Bandbreite pro Höheneinheit
  • Kostenreduzierung : Potenzielle Kostenreduzierung von 30-50 % bei Skalierung durch Wegfall von Verpackung und Steckverbindern

Herausforderungen:

  • Wärmemanagement : Optik und Elektronik haben unterschiedliche thermische Anforderungen.
  • Ausbeute : Die Integration von Optik in ASIC verringert die Gesamtausbeute.
  • Wartungsfreundlichkeit : Defekte optische Komponenten können nicht ausgetauscht werden, ohne den gesamten Switch-ASIC zu ersetzen.
  • Standardisierung : Fehlende Industriestandards schränken die Interoperabilität verschiedener Hersteller ein.

Zeitleiste:

  • 2025-2026 : Erste kommerzielle CPO-Produkte von Hyperscalern (Google, Microsoft, Meta)
  • 2027–2028 : Breitere Anwendung in KI-Trainingsclustern
  • 2029–2030 : CPO wird zum Standard für 3,2-Takt-Prozessoren und höhere Geschwindigkeiten

Gebot der Energieeffizienz

Bei einer Skalierung der Bandbreite auf 3,2 T wird der Stromverbrauch zu einem kritischen Faktor:

Herausforderungen bei der Skalierung der Leistung:

  • Einfache Skalierung : 3,2 Tbit/s bei gleicher Energieeffizienz wie 800 Gbit/s würden 60–80 W pro Modul benötigen.
  • Thermische Grenzen : Bestehende Bauformen können nicht zuverlässig mehr als 40 W abführen.
  • Stromversorgung des Rechenzentrums : Der Stromverbrauch des Netzwerks könnte 50 % des gesamten Infrastrukturstromverbrauchs überschreiten.

Effizienzinnovationen:

  • Fortschrittliche Prozessknoten : 3-nm- und 2-nm-CMOS für DSP reduzieren den Stromverbrauch im Vergleich zu 7 nm um 30–40 %.
  • Photonische Integration : Eliminiert energieintensive elektrisch-optische Wandlungen
  • Neuartige Materialien : Dünnschicht-Lithiumniobat, 2D-Materialien für die Modulation mit extrem niedrigem Stromverbrauch
  • Ziel : 3,2T-Module bei 20-30W (0,6-0,9 pJ/Bit gegenüber 1,5-2 pJ/Bit beim aktuellen 800G)

Langfristiger Horizont: 6,4 Billionen und mehr (ab 2030)

Grundlegende technologische Umbrüche

Kohärente Datenkommunikation: Angelehnt an die Weitverkehrs-Telekommunikation ermöglicht die kohärente Detektion eine außergewöhnliche spektrale Effizienz:

  • Modulation : 64-QAM oder höher, 6+ Bit pro Symbol
  • Polarisationsmultiplexing : Verdoppelt die Kapazität durch Nutzung beider Polarisationen
  • Bandbreite : 800 Gbit/s pro Wellenlänge erreichbar, 6,4 Tbit/s mit 8 Wellenlängen
  • Reichweite : 10-80 km mit hervorragender Leistung
  • Leistung : Derzeit 40-60 W, wird aber voraussichtlich bis 2030 auf 25-35 W sinken.
  • Kosten : Aktuell hoch (5.000–8.000 US-Dollar), aber durch Skaleneffekte könnten sie auf 2.000–3.000 US-Dollar sinken.

Optisches Schalten und Routing: Schaltvorgänge im optischen Bereich ohne elektrische Wandlung:

  • Optische MEMS-Schalter : Mechanisch rekonfigurierbare Spiegel, Schaltzeit 1–10 ms
  • Siliziumphotonische Schalter : Elektronisch rekonfigurierbar, Schaltzeit 10–100 ns
  • Anwendung : Leitungsvermittelte Netzwerke für vorhersagbaren KI-Trainingsverkehr
  • Vorteil : Nahezu keine Schaltverzögerung und minimaler Stromverbrauch

Integration der Quantenkommunikation: Quantenschlüsselverteilung (QKD) und Quantennetzwerke können mit klassischen optischen Netzwerken integriert werden:

  • Hybridsysteme : Klassische Daten auf einigen Wellenlängen, Quantensignale auf anderen.
  • Sicherheit : Quantengesicherte Verschlüsselung für sensible KI-Trainingsdaten
  • Zeitleiste : Nischenanwendungen bis 2030, breitere Akzeptanz nach 2035

Alternative Verbindungstechnologien

Freiraumoptik (FSO): Optische Kommunikation durch die Luft statt durch Glasfaser:

  • Anwendung : Kommunikation zwischen Racks oder Reihen innerhalb von Rechenzentren
  • Bandbreite : Terabit pro Sekunde erreichbar
  • Vorteile : Keine Glasfaserinstallation erforderlich, rekonfigurierbar, sehr geringe Latenz
  • Herausforderungen : Empfindlichkeit gegenüber der Ausrichtung, Probleme mit Hindernissen, begrenzte Reichweite
  • Status : Forschung und begrenzte Studien, breite Markteinführung vor 2030 unwahrscheinlich.

Drahtlose Millimeterwellenübertragung: Drahtlose Übertragung mit 60 GHz oder höherer Frequenz für kurze Reichweiten und hohe Bandbreite:

  • Bandbreite : 10–100 Gbit/s pro Verbindung
  • Anwendung : Flexible Konnektivität in modularen Rechenzentren
  • Einschränkung : Kann die optische Bandbreite nicht erreichen, höhere Latenz
  • Nische : Temporäre oder rekonfigurierbare Bereitstellungen

KI-spezifische Optimierungen

Beschleunigung der kollektiven Kommunikation

Zukünftige optische Module könnten Hardwarebeschleunigung für KI-spezifische Operationen beinhalten:

Netzwerkinterne Aggregation:

  • Konzept : Gradientenaggregation (Summe, Mittelwert) innerhalb optischer Module oder Schalter durchführen.
  • Technologie : Analoge optische Datenverarbeitung mittels Interferenz- oder nichtlinearer Optik
  • Vorteil : 10- bis 100-mal schnellere All-Reduce-Operationen
  • Herausforderung : Begrenzte Präzision (8-16 Bit), spezialisiert auf bestimmte Operationen
  • Zeitplan : Forschungsprototypen existieren, kommerzielle Produkte möglich 2028-2030

Multicast- und Broadcast-Optimierung:

  • Optisches Multicast : Verwenden Sie passive optische Splitter, um Daten an mehrere Empfänger zu senden.
  • Anwendung : Verteilung von Modellparametern oder Übertragung von Steuersignalen
  • Effizienz : Eine einzige Übertragung erreicht mehrere Ziele ohne Switch-Replikation.

Latenzoptimierte Varianten

KI-Inferenz erfordert extrem niedrige Latenzzeiten, was die Entwicklung spezialisierter Module vorantreibt:

  • Zero-DSP-Module : Verzichten Sie vollständig auf digitale Signalverarbeitung für eine Latenz von unter 50 ns.
  • Analoge Entzerrung : Verwenden Sie analoge Schaltungen anstelle von digitalen, um die Latenz zu verringern.
  • Direkte Detektion : Einfachste mögliche Empfängerarchitektur
  • Kompromiss : Begrenzte Reichweite (<500 m) und geringere Zuverlässigkeit, aber minimale Latenz
  • Anwendung : Latenzkritische Inferenz (autonome Fahrzeuge, Hochfrequenzhandel, Echtzeit-KI)

Standardisierung und Ökosystementwicklung

Entwicklung der Industriestandards

IEEE 802.3 Roadmap:

  • 802.3ck (800G) : Ratifiziert 2022
  • 802.3dj (1,6T) : Voraussichtliche Ratifizierung 2025
  • Zukunft (3,2T) : Bildung einer Studiengruppe voraussichtlich 2026, Standardisierung bis 2028-2029

Multi-Source Agreements (MSAs):

  • OSFP MSA : Weiterentwicklung zur Unterstützung von 1,6T und 3,2T
  • QSFP-DD MSA : Definition der thermischen und elektrischen Spezifikationen für höhere Geschwindigkeiten
  • CPO MSA : Neue MSA zur Standardisierung von Schnittstellen für gemeinsam verpackte optische Systeme entsteht

Interoperabilitätstests: Mit steigenden Geschwindigkeiten wird die Interoperabilität immer anspruchsvoller. Branchenweite Plugfests und Zertifizierungsprogramme sind daher unerlässlich, um die Kompatibilität verschiedener Hersteller sicherzustellen.

Lieferkette und Fertigung

Halbleiter-Foundry-Kapazität: Fortschrittliche optische Module erfordern modernste Halbleiterprozesse:

  • Siliziumphotonik : Nutzt CMOS-Fertigungsanlagen (GlobalFoundries, TSMC, Tower)
  • DSP-Chips : Erfordert 5-nm-, 3-nm- oder 2-nm-Prozesse (TSMC, Samsung)
  • Kapazitätsengpässe : Wettbewerb mit KI-Chips und Smartphones um die Kapazitäten der Halbleiterfertigung.
  • Geopolitische Risiken : Konzentration fortschrittlicher Halbleiterfabriken in Taiwan und Südkorea

Trends zur vertikalen Integration: Große Cloud-Anbieter entwickeln eigene Kapazitäten für optische Module:

  • Google : Entwicklung kundenspezifischer Siliziumphotonik und CPO
  • Microsoft : Investitionen in Forschung und Entwicklung optischer Verbindungstechnik
  • Meta : Aufbau interner Designteams für optische Module
  • Auswirkungen : Kann das Ökosystem fragmentieren oder durch Wettbewerb Innovationen vorantreiben.

Marktprognosen und Investitionsimplikationen

Marktgrößenprognosen

Wachstum des Marktes für optische Module:

  • 2024 : 8 Milliarden US-Dollar (dominiert von 100G, 400G und dem aufkommenden 800G)
  • 2027 : 15 Milliarden US-Dollar (800G Mainstream, 1,6T aufstrebende Märkte)
  • 2030 : 25 Milliarden US-Dollar (1,6 Billionen US-Dollar im Mainstream, 3,2 Billionen US-Dollar in aufstrebenden Märkten, wachsender CPO-Markt)
  • CAGR : 20-25 %, getrieben durch den Ausbau der KI-Infrastruktur

Speed ​​Mix Evolution:

  • 2024 : 100G (40%), 400G (35%), 800G (15%), Sonstige (10%)
  • 2027 : 400G (30 %), 800G (40 %), 1,6T (20 %), andere (10 %)
  • 2030 : 800 G (25 %), 1,6 T (35 %), 3,2 T (25 %), CPO (10 %), Sonstige (5 %)

Investitionsprioritäten

Für Rechenzentrumsbetreiber:

  • 2024–2025 : Einführung von 800G für neue KI-Cluster, Beginn von Pilotprojekten mit 1,6T-Kapazität
  • 2026–2027 : Umstellung auf 1,6 T für die Wirbelsäulenschichten, Beibehaltung von 800 G für die Blätter
  • 2028–2030 : CPO für neue Builds evaluieren, 3,2T für größte Cluster bereitstellen

Für Technologieanbieter:

  • Forschungs- und Entwicklungsschwerpunkte : Integration von Siliziumphotonik, fortschrittliche Modulation, Energieeffizienz
  • Fertigung : Gießereikapazitäten sichern, in automatisierte Montage investieren
  • Partnerschaften : Zusammenarbeit mit Hyperscalern an kundenspezifischen Lösungen

Fazit: Die Roadmap navigieren

Die Roadmap für optische Modultechnologien von 800G auf 3,2T und darüber hinaus stellt einen der dynamischsten und wichtigsten Entwicklungspfade in der Rechenzentrumsbranche dar. Angetrieben durch den unstillbaren Bandbreitenbedarf von KI beschleunigt sich das Innovationstempo: Neue Geschwindigkeitsklassen erscheinen alle zwei bis drei Jahre, im Vergleich zu vier bis fünf Jahren in den vergangenen Jahrzehnten.

Wichtigste Erkenntnisse für die Interessengruppen:

  • Kontinuierliche Weiterentwicklung : Planen Sie Technologieerneuerungszyklen von 3-5 Jahren ein, nicht von 7-10 Jahren.
  • Energieeffizienz : Priorisieren Sie energieeffiziente Technologien (LPO, CPO), um die Betriebskosten zu senken.
  • Standardisierung : Arbeiten Sie mit Normungsgremien zusammen, um Interoperabilität zu gewährleisten und eine Abhängigkeit von einzelnen Anbietern zu vermeiden.
  • Flexibilität : Infrastruktur mit Upgrade-Pfaden für höhere Geschwindigkeiten entwerfen
  • KI-zentriert : Erkennen Sie, dass KI-Workloads die Roadmap bestimmen und optimieren Sie entsprechend.

Die Bedeutung optischer Module für die KI-Revolution kann nicht hoch genug eingeschätzt werden. Mit dem Übergang von 800G zu Multi-Terabit-Geschwindigkeiten bleiben diese Module die entscheidenden Treiber der massiven Datenströme, die künstliche Intelligenz ermöglichen. Unternehmen, die diese technologische Roadmap verstehen und sich daran orientieren, sind bestens gerüstet, um eine wettbewerbsfähige, skalierbare und nachhaltige KI-Infrastruktur für das kommende Jahrzehnt aufzubauen.

Zurück zum Blog