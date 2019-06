Künstliche Intelligenz hat die Science-Fiction längst verlassen und ist – mehr oder weniger unbemerkt – Teil unseres Alltags geworden. Diese Entwicklung bleibt auch für Rechenzentren nicht ohne Folgen – sie könnten einerseits von KI profitieren, müssen aber andererseits andere Architekturen aufweisen. Die richtige Verkabelung spielt dabei eine entscheidende Rolle.

Schon 1968 hielt künstliche Intelligenz (KI) Einzug in Hollywood, mit HAL 9000, dem mitfühlenden Computer an Bord des Discovery One Raumschiffs in »2001: A Space Odyssee«. Auch autonome Fahrzeuge konnte man im Kino sehen, lange bevor die Tests der KI-gestützten Modelle auf der Straße begonnen haben – unter anderem in »Total Recall« von 1990. KI ist längst ein Bestandteil unseres Alltags geworden: Ohne groß nachzudenken, fragen wir das Smartphone nach dem Wetter, lassen virtuelle Assistenten die Lieblingsmusik spielen und verfolgen Neuigkeiten auf den sozialen Medien, ausgewählt nach unseren Interessen. Auch abseits des privaten Umfeldes wird auf KI gesetzt: für schnelle Übersetzungen, zur Gesichtserkennung, bei der Diagnose von Krankheiten oder im Kampf gegen den Drogenhandel. Und die Bedeutung von KI wird wachsen – Gartner sagt voraus, dass das Geschäft mit KI bis 2022 einen Wert von 3,9 Billionen US-Dollar erreicht haben wird.

Diese Entwicklung setzt riesige Datenströme voraus und produziert sie selbst. Für die Rechenzentren, die Knotenpunkte der digitalen Welt, bleibt das nicht ohne Folgen.

KI kann Energiekosten im Rechenzentrum senken

Wie der Mensch können auch Rechenzentren von KI – oder genauer gesagt maschinellem Lernen (ML) – profitieren. Im Jahr 2014 hat Google ein ML-Projekt gestartet, um zu prüfen, ob sich der Stromverbrauch in Rechenzentren optimieren lässt. Das Ergebnis war beeindruckend: Am Teststandort konnte der Energieverbrauch für die Kühlung um 40 Prozent verringert werden. Die sogenannte Power Usage Effectiveness (PUE), die angibt wie effizient Rechenzentren Energie nutzen, nahm in Folge dessen einen Allzeit-Bestwert an. Google setzt dieses Verfahren inzwischen auch an anderen Standorten erfolgreich ein und es dürfte nur eine Frage der Zeit sein, bis andere Technologiekonzerne folgen.

KI hat also definitiv Vorteile für Rechenzentren – aber die Datenströme stellen eine enorme Herausforderung dar. So werden allein für das Training des Chinesisch-Spracherkennungs-Modells von Baidu vier Terabyte Trainingsdaten und gleichzeitig 20 Exaflops Rechenleistung benötigt.

Server-Kommunikation muss auch in Ost-West-Richtung stattfinden

Man muss kein Hellseher sein, um zu wissen, dass die Datenmenge mit jedem weiteren KI-gestützten Modell wachsen wird und dies die Anforderungen an die Rechenzentrumsarchitektur verändert. So wäre es zwar durchaus möglich, ML-Modelle auf einem Rechner laufen zu lassen, aber in der Regel wird das immense Datenaufkommen auf mehrere Rechner verteilt. Dabei müssen Latenzen oder Störungen möglichst vermieden werden und die Bandbreite, mit der die verteilten Instanzen kommunizieren, muss ausreichend groß sein. Einfache Spine-and-Leaf-Architekturen, die auf verschiedenen Layern basieren, können da nicht mithalten. Traditionelle 3-Tier-Netzwerke nutzen Core, Aggregat und Edge Switching, um die verschiedenen Server innerhalb eines Rechenzentrums zu verbinden. Dieser Inter-Server-Traffic wird dabei in Nord-Süd-Richtung übertragen. Mit den hohen Anforderungen und Abhängigkeiten, die KI und ML ins Spiel bringen, werden mehr 2-Tier-Spine-Leaf-Architekturen genutzt, auf denen die Server in Ost-West-Richtung miteinander kommunizieren.

Verkabelung – Singlemode oder Multiplex?

Glasfaserkabel sind bereits der de facto Standard für die Datenübertragung, da sie herkömmlichen Kupferkabeln hinsichtlich Geschwindigkeit und Dichte weit überlegen sind. Doch welche Technologie kann die neuen Anforderungen durch KI am besten bewältigen?

Seit die IEEE im Jahr 2010 Übertragungsraten von 40G und 100G zugelassen hat, existiert eine Vielzahl konkurrierender Lösungen, die es den Verantwortlichen nicht immer leicht macht. Was früher eine einfache Entscheidung zwischen Short und Long Reach war, umfasst heute viel mehr Optionen: man muss sich entscheiden, ob man entweder zwei Fasern unter Verwendung von standardgenehmigten oder proprietären, nicht interoperablen WDM-Techniken und von Standards anerkannten oder Multi-Source-Vereinbarungen (MSAs) und Techniken für parallel-optische Übertragung mit acht Fasern (vier für die Übertragung, vier für den Empfang) oder 20 Fasern (10 für die Übertragung, 10 für den Empfang) nutzen möchte. Alle Varianten haben ihre Vor- und Nachteile, im KI Umfeld haben Singlemode Fasern mit parallel-optischer Übertragung die Nase vorn.

Drei Gründe für Singlemode-Fasern und parallel-optische Übertragung

Zunächst spielen die Faktoren Kosten und Distanz eine Rolle: Parallel-optische Lösungen dominieren den Markt, daher sind sie günstiger und schneller verfügbar als WDM-Lösungen. Sie unterstützen zudem geringere Distanzen, so dass kostenintensive Zusatzanschaffungen, um die Laser zu kühlen, nicht nötig sind. Auch wenn die Fußballfeld-großen Serverfarmen vermuten lassen, dass die Distanzen immer größer werden, zeigen Analysen, dass selbst dort die durchschnittliche Distanz 165 Meter noch nicht überschritten hat. Zudem benötigt die parallel-optische Übertragung über Singlemode-Fasern weniger Strom als eine WDM-Lösung und ist damit günstiger im laufenden Betrieb eines Rechenzentrums.

Der Hauptvorteil der parallel-optischen Übertragung liegt in der Flexibilität: Rechenzentrums-Architekten haben beispielsweise die Möglichkeit, einen 40G-Hochgeschwindigkeits-Switchport in vier 10G-Serverports zu zerlegen. Dieses Verfahren bietet große Skalierbarkeit, da so auch die Anzahl der Gehäuse und Höheneinheiten im Netzwerkschrank deutlich reduziert werden kann. Stromkosten lassen sich auf diese Weise um bis zu 30 Prozent für den Einsatz von Singlemode-Fasern senken und auch der Platzbedarf verringert sich merklich.

Auch die einfache Migration spricht für diese Variante: Die Technologie-Roadmaps der großen Switch- und Transceiver-Hersteller zeigen, dass ihre Kunden einfach auf die nächste Stufe der Datenübertragung migrieren können, wenn diese verfügbar ist, ohne die Glasfaserinfrastruktur auszutauschen. Bei einer 2-faser basierten Infrastruktur hingegen können sie nicht sicher sein, ob eine entsprechende WDM-Optik bereits verfügbar ist, wenn sie auf 100G oder höhere Geschwindigkeiten migrieren möchten. Businesschancen, die an die Leistungsfähigkeit des Rechenzentrums geknüpft sind, ziehen dann vielleicht ungenutzt vorüber.

Zusammengefasst lässt sich festhalten: KI hat das Potenzial, unsere Welt nachhaltig zu verändern – aber ohne entsprechende Rechenzentren werden viele Visionen, die manch einer aus Hollywood kennt, nie umgesetzt werden. Ein engmaschiges Glasfasernetz, verbunden mit ausreichender Bandbreite und die Kommunikation in Ost-West-Richtung stellen eine wichtige Grundlage für das zukunftsfähige Rechenzentrums-Design dar. Singlemode-Fasern und parallel-optische Übertragung bieten in einem KI-Umfeld die besten Möglichkeiten.

Tony Robinson, Corning Incorporated

