Tuning für KI: Optische neuronale Netze werden durch neuen Laser kleiner und effizienter

Illustration Absmeier Genki Bing ©

Erste experimentelle Demonstration zeigt deutliche Überlegenheit gegenüber herkömmlichen Computerchips.

 

Ein Forschungsteam der TU Berlin und des Massachusetts Institute of Technology (MIT) in den USA hat den weltweit ersten Chip entwickelt, auf dem mit Hilfe eines »VCSEL«-Lasersystems das neuromorphe Rechnen mit Licht realisiert wird. Die Chiparchitektur bildet dabei ein »neuronales Netz«, eine Methode der künstlichen Intelligenz (KI), die sich am menschlichen Gehirn orientiert und zum Beispiel der Anwendung ChatGPT zugrunde liegt. Erste bahnbrechende Experimente ergaben, dass der Chip 100-mal energieeffizienter ist und 20-mal mehr Rechenpower pro Fläche besitzt als die besten elektronischen Digitalprozessoren. Mit auf dieser Technik basierenden optischen neuronalen Netzen könnten nicht nur Anwendungen wie ChatGPT einen Sprung in ihrer Leistungsfähigkeit machen – auch der Einsatz von KI in kleinen Endgeräten wie Smartphones wäre damit möglich.

 

Das Rechnen mit Elektronen ist an seine Grenzen gelangt. Das in Fachkreisen berühmte Mooresche Gesetz, nach dem sich alle zwei Jahre die Rechenleistung von Computerchips verdoppelt, gilt seit einigen Jahren nicht mehr. Grund dafür ist neben bestimmten Problemen in der allgemeinen Computerarchitektur ein physikalisches Limit: Die zentralen Bausteine von Mikrochips, die Transistoren, lassen sich aus thermodynamischen Gründen nicht beliebig schnell und gleichzeitig energieeffizient schalten. »Die besten kommerziell erhältlichen Chips haben dieses Limit praktisch schon erreicht«, sagt Prof. Dr. Stephan Reitzenstein, Leiter der Arbeitsgruppe »Optoelektronik und Quantenbauelemente« an der TU Berlin.

 

Künstliche Intelligenz ist bisher durch die Elektronik limitiert

Diese physikalische Grenze für die auf Stromfluss basierenden Mikrochips schränke auch die Entwicklung von KI-Anwendungen fundamental ein, erklärt Reitzenstein. »Um etwa mächtigere neuronale Netze zu bauen, können wir nicht einfach mehrere Supercomputer zusammenschalten. Wir brauchen dazu ein kompaktes, leistungsfähiges Gesamtsystem.« Einen Ausweg hat die Wissenschaft bereits gefunden: Weltweit forschen Arbeitsgruppen am Rechnen mit Licht. Statt Elektronen werden dabei Lichtteilchen, die Photonen, durch lichtleitende Materialien und Strukturen in den Chips geführt. Über physikalische Effekte können sie sich gegenseitig beeinflussen und so mathematische Operationen mit hoher Geschwindigkeit und auf kleinem Raum ermöglichen. Für die KI besonders interessant sind hier die optischen neuronalen Netze (ONN). Für diese werden die künstlichen Neuronen als Strukturen bereits auf dem optischen Chip angelegt.

 

Bessere optische neuronale Netze mit kompaktem Laser

Bislang gab es bei den ONN allerdings mehrere Herausforderungen. So war die Umwandlung von elektrischen Eingangssignalen in Licht sehr energieaufwändig. Zudem waren die verwendeten Laser – im Gegensatz zu den optischen Strukturen – verhältnismäßig groß und benötigten daher zu viel Raum. Und schließlich waren die optischen Rechner bei bestimmten mathematischen Operationen nicht so stark. »All diese Probleme konnten wir mit der Verwendung eines VCSEL-Lasersystems lösen«, berichtet Stephan Reitzenstein. Die Abkürzung VCSEL steht dabei für »Vertical Cavity Surface Emitting Laser«. Diese Miniatur-Laser sind nur etwa zehn Mikrometer im Durchmesser groß (ein Hundertstel Millimeter) und schichtartig aufgebaut. »Ein Laser erzeugt seine energiereichen und parallelen Lichtstrahlen dadurch, dass er sie mit Spiegeln mehrfach durch einen Resonatorraum mit einem optisch aktiven Medium schickt. Ein VCSEL besitzt mehrere Schichten von teilreflektierenden Materialien, die zusammen fast alle Lichtstrahlen wieder in den Resonator zurückspiegeln – dadurch ist er sehr energieeffizient«, erklärt Reitzenstein. Zudem kann ein VCSEL in einem »nichtlinearen« Zustand betrieben werden, in dem er sehr empfindlich selbst auf kleinste Eingangsimpulse reagiert und damit für alle mathematischen Herausforderungen gerüstet ist.

 

Große Erfahrung an der TU Berlin mit VCSEL-Lasersystemen

VCSEL kommen heute bereits als Lichtquelle in Telekommunikationsnetzen und für die Gesichtserkennung in Smartphones zum Einsatz – und sie wurden an der TU Berlin mitentwickelt und haben bereits zu erfolgreichen Ausgründungen geführt. »Aufbauend auf diesem Know-how haben wir die VCSEL für den Einsatz in einem ONN-Chip angepasst und optimiert«, sagt Reitzenstein. Dabei kam es darauf an, eine möglichst hohe Lichtausbeute zu erreichen und die Anordnungen von jeweils 25 VCSEL auf einem Chipsegment auf eine exakt gleiche Lichtwellenlänge zu bringen. Das zugrundeliegende Wafer-Material hat James A. Lott, ehemaliger Gastprofessor an der TU Berlin, entworfen, und Tobias Heuser hat die VCSEL-Bauelemente als Doktorand in der Gruppe von Stephan Reitzenstein entwickelt und hergestellt.

 

Erste Tests mit überragenden Ergebnissen

In Zusammenarbeit mit der Arbeitsgruppe von Dirk Englund am MIT in Boston, deren Forschende bereits 2019 das Konzept für die Anwendung der neuen Chips im neuromorphen Computing theoretisch beschrieben hatten, wurden erste Experimente mit den neuen ONN durchgeführt. Als Testaufgabe für die KI wählte das Team die Erkennung von handgeschriebenen Zahlen. Das Ergebnis: Die neuen Chips sind 100-mal energieeffizienter und können 20-mal mehr Rechenpower pro Fläche bereitstellen als die besten elektronischen Digitalprozessoren. »Durch eine relativ leicht zu realisierende Erhöhung der Taktfrequenz der Laser könnten diese Werte vermutlich noch einmal um den Faktor 100 gesteigert werden«, erklärt Stephan Reitzenstein. Bis KI auf Basis dieser Erfindung tatsächlich in Smartphones eingebaut werden kann oder Anwendungen wie ChatGPT einen Sprung in der Leistungsfähigkeit ermöglicht, müssen jetzt allerdings diese im Bereich der Grundlagenforschung gewonnenen Ergebnisse industriell umgesetzt werden. Da von den Forschenden aber nur etablierte Herstellungsverfahren für ihre Prototypen benutzt wurden, sollte dies in wenigen Jahren möglich sein.

 

 

»Deep learning with coherent VCSEL neural networks«, Nature Photonics, Volume 17, 08/2023, 723–730

https://www.nature.com/articles/s41566-023-01233-w