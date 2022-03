Bei der Forschung in Gebieten wie Materialwissenschaften, Mobilität, Energie, Medizin oder Umwelt kommen die schnellsten Hochleistungsrechner der Welt zum Einsatz, um natürliche und technische Prozesse in ihrer gesamten Komplexität bis ins Detail zu verstehen. Als Mitglied des Verbunds Nationales Hochleistungsrechnen (NHR) bietet das Nationale Hochleistungsrechenzentrum am Karlsruher Institut für Technologie (NHR@KIT) Forschenden aus ganz Deutschland Supercomputing-Ressourcen und ein breites Spektrum an unterstützenden Dienstleistungen.

Methoden und Algorithmen aus den Bereichen der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) nehmen in der modernen Wissenschaft eine zunehmend wichtigere Rolle ein. Für das erfolgreiche Anwenden dieser Methoden wird ein sehr hohes Maß an Rechenleistung benötigt. Da die Leistung herkömmlicher Prozessoren hierfür meistens nicht ausreicht, setzen viele Betreiber wissenschaftlicher Rechenzentren auf spezielle Beschleunigerprozessoren, um höhere Verarbeitungsgeschwindigkeiten und mehr Energieeffizienz zu erreichen.

Als erstes wissenschaftliches Hochleistungsrechenzentrum in Deutschland bietet das NHR@KIT als weiteres System einen Graphcore IPU-POD16 Server in seiner Hardware- und Software-Testumgebung Future Technologies Partition an. Die Future Technologies Partition ermöglicht es Forschenden, ihre wissenschaftlichen Anwendungen auf eine breite Palette neuester, innovativer und bahnbrechender Hardware-Architekturen und -Technologien, die noch nicht Teil der größeren Produktionssysteme sind, zu portieren sowie diese dann dort zu testen und auszuführen.

Durch das Multiple-Instruction Multiple-Data (MIMD) Design der Graphcore IPU (Intelligence Processing Unit) kann beim Training von KI-Modellen eine detailliertere Parallelität über mehrere Dimensionen hinweg erreicht werden. Diese neue Prozessorarchitektur eignet sich für eine breite Palette neuer und aufkommender Berechnungsverfahren in der KI, wie Sparse Data Structures. Bei solchen Datenstrukturen können Informationen nicht in dichten, zusammenhängenden Blöcken verarbeitet werden. Das breitere Spektrum der KI-zentrierten Fähigkeiten der IPU ermöglicht es KI-Forschenden, neue Ansätze zur Problemlösung zu erforschen, die mit anderen Technologien nicht möglich sind.

»Das Karlsruher Institut für Technologie war schon immer ein Vorreiter in Sachen Innovation, da wir unseren Benutzern die Tools und Technologien zur Verfügung stellen, die neue Berechnungsverfahren ermöglichen«, sagte Simon Raffeiner, stellvertretender Leiter HPC-Betrieb, Karlsruher Institut für Technologie (KIT). »Graphcore Systeme, die mit der Intelligence Processing Unit ausgestattet sind, wurden speziell für den KI/ML-Bereich entwickelt, um ein breiteres Spektrum an Anwendungen und Ansätzen abzudecken, als dies derzeit möglich ist. Die IPU-Technologie schränkt die Ambitionen unserer Forschenden nicht ein, sondern ermutigt sie vielmehr, Feldforschungen voranzutreiben.«

Das beim NHR@KIT installierte Graphcore IPU-POD16 System bietet mit seinen 16 IPUs vier PetaFLOPS (FP16) KI-Rechenleistung sowie 1.038,4 GB Gesamtspeicher, davon 14,4 GB prozessorinternen Speicher. Die Installation des Systems erfolgte durch den Graphcore Elite Partner MEGWARE.

Das Graphcore Poplar SDK unterstützt alle wichtigen KI-Frameworks wie TensorFlow, PyTorch, PyTorch Lightning, Hugging Face, Keras, ONNX oder PaddlePaddle. So können bestehende KI-Modelle problemlos von anderen Rechenplattformen auf IPUs portiert werden.

Forschende aus ganz Deutschland können ihre Projektvorschläge zur Nutzung der Ressourcen am NHR@KIT einreichen, um so direkten und dedizierten Zugang zum Graphcore System zu erhalten. Es können zwei verschiedene Arten von Projektvorschlägen eingereicht werden: Testprojekte können zum Testen, Portieren, Entwickeln oder für das Benchmarking von Anwendungen genutzt werden und werden nach einem Lightweight-Prüfprozess genehmigt. Komplettprojekte mit einem Umfang von mehreren zehn Millionen CPU-Stunden werden vom Scientific Steering Committee geprüft. Während der Prüfung der Projektvorschläge kann ein vorläufiger Systemzugang für Einrichtungs- und Testzwecke gewährt werden.

