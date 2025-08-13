Jeff Wittich, Chief Product Officer bei Ampere weiß: Angesichts der steigenden KI-Nachfrage sind sowohl die Leistung pro Watt als auch die Rack-Dichte in Zukunft entscheidend. Sie helfen dabei, dem ausuferndem Infrastrukturwachstum entgegenzuwirken und den Verbrauch von Wasser und Energie deutlich zu senken.

Der aktuelle Sommer in Europa ist zu einer Herausforderung geworden. Hitzewellen, die Rekorde brechen, und anhaltende Dürreperioden setzen Wasser- und Energieversorger zunehmend unter Druck. Regierungen sind gezwungen, schwere Entscheidungen zu treffen und schränken Rechenzentren, die sich inmitten einer Expansionsphase befinden, mit neuen Regelungen ein.

Aufgrund ihres zunehmenden Energie- und (Kühl-) Wasserbedarfs hat die EU Rechenzentren erst kürzlich als Teil des Problems bezeichnet. Da KI-Workloads immer weiter zunehmen, ist damit zu rechnen, dass der Druck noch weiter steigt. Es geht weniger darum, ob der Bedarf an Rechenleistung wachsen wird. Vielmehr geht es um die Frage, wie man dieses Wachstum ohne zusätzliche Umweltbelastung unterstützt.

Eine der naheliegendsten Antworten: leistungsfähigere Rechenzentren.

Wenn jedes Watt Strom und jedes Rack mehr Arbeit leisten kann, müssen weniger Rechenzentren gebaut werden, um die Nachfrage zu decken. Das führt direkt zu weniger Flächenverbrauch, geringerem Strombedarf und weniger Wasserverbrauch für die Kühlung. Der Weg zu nachhaltiger Infrastruktur besteht somit nicht nur darin, sauberere Energiequellen zu nutzen oder bessere Kühlsysteme zu entwickeln. Es geht auch darum, den physischen Fußabdruck der Rechenleistung selbst zu reduzieren.

Derzeit ist jedoch das Gegenteil in der Branche zu beobachten. Der KI-Boom treibt Organisationen zu größeren Clustern und Installationen, oft mit hochspezialisierter Hardware, die heiß läuft und enorme Energiemengen verbraucht. Wenn die Effizienz nicht Schritt hält, bleibt als einziger Skalierungsweg der fortlaufende Ausbau, dessen ökologische Kosten zunehmend offensichtlich werden.

Dabei handelt es sich allerdings nicht um ein Zukunftsproblem. In Teilen Europas werden Genehmigungen für neue Rechenzentren aufgrund von Stromengpässen und Widerstand aus der Bevölkerung bereits verzögert oder abgelehnt. Angesichts der Sorge um fehlende Stromkapazitäten pausiert zum Beispiel ein irischer Netzbetreiber bis 2028 alle neuen Data-Center-Verbindungen in Dublin und Umgebung [1]. Die lokalen Behörden haben Anträge sogar wegen der unzulänglichen Energieinfrastruktur direkt abgewiesen. Vor diesem Hintergrund ist Infrastruktureffizienz nicht länger nur ein technisches Ziel, sondern auch eine zentrale Voraussetzung für wirtschaftliche und politische Entscheidungen.

Anstatt auf die Optimierung einzelner Chips zu setzen, sollte sich die Branche vor allem auf die Leistung pro Watt – und zwar über komplette Racks und Systeme hinweg – konzentrieren. Diese Art von Effizienz schafft Flexibilität. Sie ermöglicht es Cloud- und KI-Anbietern, innerhalb bestehender Flächen zu skalieren, in eingeschränkten Umgebungen zu agieren und neue Umwelt- und Regulierungsprobleme zu vermeiden.

Konkret bedeutet das, Rechenarchitekturen neu zu denken, um die Leistung pro Watt durch moderne Prozessorinnovationen zu maximieren. Gleichzeitig müssen Workloads neu ausbalanciert und Systeme so zu gestaltet werden, dass Durchsatz mit thermischer und energetischer Sensibilität einhergeht. Effizienz darf kein Nebeneffekt mehr sein. Sie muss zum primären Ziel werden.

Je mehr wir aus jedem Watt und jedem Quadratmeter herausholen, desto weniger Rechenzentren müssen gebaut werden. Und je weniger Rechenzentren wir bauen, desto geringer ist die Belastung für Wasser- und Energieversorgung in den Regionen, die wir bedienen.

Um die nächste Ära digitaler Services zu unterstützen, müssen wir von der einfachen Expansion der Infrastruktur zu ihrer Optimierung übergehen – angefangen mit der Rechenleistung selbst.

Steigerung der Rechenleistung bei geringerem Flächenverbrauch in Rechenzentren

Performance pro Watt optimieren

Rechenzentren setzen zunehmend auf Prozessoren und Beschleuniger (CPUs, GPUs, TPUs, ARM-basierte Server), die mehr Berechnungen je Watt leisten. Hersteller wie Ampere haben spezialisierte Chips entwickelt, die bei gleicher Leistungsaufnahme deutlich höhere Durchsätze erzielen. Durch diese Effizienz lassen sich weniger Racks einsetzen und gleichzeitig der Energiebedarf senken.

Höhere Rack- und Gerätedichte

Anstelle herkömmlicher 1U- oder 2U-Server kommen heute ultradichte Blade- und Micro-Blade-Systeme zum Einsatz. Diese bündeln mehrere Recheneinheiten auf engem Raum, optimieren Stromverteilung und Verdrahtung und erreichen Rack-Dichten von über 40 kW pro Rack statt früher 5–10 kW.

Fortschrittliche Kühlsysteme

Flüssigkühlung (Direct-to-Chip): Kühlmittel wird direkt an CPUs und GPUs geführt, statt durch Luftzirkulation.

Immersionskühlung: Servergehäuse tauchen in nichtleitende Flüssigkeit, die Abwärme effizienter abtransportiert.

Hot-/Cold-Aisle-Containment: Strikte Trennung von kalter Zu- und warmer Abluft erhöht Kühlleistung bei geringerem Luftvolumen.

Diese Methoden reduzieren den Platzbedarf für Klimatisierungsgeräte und sparen Wasser sowie Energie.

Virtualisierung und Auslastungsoptimierung

Durch Virtualisierung (VMs, Container) und intelligente Orchestrierungssysteme (Kubernetes, OpenStack) werden unterausgelastete Server vermieden. Dynamisches Workload-Placement stellt sicher, dass Hardware nur bei Bedarf hochgefahren wird, wodurch die Zahl physischer Hosts rückläufig ist.

Software-Defined und Composable Infrastructure

Software-Defined Networking (SDN) und Software-Defined Storage (SDS) entkoppeln Rechenleistung, Netzwerk und Speicher. Composable-Systeme erlauben, Ressourcen on-the-fly zusammenzustellen und nach Ende der Nutzung wieder zu zerlegen – ideal für KI-Workloads mit variierenden Anforderungen.

Modulare Bauweise und 3D-Packaging

Modulare Rechenzentrums-Boxen (Pods) lassen sich vertikal stapeln und erweitern, ohne komplette Hallen umzubauen. Auf Chip-Ebene kommen 3D-Stapelung (Chiplets) und Co-Packaging von Logik- und Speicherkomponenten zum Einsatz, um die Leiterplatten-Fläche zu minimieren.

Standortwahl & Free Cooling

Rechenzentren verlagern sich in kühler gelegene Regionen (Nordskandinavien, Küstenzonen), um Außenluft direkt zu nutzen (Free Cooling). Dadurch schrumpft der Platz für HVAC-Infrastruktur und der Strombedarf für Klimaanlagen sinkt deutlich.

Mit diesen Maßnahmen erzielen Betreiber eine deutlich höhere Rechenleistung pro Quadratmeter und pro Watt, während sie gleichzeitig Kosten, Energie- und Wasserverbrauch reduzieren. Möchtest du tiefer in einzelne Technologien wie Immersionskühlung oder composable Infrastruktur eintauchen?

Genki Absmeier

