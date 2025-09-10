Viele Unternehmen verbinden mit organisatorischer Resilienz den Schutz vor Störungen wie physischen Systemausfällen, Naturkatastrophen oder Cyberbedrohungen. Im Mittelpunkt steht dabei meist die Cybersicherheit. Zwar betrachten laut Deloitte 79 Prozent der Führungskräfte Resilienz als hohe Priorität. Dennoch besitzen nur 39 Prozent eine klare Vorstellung davon, was diese Widerstandsfähigkeit für ihr Unternehmen überhaupt bedeutet. Wichtig zu wissen: Bei organisatorischer Resilienz geht es nicht nur um Prävention, sondern auch um die Aufrechterhaltung des Geschäftsbetriebs nach Systemausfällen.

In den vergangenen 20 Jahren mussten Resilienzstrategien häufig von der Hardware- auf die Softwaresicht angepasst werden. Dabei wurden viele traditionelle Ansätze auf neue Technologien zugeschnitten. Zu den gängigen Strategien zählen N+1- und 2N+1-Redundanz. Hierbei werden Workloads entweder auf einem System mit einem zweiten als Backup oder auf zwei Systemen mit einem dritten als Backup ausgeführt. Dies soll einzelne Fehlerquellen beseitigen und den Betrieb aufrechterhalten, falls Infrastrukturkomponenten ausfallen.

In hybriden Cloud-Umgebungen bedarf es jedoch eines umfassenderen Ansatzes für die organisatorische Resilienz, der einen vollständigen Überblick über alle potenziellen Bedrohungen bietet. Diesen Weg schlagen Regulierungsbehörden seit einiger Zeit mit einem »All-Hazards-Ansatz« ein. Dazu zählen Vorschriften wie das EU-Gesetz über die digitale operative Resilienz (DORA) für den Finanzsektor, die Richtlinie 2 über die Netz- und Informationssicherheit (NIS2) für kritische Infrastrukturen sowie das Gesetz über Cyberresilienz (CRA) für Produktsicherheit.

KI begünstigt neue Cyberbedrohungen

Cyberkriminalität ist die vorrangige Bedrohung, gegen die sich Unternehmen derzeit mit Millioneninvestitionen schützen. Entsprechende Angriffsszenarien werden vor dem Hintergrund der aktuellen Entwicklung von künstlicher Intelligenz (KI) immer komplexer. Denn KI-Systeme vergrößern die Angriffsflächen und ebnen gleichzeitig den Weg für neue und immer raffiniertere Bedrohungen, was die Cybersicherheit vor große Herausforderungen stellt. Darüber hinaus erfordern KI-abhängige Infrastrukturen robuste Cyberresilienz-Frameworks. Diese müssen nicht nur Daten, sondern auch die Integrität autonomer Entscheidungssysteme schützen. Letztere gewinnen mit agentenbasierter KI zunehmend an Bedeutung.

Befinden sich diese Systeme in einer Hybrid-Cloud-Umgebung, können Public-Cloud-Anbieter nicht immer robuste Sicherheitsmaßnahmen gewährleisten. Daher sollten Unternehmen selbst Sorge für eine maximale Sicherheit tragen. Dabei muss jeder einzelne Workload eine integrierte Resilienz über mehrere Schichten der Architektur hinweg bieten. Hierfür bedarf es einer zuverlässigen Lösung, die umfassend schützt, zentral gesteuert wird und unabhängig von der Cloud-Lösung innerhalb der eigenen Technologieinfrastruktur arbeitet. Wichtig sind dabei regelmäßige Simulationsszenarien, um die Lösung zu testen. Nur so lässt sich sicherstellen, dass sie tatsächlich in vollem Umfang und auch unter Echtzeitbelastung reibungslos funktioniert. Dies ist nicht mehr nur eine bewährte Sicherheitspraxis. Für einige Branchen wurde es mittlerweile sogar zu einer gesetzlichen Anforderung, wie aus der DORA und den begleitenden technischen Regulierungsstandards (RTS) hervorgeht.

Globale Ereignisse gefährden Technologielandschaft

Ein weiterer wichtiger Aspekt der Resilienz ist der Einfluss von Faktoren, die über Cyberangriffe hinausgehen. Beispielsweise werden geopolitische Spannungen zu einer immer ernsteren Bedrohung für die weltweite Technologielandschaft. So führen globale Konflikte nicht nur zu regionaler Instabilität, sondern können auch Unterbrechungen der Lieferketten und im Extremfall sogar die Abschottung ganzer Regionen zur Folge haben. Hierfür benötigen Unternehmen wirksame Strategien, mit denen sich Workloads schnell und ohne Compliance-Einschränkungen verlagern lassen. Zudem können unterbrochene Lieferketten die Verfügbarkeit von bestimmter Hardware kurzfristig einschränken.

Dabei fragmentiert sich die globale Regulierungslandschaft auf regionaler Ebene weiter. Wie die jüngste Einführung von Handelszöllen zeigt, können weltweite regulatorische Unterschiede nicht nur erhebliche Kosten nach sich ziehen. Auch kann eine weitreichende organisatorische Umstrukturierung von Unternehmen in den betroffenen Regionen erforderlich werden. Hinzu kommt: Die Resilienz von Organisationen sollte auch potenzielle künftige regulatorische Änderungen berücksichtigen. Ein Beispiel: Zwar werden die DORA und die dazugehörigen RTS seit Jahren weiterentwickelt. Dennoch könnte eine Version der entsprechenden Gesetzgebung für den Finanzsektor in anderen EU-Ländern mit besonderen regionalen Merkmalen viel schneller entstehen und in Kraft treten. Dies würde die Implementierung robuster digitaler Rahmen für die Risikobewertung auf lokaler oder regionaler Ebene mit klaren Governance-Strukturen erfordern. Gleichzeitig müssten umfassende reaktive Maßnahmen vorbereitet werden, welche die Einhaltung der Vorschriften dokumentieren. Sovereign-Cloud-Lösungen können hier zu mehr Resilienz beitragen. Sie ebnen den Weg für kontinuierliche Innovationen und gewährleisten zudem die Einhaltung gesetzlicher Vorschriften.

Interne Resilienz-Faktoren überprüfen

Auch gibt es eine Reihe interner Faktoren, die sich auf die operative Resilienz eines Unternehmens auswirken können. Hier lohnt beispielsweise ein Blick in Technologieverträge und die darin enthaltenen Bedingungen und Klauseln. Wichtig ist, dass Workloads plattformunabhängig implementiert und verwaltet werden. Nur so lassen sich maximal flexible und anpassungsfähige Systeme gewährleisten. Darüber hinaus sollte die Bedeutung der Portabilität für bestimmte Workloads berücksichtigt werden.

Wichtig ist auch die kontinuierliche Weiterbildung der Mitarbeitenden. So schaffen Investitionen in eine umfassende Kompetenzentwicklung ein hohes Maß an organisatorischer Resilienz: Denn vielseitig geschultes Personal kann effektiv auf unterschiedliche Herausforderungen reagieren und einzelne Fehlerquellen beseitigen. Diese Strategie erhöht die Teamkompetenzen, fördert die Anpassungsfähigkeit, verbessert die Reaktion auf Vorfälle und entwickelt eine kollektive Intelligenz. Das macht den Weg frei für eine schnellere Wiederherstellung von Systemen nach Störungen.

Mit flexiblen Plattformen Disaster Recovery sicherstellen

Der Aufbau eines robusten, integrierten 2N+1-Stacks oder die Aufteilung auf zwei Tier-4-Rechenzentren reicht für die heutigen Anforderungen an die Ausfallsicherheit nicht mehr aus. In einigen Branchen kann damit nicht einmal mehr die Compliance gewährleistet werden. Unternehmen sollten daher auf Plattformen zurückgreifen, mit denen sich die Business Continuity und Disaster Recovery verlässlich sicherstellen lässt. Solche Lösungen bieten die nötige Flexibilität, um kritische Workloads über mehrere Cloud-Umgebungen hinweg auszuführen und bei Bedarf schnell zwischen diesen zu wechseln. IT-Teams müssen außerdem Sorge tragen, dass diese Plattformen über integrierte Disaster-Recovery- und Failover-Funktionen verfügen. Auf diese Weise bleiben kritische Anwendungen auch im Falle einer Störung stabil verfügbar.

Im Wesentlichen sind Unternehmen gefordert, die Systemabhängigkeiten gründlich zu dokumentieren und ihre Plattformen sowie Anwendungsarchitekturen möglichst ausfallsicher zu gestalten. Zudem muss eine nahtlose Funktionsweise in verschiedenen Umgebungen gewährleistet sein. Mit solchen Lösungen sollte sich ein reibungsloser Übergang von Workloads zwischen privater Infrastruktur, öffentlichen Cloud-Anbietern und Edge-Standorten realisieren lassen. Darüber hinaus sind Single Points of Failure zu verhindern, die den Betrieb bei Ausfällen beeinträchtigen könnten. Wichtig sind auch automatisierte Failover-Mechanismen, die den Systemzustand kontinuierlich überwachen und bei der Erkennung von Problemen die Verarbeitung schnell umleiten. Dies sollte sich mit nur minimalen manuellen Eingriffen umsetzen lassen. Ist dennoch eine menschliche Intervention erforderlich, bedarf es eines zuverlässigen Partner-Netzwerks. Ein solches kann als kompetente Ergänzung des internen Teams fungieren und qualifizierte Beratung sowie wertvolle Einblicke von außen bieten.

Dieser umfassende Ansatz für Resilienz kombiniert verteilte Computing-Umgebungen mit automatisierten und intuitiven Recovery-Systemen. Unternehmen profitieren dadurch mehrfach: Sie erreichen eine echte Betriebskontinuität, die Cyberbedrohungen ebenso abdeckt wie größere Störungen. Gleichzeitig lässt sich damit eine kontinuierliche Überwachung der Systeme sicherstellen.

Björn Brundert, CTO DACH bei Broadcom

