Hochverfügbarkeit und Ausfallsicherheit: So finden Unternehmen das für ihre Anforderungen und ihr Budget passende Konzept

Beim Thema Ausfallsicherheit und Hochverfügbarkeit stehen Unternehmen oftmals im Spannungsfeld zwischen dem Wunsch nach absoluter Sicherheit und begrenzten IT-Budgets. Um ein passendes Konzept zu finden, rät der IT-Dienstleister Consol in vier Schritten vorzugehen – von der Risikoanalyse bis hin zur technischen Umsetzung.

Eine hochverfügbare und ausfallsichere IT-Infrastruktur ist für die meisten Unternehmen genauso notwendig wie kostspielig. Unternehmen müssen Risiken richtig einzuschätzen, ein für ihre Anforderungen und ihr Budget passendes Konzept finden und dieses umsetzen. Dabei gilt es herauszufinden, welche IT-Komponenten welche Absicherungsstufe benötigen und wie diese technisch realisiert werden kann. Grundsätzlich rät der IT-Dienstleister zu einer analytischen Herangehensweise. Sie sollte alle betroffenen Systeme, die darauf abgebildete Geschäftslogik sowie die vorhandene Organisation berücksichtigen.

Henning von Kielpinski, Head of Business Development, consol

»Bei Hochverfügbarkeit und Ausfallsicherheit variieren die Anforderungen und Risiken in Unternehmen erheblich. Unterbrechungen und Ausfälle, die für das eine Unternehmen durchaus akzeptabel sein können, sind für ein anderes hochgradig geschäftskritisch«, weiß Henning von Kielpinski, Head of Business Development bei Consol. »Um für jedes Unternehmen das passende Konzept zu finden, sollte eine Risikoanalyse und -bewertung immer am Anfang eines Projekts stehen. Die technische Lösung kommt zum Schluss.«

 

Leitfaden Risikobewertung: Die folgenden Schritte helfen Firmen dabei

 

  1. Risiken gruppieren

Alle Anwendungen und Prozesse im Unternehmen sollten zunächst in unterschiedliche Risikogruppen eingeteilt werden. Firmen sollten sich dazu fragen: Was sind die Folgen eines möglichen Systemausfalls oder einer Verzögerung? Welche Schäden entstehen für das Unternehmen? Die Bandbreite dabei ist vielfältig und reicht von Imageeinbußen, Produktionsstopps, Kunden- und Datenverlusten bis hin zu Strafzahlungen durch die Nicht-Einhaltung von Service Level Agreements oder Lieferfristen.

 

  1. Risiken bewerten

Im zweiten Schritt sollten die Risiken aus technischer Sicht untersucht und bewertet werden: Wodurch kann ein Ausfall entstehen? Wie wahrscheinlich ist ein solcher? Wann ist er wahrscheinlich? Welche angrenzenden Anwendungen und Systeme sind betroffen? Hier hilft es, möglichst viele unterschiedliche Szenarien durchzuspielen.

 

  1. Risikogruppen priorisieren

Anschließend geht es darum, die definierten und bewerteten Risiken nach Prioritäten zu sortieren. Welche Ausfälle kann das Unternehmen unbeschadet in Kauf nehmen, welche müssen zu 100 Prozent abgesichert sein? Wo ist beispielsweise eine zeitliche Verzögerung erlaubt, wo muss der Betrieb komplett unterbrechungsfrei ablaufen? Dabei gilt pauschal: Je kritischer und individueller die Informationen und Prozesse und je vernetzter die Systeme, desto mehr ist auf die Absicherung des unterbrechungsfreien Betriebs zu achten.

 

In der Praxis hat sich eine grobe Teilung in drei Hochverfügbarkeitsstufen bewährt:

 

  1. Die manuelle Hochverfügbarkeit macht manuelles Eingreifen, zum Beispiel ein Server-Reboot, und damit die Anwesenheit einer Person, meist eines IT-Administrators, erforderlich. Eine Unterbrechung schadet nicht oder kaum.
  2. Bei der normalen Hochverfügbarkeit wird die Fehlerbehebung automatisch angestoßen; eine kurze zeitliche Verzögerung ist akzeptabel.
  3. Bei der unterbrechungsfreien Hochverfügbarkeit oder Zero Downtime müssen oftmals nicht nur die Systeme, sondern auch die Kongruenz der Informationen abgesichert werden. Zero Downtime ist überall dort gefordert, wo die permanente Erreichbarkeit und das ständige Funktionieren der IT unbedingt notwendig sind.

 

Technische Umsetzung

Erst im letzten Schritt wird die technische Lösung ermittelt, die den Anforderungen am besten gerecht wird. Lösungsansätze für die normale Hochverfügbarkeit sind zum Beispiel das Clustering oder Clustering mit Load Balancing, für Zero Downtime zum Beispiel Routing-Verfahren, Reverse Proxies, DNS (Domain Name System) oder IP Round Robin.

___________________________________

www.consol.de

 

Weitere Artikel zu