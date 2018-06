Umbrella-Monitoring ist ein ganzheitlicher Lösungsansatz, mit dem über Jahre gewachsene heterogene Monitoring-Insellösungen durch ein übergeordnetes, einheitliches und umfassendes Monitoring zusammengeführt werden. Damit lassen sich nicht nur die Betriebs- und Systembetreuungskosten senken, sondern vor allem auch das Risiko von Systemausfällen und Compliance-Verletzungen minimieren.

Ohne IT geht nichts mehr in der heutigen Wirtschaft. Das Rückgrat für funktionierende, automatisch ablaufende Geschäftsprozesse bildet das perfekte Zusammenspiel moderner Anwendungen, Datenbanken und Netzwerkgeräte. Doch inzwischen ist es eine zentrale Herausforderung, die ebenso komplexen wie dynamischen Tech-Ökosysteme zu managen.

Ein umfassendes und einheitliches Monitoring ist ein wichtiger Schlüssel, um diese Komplexität zu beherrschen. Geschäftstransaktionen, Applikationen und die Infrastruktur müssen souverän gesteuert werden. Für deren Überwachung werden in der unternehmerischen Praxis häufig mehrere, nicht integrierte Lösungen eingesetzt. Nicht selten finden sich bei großen, international agierenden Organisationen bis zu 20 solcher isolierten Überwachungssysteme. Diese sind meist – analog zur Ausweitung der IT-Infrastruktur – historisch gewachsen.

Ursachenfindung im Störungsfall erschwert. In der Praxis führt die Konstellation parallel laufender Inselsysteme nicht nur zu signifikanten Mehraufwänden für den redundanten Betrieb mehrerer Tools. Der im Ernstfall so wichtige systemübergreifende 360-Grad-Blick ist bei diesem »Silo-basierten« Überwachungsansatz nicht gegeben. Die Folgen können gravierend sein. Denn die Ursachenfindung gestaltet sich in der Regel schwierig und ist sehr zeitraubend. Die Störungsbehebung verzögert sich, da die einzelnen Systemadministratoren zunächst ihre eigenen Ansichten überprüfen. Außerdem lässt sich der Schweregrad einer Störung und die Auswirkung auf die Kunden beziehungsweise das Business – isoliert betrachtet – meist nicht richtig einschätzen.

Was eine ideale Lösung leisten sollte. Umbrella-Monitoring ist ein ganzheitlicher Lösungsansatz, mit dem über Jahre gewachsene heterogene Monitoring-Insellösungen durch ein übergeordnetes, einheitliches und umfassendes Monitoring zusammengeführt werden. Eine gute Lösung bietet die nötige 360-Grad-Informationstransparenz und liefert den Systemadministratoren und den IT-Verantwortlichen in Echtzeit alle Daten, um physikalische und virtuelle Ressourcen sowie die Integration von Cloud-Applikationen und Cloud Services unterschiedlichster Anbieter in die eigene IT-Infrastruktur erfolgreich planen und steuern zu können. Zusätzliche Alarmierungsfunktionen sorgen im Störungsfall für automatisierte Fehlerbehebung.

Voraussetzung für ein effizient funktionierendes Umbrella-Monitoring ist die Integrationsfähigkeit des Systems. Vielfältige Schnittstellen bilden die Basis und stellen den Sammelpunkt für unterschiedlichste Daten dar. Beispiele hierbei sind Zustandsinformationen aus der Server-Überwachung und vorgelagerter Management-Tools, die Überwachungsdaten von Großrechnern, Cloud Services, Docker Container oder die Informationen weiterer Fremdsysteme wie beispielsweise Gebäudeleittechnik, USV- und Klimatechnik, Brandmeldezentrale oder Sensoren. Die zu messenden Parameter sind vielfältig, etwa Temperatur, Lüfterdrehzahl, Speicherbelegung, Speicherverfügbarkeit etc. Ausgewertet wird das gesamte Spektrum physikalischer, prozessualer und anwendungsbezogener Daten.

Entscheidend in der Praxis ist zudem das Thema Automation und die Integration von ITIL-konformen IT-Servicemanagement-Modulen. Mit einem Umbrella-System ist die Basis dafür geschaffen. Besonders effizient im Sinne einer Automation ist das Zusammenspiel mit einer Configuration Management Database (CMDB), die die vielseitigen Abhängigkeiten zwischen IT-Assets und Services transparent macht. Ein weiterer zentraler Aspekt ist die flexible Skalierbarkeit – gerade angesichts moderner dynamischer IT-Infrastrukturen mittels Cloud Computing. Ein entsprechendes System muss in der Lage sein, kurzfristig und automatisiert etwa 30 neue Webserver zu überwachen.

Typische Anforderungen aus der Praxis an ein solches System sind:

Proaktivität

Agieren, bevor ein System betroffen ist

Aktualität

Leistungsfähige und flexible Event-Korrelation für die Bewertung, Korrelation und Aggregation von Ereignissen aus den unterschiedlichsten Systemen zu aussagekräftigen Zuständen

Automation

Geringer Betriebsaufwand

Automatisiertes Update der Assets beziehungsweise Service-Strukturen Incident-, Change-, Knowledge-Base-Koppelung gemäß ITIL-Standard

Restart-Möglichkeit von Prozessen, etc.

Umfangreiche und schnelle Analysemöglichkeiten

Ad-hoc Zoom-in bis ins Detail

Automatisierte Root-Cause-Analyse und Business-Impact-Analyse

Simulation von Wartungsszenarien

Überblick im Fehlerfall – Priorisierung

Anreicherung mit allen relevanten Zusatzinformationen (Ansprechpartner, Standort, Service-Verträge…)

Ticket- und Change-Informationen

Handlungsanweisungen

Einbindung aller Mandantengruppen

Webfähige und verständliche Cockpit-Sichten für Operating, Help-Desk, Management, Kunden…

Best-Practice-Lösungen

Integriertes Alarmmanagement

Alarmpläne, Alarmgruppen, Eskalationsmanagement, Alarmkalender, Alarmregionen

SMS, E-Mail, VOIP, …

Kostentransparenz

Übersicht zu OLAs und SLAs aller überwachten Services in Echtzeit und für das Reporting

Experten mit langjähriger Erfahrung im Bereich IT-Monitoring, IT-Servicemanagement und IT-Prozess- und Projektmanagement sowie zertifizierte ITIL-Fachleute gewährleisten eine optimale Betreuung in allen Projektphasen – von der Anforderungsanalyse, über die Konzeption bis zur Umsetzung sowie bei der kontinuierlichen Weiterentwicklung der Lösung. Dabei ist es wünschenswert, Kunden-Administratoren zu befähigen, individuelle Anpassungen selbst vorzunehmen. Realisiert wird dies durch ein ausgereiftes Schulungskonzept und die einfache Bedienbarkeit des Systems. Empfehlenswert ist es, den Fokus auf einen Anbieter zu legen, der sich ausschließlich mit dem Thema Monitoring beschäftigt.

Time, budget & scope? Die Wirtschaftlichkeit. Die Mehrwerte durch ein ganzheitliches Umbrella-Monitoring liegen auf der Hand: Neben schwer quantifizierbaren Parametern wie die Zufriedenheit von Endkunden mit der Servicequalität und ein besseres Verständnis, wie das Funktionieren technischer Parameter die Business-Prozesse beeinflusst, gibt es konkret messbare Kosteneffekte.

Es entstehen direkt und indirekte Kosten für

Personal, das die Informationen zusammenträgt und geeignet aufbereitet (wenn überhaupt möglich)

System- beziehungsweise Service-Ausfälle (SLA/OLA) wegen fehlendem Überblick an zentraler Stelle

Zeitverzug bei der Problemlösung (Dauer des Systemausfalls)

den Verlust an Reputation (nicht messbare Kosten)

Fehlende Transparenz intern und zum Kunden

Verzögerung im Time to Market der Services

Anschaffungs- und Betriebskosten eines professionellen zentralen Monitoring-Tools amortisieren sich erfahrungsgemäß im Durchschnitt bereits nach 18 Monaten, da hierdurch zentrale Systeme und Services eine höhere SLA-Verfügbarkeit aufweisen beziehungsweise zentrale Sicherheits- und Compliance-Richtlinien gewährleistet werden können.

Mehrwerte: Alarmierung & Capacity Management. Alarmfunktionen sind ein wichtiger Teil des Monitorings. Analog zum Einsatz mehrerer Monitoring-Systeme finden sich bei vielen Unternehmen entsprechend mehrere Alarmierungs-Tools, die – oft isoliert voneinander – nur für bestimmte Infrastrukturkomponenten zuständig sind. Ein zentrales und in ein Umbrella-System integriertes Alarmmanagement ist daher ein wesentlicher Erfolgsfaktor, um im Ernstfall eine schnelle und zielgerichtete Problembehebung zu gewährleisten. Eskalationsmechanismen, das Follow-the-Sun-Prinzip zur Optimierung der weltweiten Bereitschaftskosten oder einheitliche Handlungsanweisungen in einer intelligenten Lösungsdatenbank sind dabei nur einige wichtige Funktionen.

Über das reine Realtime-Monitoring hinaus stellt das Capacity oder Performance Monitoring sicher, dass die vorgehaltenen IT-Kapazitäten den aktuellen und künftigen Anforderungen gerecht werden. Ein integrierter »Überwachungsschirm« über alle Performancedaten ermöglicht deren Zusammenführung und Verdichtung in einer einheitlichen Struktur und Sichtweise. Einerseits lassen sich die Kapazitäten bestimmter, für Services, Systeme und Applikationen benötigter Ressourcen beziehungsweise Komponenten messen, andererseits erlauben automatisierte Datenanalysen und das Einbeziehen von Vergangenheitswerten die Priorisierung, Optimierung und Planung von Kapazitäten auf Basis von Prognosen und Trends. Übersichtliche Dashboards für verschiedene Rollen, etwa Service Owner, Fachabteilungen, Leitstände oder Management, liefern die jeweils benötigte Information auf einen Blick. Und bei drohenden Kapazitätsengpässen oder sonstigen konkreten Problemen greift das Alarmmanagement. So hält man die Balance zwischen Wirtschaftlichkeit und Leistungsfähigkeit – auch beim bedarfsgerechten Einkauf von externen Kapazitäten.

Fazit. Umbrella-Monitoring bietet die Basis für die effektive unternehmensweite und proaktive Überwachung komplexer IT-Infrastrukturen aus einer Hand. Eine praxisorientierte Lösung integriert als zentrale Sammelstelle die Daten aller Quellsysteme beziehungsweise weiterer Überwachungswerkzeuge. Ein professionelles System verfügt hierfür über zahlreiche standardisierte Schnittstellen sowie Dashboards beziehungsweise Self-Service-Reporting. Für ein automatisiertes Service Monitoring kann eine vorhandene CMDB angebunden werden. Alternativ erfolgt die Service-Modellierung direkt im System. Mehrwerte bieten zudem ein integriertes vollständiges Alarmmanagement, das die Verantwortlichen bei Problemen schnell und zuverlässig benachrichtigt, andererseits ein übergreifendes Capacity Management. Letzteres sorgt durch die Überwachung und Analyse der Daten für die Priorisierung, Optimierung und Planung von Kapazitäten auf Basis von Prognosen und Trends.

Aber neben der Technik ist die Projektbegleitung von Spezialisten erfolgskritisch, um eine praxisnahe Umsetzung und den Know-how-Transfer für eine zukünftig eigenständige Administration zu gewährleisten. Dann amortisieren sich die Gesamtaufwände innerhalb sehr kurzer Zeit – denn die Betriebs- und Systembetreuungskosten sinken, und auch das Risiko von Systemausfällen und Compliance-Verletzungen wird minimiert.

