Durch einen ganzheitlichen Ansatz korrelieren und bewerten Observability-Lösungen den Zustand der gesamten IT-gestützten Infrastruktur in Echtzeit, unabhängig davon, ob es sich um das Netzwerk, die Performance der Anwendungen oder die Nutzererfahrung handelt.

Der Begriff »Monitoring« beschreibt in der Medizin die Überwachung von Funktionen oder Funktionsstörungen von Patienten. Durch das medizinische Monitoring werden die Vitalfunktionen des Patienten beobachtet und die Erkenntnisse zur Behandlung von Verletzungen oder Krankheiten genutzt. Diese medizinische Definition kann durchaus auch in die IT übertragen werden. Die IT-Infrastruktur eines Unternehmens stellt dann den Körper eines Patienten dar. Bei Ausfällen können die Funktionen der IT-Infrastruktur beeinträchtigt oder ganz unterbrochen werden. Um diese gestörten Funktionen schnellstmöglich wiederherzustellen, kommt dem IT-Monitoring eine wichtige ökonomische Bedeutung zu. Vor allem in der heutigen Pandemie-Zeit beschleunigt sich in vielen Unternehmen die digitale Transformation, da Investitionen rund um die Infrastrukturen getätigt werden. Unweigerlich führt dies zu einem massiven Anstieg der Datenmengen, die zu überwachen sind. Mit IT-Monitoring lassen sich alle Hardware- und Software-Komponenten der Infrastruktur im Blick behalten. Dabei spielt es keine Rolle, ob es sich um Netzwerk-Equipment, Client-Systeme, Server oder selbstprogrammierte Applikationen handelt.

Von hoher Priorität sollte es deshalb sein, alle Komponenten der IT-Infrastruktur in möglichst wenige verschiedene Monitoring-Lösungen zu integrieren. Nur durch die übergreifende Überwachung aller Infrastrukturbestandteile ist es möglich, eine lückenlose Überwachung und einen störungsarmen Betrieb zu gewährleisten. Professionelles Monitoring ist für Systemadministratoren oder Systemverantwortliche Voraussetzung für den stabilen Betrieb der eigenen IT-Infrastruktur. Dabei sollten die implementierten Monitoring-Lösungen die überwachten Systeme nicht unnötig zusätzlich belasten.

Eine der wichtigsten und bekanntesten Monitoring-Arten ist das Netzwerk-Monitoring, das Bestandteil der meisten Netzwerk-Management-Systeme ist. Netzwerk-Monitoring-Systeme umfassen Software- und Hardware-Tools, die die eingesetzten Netzwerkkomponenten überwachen und unterschiedliche Parameter wie Bandbreite, Auslastung, Verfügbarkeit und Status erfassen. Netzwerkadministratoren verlassen sich in der Regel auf Netzwerküberwachungssysteme zur schnellen Erkennung von Geräte- oder Verbindungsfehlern beziehungsweise Verbindungsproblemen. Diese Überwachungssysteme liefern detaillierte Einblicke in das Netzwerk und informieren Administratoren per E-Mail oder Textnachricht über Probleme.

Historisches Monitoring. Beim historischen Monitoring werden die Erkenntnisse und Daten aus dem laufenden IT-Betrieb gesammelt und Langzeitstatistiken proaktiv erzeugt, um neben dem eigentlichen Monitoring auch zu überprüfen, ob die aktuellen Kapazitäten der IT-Infrastruktur für einen geregelten und störungsfreien Betrieb geeignet sind. Performance-Engpässe lassen sich somit schnell erkennen und beheben. Historisches Monitoring ermöglicht zum Beispiel die Optimierung der Budget-Planung für eine mögliche Neukonzeption des IT-Equipments, wodurch unnötige Kapazitätsüberschüsse verhindert werden können.

Echtzeit-Monitoring. Monitoring-Lösungen, die in Echtzeit operieren, unterstützen den Administrator dabei, akute Probleme in den Systemen zu erkennen. Der Administrator kann in Echtzeit analysieren, welche Probleme vorliegen und entsprechend reagieren, Folgeaktionen planen und Lösungsansätze implementieren, um die Funktionalität wiederherzustellen. Idealerweise werden Ausfälle von der Monitoring-Lösung selbstständig erkannt, registriert und behoben– ohne dass der Administrator aktiv werden muss oder Nutzer Einschränkungen bemerken.

Observability – Nachhaltige Nutzung von Infrastrukturdaten. Monitoring und Observability werden häufig miteinander verwechselt und in ähnlichen Zusammenhängen verwendet. Observability bedeutet, dass neben den Daten und Informationen des klassischen Monitorings – wie beispielsweise dem Network Performance Monitoring – auch Metriken, Protokolle und Traces überwacht und auswertet werden. Die Funktionalitäten von Observability-Lösungen beinhalten die Erfassung, Sammlung und Korrelation von Daten aus der Infrastruktur. Zusätzlich werden die Ergebnisse ausgewertet und visualisiert. Observability ermöglicht die Beurteilung des Status der gesamten Infrastruktur, ohne diese zu stören oder zu verändern. Durch die Datennutzung lässt sich die Performance der verschiedenen Systeme »auf Knopfdruck« erkennen.

Generell baut das Observability-Konzept auf bestehende Monitoring-Disziplinen auf, ergänzt diese und ist dementsprechend eine Weiterentwicklung von Monitoring. Im Gegensatz zum klassischen Monitoring zielt Observability darauf ab, alle gesammelten Daten für einen ganzheitlichen Überblick zu nutzen. Observability-Lösungen korrelieren und bewerten aufgrund des ganzheitlichen Ansatzes den Zustand der gesamten IT-gestützten Infrastruktur, unabhängig davon, ob es sich um Netzwerk, Application Performance oder die Nutzererfahrung handelt. Aufgrund der steigenden Komplexität der IT-Infrastrukturen und IT-Services reicht es in der Regel nicht mehr aus, nur einzelne Bereiche zu überwachen (Abbildung 1).

Digital Experience Monitoring. »Digital Experience Monitoring« (DEM) beziehungsweise »Monitoring der digitalen Nutzererfahrung« ist eine relativ neue Art von Monitoring. Bereits vor der Covid-19-Pandemie war Home Office für viele Unternehmen eine Möglichkeit, Mitarbeiter flexibel arbeiten zu lassen. Aktuell hat sich das »Büro Zuhause« für nahezu alle Unternehmen zu einem bedeutenden Thema entwickelt, da sich laut diversen Studien und Umfragen die Home-Office-Nutzung in Zukunft noch verstärken wird. Die vergangenen Lockdowns und die damit verbundene Arbeit im Home Office haben in relativ kurzer Zeit dazu geführt, dass Systemadministratoren einen neuen Teil der Infrastruktur genauer im Blick haben müssen – das World Wide Web.

Das Marktforschungsunternehmen Gartner definiert DEM in einer eigenen Kategorie für Analysewerkzeuge, die sich mit der Nutzererfahrung befasst. Speziell im IT-Umfeld hat die digitale Nutzererfahrung nicht nur in der jetzigen Pandemie-Phase einen hohen Stellenwert. Die digitale Nutzererfahrung hat mittlerweile Abhängigkeiten zu einer Vielzahl externer Services, wie Cloud, diverse Web-Conferencing Services oder andere SaaS-Anwendungen. Dies hat zu komplexen hybriden Implementierungen geführt, die sich der direkten Kontrolle des Systemadministrators entziehen und sich nur schwer an die speziellen Anforderungen von Unternehmen anpassen lassen.

DEM-Lösungen grenzen sich zu traditionellen Monitoring-Tools wie dem Netzwerk-Performance Monitoring deutlich ab. Anders als diese Lösungen untersucht DEM den gesamten digitalen Interaktionspfad und zeigt auf, welchen Einfluss jeder Abschnitt des Pfades auf erfolgreiche Benutzeraktionen hat. Digital Experience Monitoring versucht zusätzlich, das Verhalten der Nutzer in Form einer gesamten Customer Journey darzustellen, um auf einen Blick erkennen zu können, ob Einschränkungen im Interaktionsfluss eines Benutzers vorliegen (Abbildung 2).

Application Performance Monitoring. Mit Application Performance Monitoring (APM) ist es möglich, innerhalb der IT-Infrastruktur die implementierten Applikationen anhand festgelegter Performance-Parameter zu überwachen. Zusätzlich lassen sich potenzielle Störungen identifizieren, wodurch der Observability-Ansatz unterstützt wird. APM-Lösungen liefern den Systemverantwortlichen aussagekräftige Informationen, um anhand der Anwendungsleistung mögliche Performance-Engpässe erkennen und beheben zu können, bevor sich diese auf den Nutzer auswirken. Verschiedene Softwarelösungen verfolgen unterschiedliche Ansätze für Application Performance Monitoring. Generell nutzen aber alle marktrelevanten APM-Tools die in Tabelle 1 erwähnten Metriken.

APM-Lösungen sind in erster Linie darauf ausgelegt, die Anwendungsleistung direkt zu messen und Administratoren die Abhängigkeiten in der Infrastruktur aufzuzeigen.

Fazit und Handlungsempfehlungen. Das klassische Monitoring entwickelt sich in den letzten Jahren immer mehr von der Einzelbetrachtung eines Systems zu einer vollumfänglichen Übersicht der kompletten Infrastruktur. Speziell die IT wird für Unternehmen zu einem immer wichtigeren Teil innerhalb der Wertschöpfungskette und setzt damit hohe Verfügbarkeit und Stabilität voraus. Daher kommt dem Monitoring mittlerweile eine bedeutende Rolle zu. Nur durch zeitgemäßes Monitoring ist es möglich, IT-Infrastrukturen optimal zu überwachen und somit dem Worst Case, also dem Ausfall wichtiger IT-Systeme und Services, vorzubeugen.

Moderne Monitoring-Systeme unterstützen Systemverantwortliche dabei, Störungen frühzeitig zu erkennen, zu verhindern oder Teile der IT prophylaktisch anzupassen – unter Einbeziehung definierter Schwellenwerte. Ratsam ist es, die Erkenntnisse von Monitoring in einen nachhaltigen Entwicklungs- und Lernprozess zu überführen. Nur so können nachhaltig IT-Infrastrukturen und die implementierten Services kosten- und leistungsoptimiert funktionieren!

Der Observability-Ansatz bietet zusätzlich weitere Vorteile:

Gesamtheitlicher Echtzeitüberblick über alle Systeme der Infrastruktur

Mögliche Tool-Reduzierung und Abbau von Datensilos

Verbesserte Stabilität der Gesamtinfrastruktur

Ende-zu-Ende-Ansicht über verschiedene Systeme und Services in der Infrastruktur

