Observability-Leader sparen allein bei den Kosten von Ausfallzeiten über 20 Millionen Dollar.
Splunk hat in Zusammenarbeit mit der Enterprise Strategy Group weltweit 1.250 Praktiker, Fachleute und Führungskräfte befragt, die hauptsächlich mit Observability befasst sind. Die Ergebnisse wurden als Lagebericht Observability 2022 veröffentlicht [1]. Die Studie zeigt deutlich, dass Observability im digitalen Wandel bereits unverzichtbar ist, beträchtliche Effizienz- und Kostenvorteile mit sich bringt und Arbeitgeber attraktiv für die dringend benötigten Fachkräfte macht.
Der Lagebericht belegt, dass erfahrene Observability-Unternehmen (Leader [2]) die Kosten von Ausfällen um 90 % senken können: Während die Downtime bei Observability-Einsteigern mit 23,8 Millionen Dollar pro Jahr zu Buche schlägt, kommen auf die Leader nur 2,5 Millionen Dollar an Kosten zu.
Darüber hinaus sind die Leader messbar innovativer und erfolgreicher, und zwar in Bezug sowohl auf ihre Geschäfts- als auch auf ihre Digitalisierungsziele:
- Observability-Leader haben im letzten Jahr durch ihre AppDev-Teams 60 % mehr neue Produkte eingeführt oder Erlösquellen eröffnet als Einsteiger.
- Observability-Leader haben eine um 69 % kürzere MTTR (Mean Time to Resolution) bei ungeplanten Ausfallzeiten und schwerwiegenden Leistungseinbußen.
- Observability-Leader beschreiben ihre Transparenz in puncto Anwendungsleistung zu 66 % als ausgezeichnet – bei den Einsteigern sind es nur 44 %.
- Observability-Leader haben zu 64 % auch eine ausgezeichnet transparente Übersicht über ihre Sicherheitslage – bei den Einsteigern sind es nur 42 %.
- Observability-Leader können Probleme bei selbst entwickelten Anwendungen innerhalb von Minuten erkennen und profitieren von einer um 37 % besseren MTTD (Mean Time to Detect) – den Einsteigern gelingt das nicht einmal halb so oft.
»Unsere Studie bestätigt, wie wichtig Observability für jedes Unternehmen ist.«, sagt Spiros Xanthos, SVP und General Manager, Observability bei Splunk. »Die besten Observability-Praktiker haben sich bei der Digitalisierung einen Vorsprung verschafft. Sie haben die Ausfallkosten massiv gesenkt und sind dem Wettbewerb in puncto Innovationskraft überlegen. Die Observability-Leader sind im Ergebnis wettbewerbsfähiger, resilienter und effizienter.«
Hybride Architekturen, Cloud-native Anwendungen mit Microservices und Containern im Verbund mit Multi-Clouds haben bei vielen Unternehmen zu immer komplexeren IT-Ökosystemen geführt. 70 % der Befragten nutzen derzeit mehrere unterschiedliche Cloud-Dienste. Diese Komplexität ist ein entscheidender Observability-Treiber:
- 75 % der Befragten haben viele Cloud-native Anwendungen, die in mehreren Umgebungen laufen (in mehreren Public Clouds oder sowohl „on premises“ als auch in einer Public Cloud).
- Observability-Leader haben derartige Anwendungen häufiger im Einsatz, nämlich zu 92 % – bei den Einsteigern sind es nur 68 %.
- 36 % der Unternehmen (und 47 % der Leader), die selbst entwickelte Anwendungen in Public Clouds laufen lassen, nutzen dazu heute drei oder mehr unterschiedliche Public Clouds; 67 % gehen davon aus, dass dies bei ihnen in den nächsten 24 Monaten der Fall sein wird.
Deutschland ist Observability-Meister im internationalen Vergleich
Deutsche Unternehmen stehen gut da, was ihre Observability-Reife angeht: Die Leader-Quote liegt hierzulande bei 19 % und damit über dem globalen Gesamtdurchschnitt (8 %). Selbst Länder wie die USA (13 %), Frankreich (5 %) oder Großbritannien (2 %) hinken hier hinterher. Einer der Gründe für diesen Reifegrad deutscher Unternehmen ist darin zu sehen, dass sie öfter (46 %) als die Unternehmen anderer Länder (35 %) Daten über ihr gesamtes Observability-Toolset hinweg konsolidieren und korrelieren können. Hier einige weitere Ergebnisse im Detail:
- 51 % der deutschen Unternehmen sind in der Lage, bei der Mehrzahl ihrer selbst entwickelten Anwendungen Code auf Zuruf in die Produktion zu überführen. Die übrigen Länder kommen hier im Durchschnitt auf nur 36 %.
- Es überrascht daher nicht, dass deutsche Unternehmen sich eher zutrauen, ihre SLA-Zusagen in puncto Verfügbarkeit und Performance von Anwendungen auch einzuhalten: 57 % zeigen sich in diesem Punkt vollkommen zuversichtlich; der Vergleichswert: 46 %.
- Deutsche Unternehmen sind am stärksten der Meinung, dass Security-Monitoring und Observability auch in Zukunft separate Handlungsfelder sein werden. Dieser Ansicht sind zumindest 38 % – in den übrigen Ländern erreicht dieser Wert nur 26 %.
- Deutsche Unternehmen greifen derzeit öfter (69 %) als die Unternehmen anderer Länder (58 %) auf Open-Source-Observability-Tools zurü
Die Herausforderungen von Observability sind zwar weltweit dieselben, doch der Lagebericht macht deutlich, dass es zwischen den einzelnen Ländern erhebliche Unterschiede gibt:
- Frankreich punktet mit KI: Die Unternehmen hier geben häufiger (58 %) als die aus anderen Ländern (43 %) an, dass ihre AIOps-Investitionen zu einer Senkung der MTTR geführt haben.
- Kanada hat Aufholbedarf: Die Unternehmen hier sind zu 79 % Observability-Einsteiger (während der sonstige Länderdurchschnitt bei 58 % liegt), und nur 2 % (statt 10 %) erreichen Leader-Level.
- Japan erzielt beachtliche Erfolge bei der Lösung wiederkehrender Probleme mithilfe von AIOps-Technologien: 74 % nennen dies als AIOps-Vorteil (Ländervergleichswert: 55 %).
- Indien ist auf der Observability-Reise schon weit gekommen: Als Einsteiger können hier nur mehr 29 % gelten, während es im übrigen Länderdurchschnitt noch 62 % sind.
Weltweit ist für Unternehmen, die in Observability investieren wollen, der Fachkräftemangel eines der größten Hindernisse: 95 % der Befragten geben an, dass es schwierig sei, Fachleute für das Monitoring von Infrastruktur und Anwendungsverfügbarkeit zu finden. Bei 71 % hat die personelle Unterbesetzung in mindestens einem Fall dazu geführt, dass Projekte oder Planungen gescheitert sind.
»Wenn Unternehmen die richtigen Observability-Tools und -Praktiken nutzen und die richtigen Fachkräfte dafür gewinnen, haben sie die besten Chancen, Observability-Leader zu werden«, sagt Xanthos. »Wem es gelingt, mithilfe von KI Herr über die Masse und Vielfalt der Daten zu werden, und wer zugleich in Weiterbildung und neue Skills investiert, kann Personalprobleme eher lösen und gewinnt am Ende das Rennen um die besten Köpfe. Durch Anbieterkonsolidierung und eine genauere Auswahl der Werkzeuge können sich Unternehmen außerdem exakt das Anbieter- und Toolset zusammenstellen, das ihnen den größten Überblick verschafft und die wenigsten Schwierigkeiten bereitet, sprich: die Teams wirklich entlastet und Burn-out vorbeugt.«
[1] Die weltweite Umfrage wurde von Anfang bis Mitte Februar 2022 in Zusammenarbeit mit der Enterprise Strategy Group durchgeführt. Befragt wurden 1.250 Führungskräfte aus den Bereichen Anwendungsentwicklung und IT-Betrieb, die überwiegend mit Observability befasst sind. Vertreten sind insgesamt elf Länder: Australien, Deutschland, Frankreich, Indien, Japan, Kanada, die Niederlande, Neuseeland, Singapur, die USA und das Vereinigte Königreich.
Den vollständigen Lagebericht Observability 2022 mit weiteren Erkenntnissen und Empfehlungen finden Sie auf der Splunk-Website.
[2] Der Lagebericht segmentiert die Stichprobe anhand von vier Kriterien. Leader sind als Unternehmen definiert, die mindestens 24 Monate Observability-Erfahrung haben, Daten über sämtliche Tools hinweg korrelieren können, Schritte in Richtung Anbietersystematisierung unternommen haben und in ihren Toolsets bereits KI/ML-Technologien einsetzen.
Was versteht man unter Observability
Als Observability bezeichnet man die Fähigkeit, die internen Zustände eines Systems zu messen, indem man seine Ausgabewerte untersucht. Die Observability eines Systems gilt als gegeben, wenn der aktuelle Zustand rein durch Informationen aus Ausgabewerten, also Sensordaten, bewertet werden kann. Das scheinbar so neue Buzzword, das gerade in aller Munde ist, ist gar nicht so neu und wurde bereits vor Jahrzenten in der Systemsteuerungstheorie geprägt (bei der es um das Beschreiben und Verstehen selbstregelnder Systeme geht). Er wird jetzt jedoch verstärkt im Zusammenhang mit der Performance-Verbesserung verteilter IT-Systeme verwendet. In diesem Kontext werden zum Erreichen von Observability drei Arten von Telemetriedaten genutzt (Metriken, Logs und Traces), um detaillierte Einblicke in verteilte Systemen zu erhalten und es Teams zu ermöglichen, die Kernursache eines breiten Spektrums von Problemen zu ermitteln sowie die Performance des Systems zu verbessern.
In den letzten Jahren haben Unternehmen schnell auf Cloud-native Infrastruktur-Services wie AWS in Form von Microservice-, Serverless- und Container-Technologien umgestellt. Soll ein Event in solchen verteilten Systemen zu seinem Ursprung zurückverfolgt werden, sind dazu Tausende von Prozessen notwendig, die entweder in der Cloud oder lokal oder sowohl Cloud-basiert als auch lokal ausgeführt werden. Herkömmliche Monitoring-Verfahren und -Tools haben jedoch Schwierigkeiten, die vielen Kommunikationswege und Abhängigkeiten in diesen verteilten Architekturen zu verfolgen.
Observability ermöglicht Teams ein effektiveres Monitoring moderner Systeme und hilft ihnen, Auswirkungen innerhalb einer komplexen Ereigniskette zu identifizieren, zu verknüpfen und zu ihrer Ursache zurückzuverfolgen. Darüber hinaus gibt sie Systemadministratoren, IT Operations-Analysten und Entwicklern Einblicke in ihre gesamte Architektur.