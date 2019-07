Wie relevant eine funktionierende Internetverbindung für die alltägliche Arbeit ist, erkennt man meist erst, wenn man darauf verzichten muss. Klar ist vor allem für Unternehmen: Ein Ausfall muss so schnell wie möglich erkannt und das zugrunde liegende Problem behoben werden, um wirtschaftliche Schäden so gering wie möglich zu halten. Mithilfe von Netzwerkanalyse-Spezialisten werden Fehler in Echtzeit erfasst.

Fallen bestimmte Internetdienste aus, sind die zugrunde liegenden Probleme oft nur schwer erkennbar. In solchen Fällen sind die Dienste von Unternehmen, die sich auf die Analyse des Internets spezialisiert haben, unabdingbar. Unternehmen wie ThousandEyes erkennen in beinahe Echtzeit, wo ein Problem liegt und welche Maßnahmen getroffen werden müssen, damit wieder eine funktionierende Verbindung hergestellt werden kann. In der Vergangenheit hat sich dabei durch verschiedene Beispiele gezeigt, dass Probleme von Thousandeyes teils in Echtzeit erkannt werden und die Fehlerbehebung auf diese Weise in kürzester Zeit vorgenommen werden kann.

Eine Landkarte des Internets

Um Ausfälle schnell erkennen und die Probleme dahinter benennen zu können, sind Technologien zur Netzwerkanalyse notwendig, die eine genaue Zustandsbeschreibung des Internets erlauben. Dabei ist generell anzumerken, dass Informationen durch das Internet über eine Vielzahl an Knotenpunkten fließen, bevor sie an ihrem Ziel ankommen. Arbeitet man beispielsweise mit einem großen Cloud-Service-Dienstleister zusammen, können die gewünschten Daten über eine Vielzahl von Zwischenstopps vom Dienstleister bis zum eigenen Desktop wandern. Theoretisch könnte bei jedem dieser verschiedenen Knotenpunkte ein Problem auftreten, das den Verlust der übertragenen Daten zur Folge hat.

Funktioniert ein Dienst nun nicht wie gewohnt, ist sowohl für den Dienstleister wie auch für den Kunden nicht ersichtlich, wo genau das Problem bei der Übertragung der Daten lokalisiert ist. Durch den komplexen Aufbau des Netzwerks ist lediglich die Information vorhanden, dass etwas nicht funktioniert wie geplant. Netzwerkanalyse-Spezialisten wie ThousandEyes setzen hier mit ihren Lösungen an. So wird durch den Einsatz von über 180 Cloud Agents eine genaue Zustandsbeschreibung des Internets und der einzelnen Verbindungen erreicht. Vereinfacht ausgedrückt, erlauben die weltweit verteilten Cloud Agents eine Kartographierung des Internets und aller möglichen Verbindungen innerhalb des globalen Netzwerks.

Kommt es nun zu Ausfällen, lässt sich durch die metaphorische Landkarte, die alle Verbindungen anzeigt, genau erkennen, wo ein etwaiger Fehler liegt. Solche Einblicke sind vor allem für Unternehmen von Interesse, deren gesamtes Geschäftsmodell auf einer funktionierenden Netzwerkinfrastruktur basiert. Insbesondere Anbieter von Cloud Services sind im Falle eines Verbindungsausfalls schnell harter Kritik von Nutzern ausgesetzt. Da die Analyse nicht nur mögliche interne Probleme bei der Verbindung anzeigt, sondern das gesamte Netzwerk vom eigentlichen Dienstleister bis zum Kunden im Blick hat, ergeben sich zum Beispiel für Cloud Service Provider Vorteile durch die Dienste von Netzwerkanalyse-Spezialisten. Je zeitiger die Ursache für ein Problem bei der Verbindung festgestellt werden kann, desto schneller lässt sich dieses Problem beheben und eine funktionierende Verbindung wiederherstellen.

Ursachen sind oft weit entfernt – Analyse des Ausfalls von Google Search

Ein weiterer Vorteil einer gesamtheitlichen Betrachtung des Internets durch Netzwerkanalyse-Spezialisten ist, dass Verbindungsfehler weltweit ergründet werden können. Nur weil Probleme vermeintlich bei lokalen Betreibern auftreten, bedeutet dies nicht, dass dem tatsächlich auch so ist. Durch die komplexe Struktur des Internets und der unzähligen Querverbindungen, die zum Informationsaustausch benötigt werden, können Ausfälle ihre Ursache auch an völlig unerwarteten Stellen in der Netzwerkinfrastruktur haben. Ein Beispiel dafür liefert der von ThousandEyes untersuchte Ausfall von Google Search sowie verbundenen Diensten wie G Suite und Google Analytics.

So entdeckte der Netzwerkanalyse-Spezialist, dass am 12. November 2018 Schwierigkeiten bei der Verbindung mit G Suite auftraten. Weitere Nachforschungen ergaben, dass sich zudem Schwierigkeiten und Ausfälle bei anderen Diensten von Google abbildeten. Bei einer genaueren Untersuchung der erwähnten Landkarte des Internets fanden die Spezialisten heraus, dass der Datenverlust seine Ursache beim chinesischen Internetanbieter China Telecom hatte. Zudem tauchten auch verdächtige Internet Service Provider (ISP) aus Russland und Nigeria bei den ersten Untersuchungen auf. Dadurch, dass die Cloud Agents weltweit verteilt liegen, konnte also schnell eine genaue Einordnung des Problems erfolgen und dargelegt werden, wo die Ausfälle von Datenpaketen stattfanden.

Abbildung 1: Die Verbindung zu den Services von Google scheitert an einem chinesischen Internetanbieter

Der Fehler, der ursprünglich zum Ausfall geführt hatte, war auf die Grundstruktur des Internets zurückzuführen. So basieren die Vernetzungen des Internets vereinfacht gesagt auf dem Border Gateway Protocol (BGP). Dieses legt die Pfade zwischen den einzelnen ISPs fest und dient so zur Orientierung innerhalb des Internets. Durch einen Fehler bei der Neukonfigurierung des BGP des nigerianischen Internet Service Provider wurden Protokolle, die für die Verbindung mit den Servern des chinesischen ISP verantwortlich waren, fehlerhaft eingestellt. Durch eine Kaskade an weiteren Quervernetzungen waren schließlich die Dienste von Google betroffen. Während der nigerianische ISP 74 Minuten benötigte, um das Problem zu erkennen, konnte man bei ThousandEyes bereits nach kürzester Zeit die Ursache ausfindig machen.

Schmetterlingseffekt im Internet

Das Beispiel zeigt, wie fragil die Grundstruktur des Internets ist. Bereits kleinste Änderungen im System können durch die Interdependenz verschiedener Teilsysteme und aufeinander abgestimmter Protokolle und Dienstleister fatale Folgen haben. Im Beispiel konnte der Fehler recht schnell behoben werden, weil ein Unternehmen wie Google erhebliche Mittel aufbringen kann, um mit Hochdruck an Lösungen zu arbeiten. Bei kleineren Unternehmen kann ein solcher ungewollter Ausfall aber wesentlich mehr Zeit in Anspruch nehmen, bis wieder alles funktioniert.

Dass kleine Fehler passieren können, liegt in weiten Teilen am historisch gewachsenen Aufbau des Internets. Ursprünglich als Netzwerk für Universitäten gedacht, ist das Internet in seiner heutigen Form nur noch schwer zu durchschauen. Umso wichtiger sind Unternehmen, die mit ihren Analysen rund um das globale Netzwerk Einblicke geben können, die Fehler und Angriffe schnell aufdecken und so dafür sorgen, dass Ausfälle so gering wie möglich bleiben.

Stefano Marmonti, Regional Sales Manager DACH bei ThousandEyes