Machine Learning: Wächter des Cloud-Datenschatzes

Illustration: Absmeier, Geralt

Im Zuge der Digitalisierung wächst die Datenmenge, die Unternehmen täglich verarbeiten, stetig an. Dies spiegelt sich auch in der gestiegenen Nutzung von Cloudanwendungen in den vergangenen Jahren wider. Unternehmensdaten sind rund um die Uhr überall zugänglich, ermöglichen effiziente Arbeitsabläufe und – zumindest auf den ersten Blick – etwas weniger Verwaltungsaufwand für die IT-Abteilung. Dieser Effekt relativiert sich jedoch, wenn man die Cloudnutzung unter dem Aspekt der Sicherheit betrachtet. Die damit einhergehenden Risiken und neuen Bedrohungen erfordern fortschrittliche Sicherheitstechnologien, um den Schutz von Unternehmensdaten gewährleisten zu können.

Angriffsziel Clouddaten: Bedrohung durch Malware

Als Währung des digitalen Zeitalters hat sich die wachsende Datenmenge in der Cloud längst zu einem überaus attraktiven Ziel für Hacker entwickelt. Ein häufig genutzter Angriffsvektor ist derzeit das Einschleusen von Malware in Cloudanwendungen mittels Social Engineering, beispielsweise durch Spear-Phishing-Attacken. Die Sicherung von Daten in Cloudanwendungen wird noch weitgehend den Nutzern überlassen. Zwar bieten manche Public-Cloud-Provider gewisse Basis-Schutzfunktionen, um Bedrohungen in der Cloud zu erkennen. Wie jedoch die Ergebnisse eines Experiments von Bitglass vor kurzem zeigten, ist deren Wirksamkeit begrenzt: Im Rahmen seiner aktuellen Sicherheitsstudie testete das Bitglass-Threat-Research-Team den integrierten Malware-Schutz der im Unternehmensumfeld beliebten Cloudanwendungen Google Drive und Microsoft Office 365. In Zusammenarbeit mit Cylance nutzte es dafür eine bisher unbekannte Form von Ransomware mit dem Namen Shurl0ckr, eine Variante der Goijdue-Schadsoftware. Dabei handelt es sich um Ransomware-as-a-Service, die gegen eine Provision im Darknet bereitgestellt wird, um somit eine hohe (Schadens-) Reichweite zu erzielen und den Urhebern einträgliche Gewinne zu bescheren. Obwohl dem Malware-Schutz von Google und Microsoft die verwandte Gojdue-Ransomware bereits bekannt war, erkannten beide Anwendungen Shurl0ckr nicht als Malware. Bei einer unbekannten Bedrohung hat der Schutzmechanismus also versagt.

Viele Malware-Schutzmechanismen agieren nach wie vor reaktiv und ermitteln auf Grundlage der in einer Datenbank hinterlegten Eigenschaften von Dateien, ob es sich um Malware handelt. Das Ganze muss man sich in etwa wie ein Puzzlespiel vorstellen: Der Malware-Schutz prüft, ob die neue Malware in ein bestehendes Puzzlespiel passt. In dem vorliegenden Fall handelte es sich sozusagen um ein Puzzleteil, an dem eine Kante oder Ecke geringfügig verändert wurde. Da es nicht vollständig in die bestehende »Malware-Schablone« passte, wurde es als sicher eingestuft, obwohl es die Mehrzahl der notwendigen Eigenschaften erfüllt hätte. Angesichts der fortschreitenden Professionalisierung von Cyberkriminellen und den immer ausgereifteren Angriffen greift ein derartiger Sicherheitsansatz langfristig zu kurz.

Agiler Schutz von Clouddaten mit Machine Learning

Viele Wege führen in die Cloud – und entsprechend gibt es zahlreiche Möglichkeiten für das Einschleusen und die Verbreitung von Malware. Die Vielzahl an Nutzern und Zugriffsmöglichkeiten, sowie immer raffiniertere Sicherheitsbedrohungen verlangen einen dynamischen Sicherheitsansatz, der eine weit reichende Risikoeinschätzung vornehmen und geeignete Richtlinien automatisch anwenden kann. Um Unternehmensdaten auf ihrem Weg in und aus der Cloud wirksam schützen zu können, ist Machine Learning gegenwärtig der wirksamste Ansatz.

Machine-Learning-Algorithmen finden bereits in Spracherkennungssoftware oder in ERP-Systemen zur Verwaltung von Daten Verwendung. Nun hält die Technologie auch Einzug in Cloud-Sicherheitslösungen, wie beispielsweise Cloud Access Security Broker. Anstelle, wie herkömmliche signaturbasierte Lösungen, lediglich auf Grundlage bestimmter Datenprofile eine Risikoeinschätzung vorzunehmen, nutzt maschinelles Lernen eine weitreichende Eigenschafts- und Verhaltensanalyse und trifft eine Entscheidung, die automatisiert die implementierten Richtlinien durchsetzt. Wenn eine Datei als wahrscheinliche Bedrohung eingestuft wird, kann sie blockiert werden, falls Benutzer versuchen, sie in die Cloud hochzuladen oder auf ein Gerät herunterzuladen. Auf diese Art bildet Machine Learning einen ganzheitlichen Sicherheitsansatz für Unternehmensdaten über alle Cloud-Anwendungen eines Unternehmens hinweg und bietet erweiterte Kontrollfähigkeiten für Bedrohungen.

Wenn ein Benutzer beispielsweise eine mit Malware infizierte Datei von einer Website herunterlädt, die Datei in der Cloud speichert und somit eine potenzielle Schwachstelle im Unternehmen schafft, wird diese automatisch erkannt und markiert. Lösungen mit maschinellem Lernen überwachen ununterbrochen alle Dateien und Anwendungen in der Cloud. Dabei überprüfen sie jeden Up- und Download von Dateien automatisch auf Malware. Nachdem das Malware-Risiko durch den Machine-Learning-Schutz gemeldet und vom Sicherheitsteam beseitigt wurde, gewährt die Lösung den Benutzern automatisch vollen Schreibzugriff. Auf diese Weise sorgt die Lösung für Sicherheit, gewährleistet aber gleichsam eine hohe Benutzerfreundlichkeit, da keine Unterbrechung der Arbeitsabläufe erforderlich ist.

Datenhungrige Cloudwächter

Für Cloudanwendungen sind Machine-Learning-Algorithmen ideal, da große Datenmengen die wichtigste Voraussetzung für deren Zuverlässigkeit sind: Die meisten Algorithmen operieren nicht dateneffizient, das heißt, wenn nur eine geringe Datenmenge zur Verfügung steht, fehlt es ihnen am nötigen Erfahrungsschatz, um in einem konkreten Fall die richtige Entscheidung zu treffen und die geeignete Richtlinie anzuwenden. Menschen genügt das einmalige Betrachten eines Gegenstands – beispielsweise eines Laptops – um diesen künftig auch in einer abgewandelten Erscheinungsform als solchen erkennen zu können. Maschinen hingegen benötigen einen umfangreichen Erfahrungsschatz, also die Auseinandersetzung mit vielen Laptops, um diese Erscheinungsform zuverlässig identifizieren zu können. So sind maschinelle Lernlösungen, die wenig Daten empfangen, nicht so »intelligent« wie Lösungen, die ein hohes Datenvolumen aus stark frequentierten Umgebungen aufnehmen. Je mehr Dateien analysiert werden und je mehr Malware erkannt wird, desto höher ist die Genauigkeit.

Somit markiert die Nutzung von maschinellem Lernen die logische Reaktion auf die wachsende Menge an Daten und die veränderte Sicherheitslage durch die Cloudnutzung. Gleichsam kennzeichnet die Automatisierung von Sicherheitsmechanismen die nächste Stufe im Prozess der Digitalisierung.

Anurag Kahol, CTO, Bitglass

 


 

DSGVO: Datenschutz und Datensicherheit

Cyberangriffe: Deutsche Unternehmen nicht ausreichend geschützt

Der Datenschutz muss in digitale Produkte eingebaut sein

IT-Sicherheitsvorhersagen 2018 – Von Ransomware bis Business E-Mail Compromise

Angriffe auf die Cloud nehmen um 300 Prozent im Vergleich zum Vorjahr zu

Künstliche Intelligenz wird bis 2020 in fast jedem neuen Softwareprodukt vorkommen