Drei Gründe für den Umstieg auf visuelle Workflows bei der Datenarbeit.
Ihre Datenanalysen bringen nicht die gewünschten Erkenntnisse oder dauern viel zu lange, weil Sie nicht genügend Ressourcen haben, um die Daten zu aggregieren, sie zu bereinigen, zu transformieren und zu analysieren? Dann ist es vielleicht Zeit zu prüfen, wie in Ihrem Unternehmen mit Daten gearbeitet wird. Die Konstanzer Datenanalyse-Spezialisten von KNIME haben drei wichtige Aspekte zusammengefasst, die zeigen, warum visuelle Workflows die Arbeit mit Daten erheblich vereinfachen und verbessern können.
Traditionell arbeiten viele Datenanalysten und Datenwissenschaftler mit Programmiersprachen. Sie nutzen Werkzeuge aus der Softwareentwicklung für die Datenarbeit. Dieses Vorgehen hat sich etabliert, da Datenwissenschaftler früher oft aus den Bereichen Datentechnik (mit SQL-Kenntnissen), Informatik (mit Python-Kenntnissen) oder Mathematik beziehungsweise Statistik (mit R-Kenntnissen) kamen. Zu Beginn funktionierte das gut. Heute ist es jedoch nicht mehr der beste oder schnellste Weg, vielen Menschen mit den unterschiedlichsten Skills die Arbeit mit Daten zu ermöglichen. Denn im Zeitalter von KI und anderen datenlastigen Anwendungen wollen immer mehr Geschäftsbereiche selbst Daten bearbeiten und analysieren. Die Experten dort besitzen meist aber nicht die entsprechenden Programmierkenntnisse und haben auch keine Zeit, sie sich langwierig anzueignen.
Bei der Softwareentwicklung steht zudem in der Regel das Prinzip des »Control Flow« im Vordergrund – also wie die Software dazu gebracht wird, das zu tun, was sie tut. Bei der Datenwissenschaft geht es vielmehr darum, durch Datenzusammenfassungen oder Modelle Erkenntnisse aus Daten zu gewinnen. Dazu ist es wichtig zu verstehen, was mit den Daten in den verschiedenen Phasen eines Prozesses geschieht, der zu diesen Erkenntnissen und Modellen führt. Es ist aber nicht so wichtig zu verstehen, wie genau das passiert. Anstatt einen Fokus auf den Code selbst (die Implementierung) zu legen, ist es daher viel wichtiger, den Datenfluss sowie die einzelnen Schritte und Ergebnisse sehen und interpretieren zu können. Genau das könnten intelligent angelegte visuelle Workflows heute bieten. Sie zahlen dabei auf drei wichtige Aspekte ein, die bei der Arbeit mit Daten bedacht werden sollten:
- Die Methode ist wichtiger als der Code
Datenwissenschaftler müssen verstehen, was eine Methode oder ein Algorithmus bewirkt, aber nicht unbedingt, wie diese technisch implementiert sind. Ein Datenwissenschaftler ist beispielsweise für ein Telekommunikationsunternehmen mit der Erstellung eines Modells zur Vorhersage der Kundenabwanderung beauftragt. Er muss also dazu ein geeignetes Modell wählen. Das kann eine logistische Regression, ein Entscheidungsbaum, die Verwendung eines Random-Forest-Algorithmus, oder die Festlegung eines Optimierungsziels für dieses Modell sein, um die beste Vorhersageleistung zu erzielen. Das sind komplexe Entscheidungen, die schon erhebliches Verständnis über die zur Verfügung stehenden Methoden erfordern. Der Code, der einer bestimmten Modelltrainingsmethode zugrunde liegt, ist hierfür aber weniger relevant. Im Allgemeinen interessieren sich Datenwissenschaftler für Folgendes:
- Datenverständnis: die Eigenschaften, Qualität und Struktur der Daten zu erkennen.
- Feature-Engineering: Auswählen und Erstellen relevanter Features aus den Daten, um die Modellleistung zu verbessern.
- Modellauswahl: Auswahl der am besten geeigneten Algorithmen und Techniken für die jeweilige Problemstellung oder Aufgabe sowie die dazugehörigen Daten.
- Modellbewertung: Bewerten der Leistung der Modelle mithilfe geeigneter Metriken und Validierungstechniken.
- Interpretierbarkeit: Verstehen, wie das Modell funktioniert, und in der Lage sein, den Stakeholdern seine Vorhersagen zu erklären.
Kurz gesagt: Datenwissenschaftler interessieren sich für die Tools und Knöpfe und Regler eines Modells, um Erkenntnisse zu gewinnen oder die Zukunft genau vorherzusagen – nicht für die Details der zugrundeliegenden Implementierung.
- Data Science erfordert Zusammenarbeit
Die Verwendung visueller Workflows erleichtert die Verständigung zwischen Daten- und Fachexperten und liefert ihnen sozusagen eine gemeinsame Sprache. Bei der Zusammenarbeit in einem Team muss ein Dateningenieur so nicht die Details seines SQL-Codes mit einem KI-Ingenieur diskutieren, der Python verwendet, oder mit einer Visualisierungsexpertin, die JavaScript bevorzugt. Das Einbinden der Expertise verschiedener Spezialisten zum richtigen Zeitpunkt im Datenfluss macht visuelle Workflows zu einem hervorragenden Tool für die Zusammenarbeit. Wenn das Tool den Experten optional ermöglicht, bei Bedarf eigenen Code hinzuzufügen, umso besser. Dann können die Experten, die programmieren können (und wollen), ihren Code leicht mit anderen teilen.
Visuelle Workflows sind auch bei der Arbeit zwischen Daten- und Fachexperten-Teams äußerst nützlich. Eine der häufigsten Beschwerden in der Praxis ist, dass die Datenwissenschaftler zu weit von den Daten entfernt seien, um die Besonderheiten und Anomalien zu verstehen, die für Fachexperten offensichtlich wären. Das Einbinden von Fachexpertise und frühzeitiges Feedback sind unerlässlich, um sicherzustellen, dass Data-Science-Projekte nicht zu weit vom Kurs abkommen und letztendlich eine fehlerhafte Lösung liefern. Visuelle Workflows ermöglichen es, Data-Science-Lösungen frühzeitig abzustimmen und zu korrigieren.
Ein visueller Workflow dient außerdem als praktische Referenz für alle, die in den Bereichen Governance und Compliance arbeiten, da er eine visuelle Dokumentation darüber liefert, was mit potenziell sensiblen Daten geschieht. Er zeigt zudem alle umgesetzten Sicherheitsvorkehrungen auf und ermöglicht so unter anderem auch eine bessere Kontrolle, wie und auf welche Daten bestimmte KI-Modelle zugreifen – ein riesiges Problem zurzeit, wenn es um den großflächigen Einsatz von KI in Unternehmen geht.
- Der Umgang mit Daten sollte keine Programmierkenntnisse erfordern
Einer der größten Vorteile visueller Workflows ist die Lernkurve. Datenexperten sind heute gefordert, zukünftige Arbeitskräfte darin zu schulen mit großen Datensätzen zu arbeiten, die in immer mehr Arbeitsbereichen anfallen. Das betrifft Fachkräfte aus den unterschiedlichsten Bereichen – von Marketingfachleuten über Supply-Chain-Analysten, Produktionsingenieure, Chemiker, HR-Analysten und sogar Experten für maschinelles Lernen, die regelmäßig komplexe analytische Workflows erstellen, ohne jemals das Programmieren lernen zu müssen.
Visuelle Workflows erleichtern Anfängern den Einstieg in Datenbearbeitung und -automatisierung. Gleichzeitig machen sie sich so mit einem Tool vertraut, das auch für fortgeschrittene Data Science verwendet werden kann. Innerhalb weniger Stunden können sie ihren ersten echten Workflow erstellen, der Tabellen zusammenfasst, Daten aus einem Warehouse abruft oder sogar ein Machine-Learning-Modell erstellt. Nachdem sie das visuelle Workflow-Modell verstanden haben, lernen sie leicht und selbstständig, mehr Knoten und die Funktionsweise der zugrunde liegenden Methoden zu verstehen. Auf diese Weise können sie sich schrittweise neues Fachwissen aneignen und tiefer in das Feld der Datenwissenschaft eintauchen, ohne die visuelle Workflow-Umgebung verlassen zu müssen.
»Visuelle Workflows bieten erhebliche Vorteile für den Umgang mit Daten und die Erkenntnisse, die aus ihnen gewonnen werden können«, bestätigt Michael Berthold, CEO von KNIME. »Es ist allerdings wichtig, bei der Auswahl einer Lösung oder Plattform auf einige wichtige Kriterien zu achten. Dazu gehört, wie oben beschrieben, natürlich die Abdeckung wirklich aller Varianten der Datenanalyse. Wichtig ist aber auch, dass man kontinuierlichen Zugriff auf Weiterentwicklung in diesem nach wie vor sehr aktiven Forschungsgebiet hat. Es führt also kein Weg daran vorbei, Open-Source-Bibliotheken einzugliedern, die Zugriff auf diese Weiterentwicklungen bieten. Kein proprietärer Softwareanbieter hat eine Chance diesem Fortschritt selbst kontinuierlich hinterherzuentwickeln.«
Weitere Informationen rund um das Thema Datenanalyse gibt es unter https://www.knime.com/
[1] Als Random Forest bezeichnet man einen Algorithmus, der für Klassifizierungs- und Regressionsaufgaben genutzt wird. Er kombiniert Ergebnisse vieler verschiedener Entscheidungsbäume, um bestmögliche Entscheidungen zu treffen.
74 Artikel zu „workflow data science“
News | Industrie 4.0 | Künstliche Intelligenz
Vier Prinzipien des intelligenten Data Mesh auf dem Weg hin zu Industrie 4.0
Künstliche Intelligenz (KI) und maschinelles Lernen (ML) sind für Fabriken von erheblichem Nutzen. Es gibt jedoch nach wie vor Herausforderungen. Diese liegen normalerweise nicht in der Datenwissenschaft – denn der Code funktioniert in der Regel gut. Bei der Umsetzung von KI/ML-Projekten in großem Maßstab liegen die Herausforderungen vorwiegend in der Architektur und Datenverwaltung. Hersteller müssen…
News | Industrie 4.0
Altsysteme in moderne Workflows und Industrie 4.0 durch Retrofit integrieren
Wer träumt nicht ab und zu davon, seine Maschinen- und Anlagenparks ohne Altlasten, sozusagen auf der grünen Wiese, digitalisieren zu können. Doch in der Regel geht es nicht um einen kompletten digitalen Neuanfang, sondern um die Umrüstung und Einbindung verschiedenster Legacy-Systeme in digitalisierte Workflows. Die Digitalisierung ist in vollem Gange – und niemand kann…
News | Business | Künstliche Intelligenz | Strategien | Ausgabe 11-12-2021
Data-Analytics-Strategie – Wie Unternehmen nachhaltig von Data Analytics profitieren
In der Breite nutzen bisher nur wenige Unternehmen künstliche Intelligenz (KI), oft bleibt die Entwicklung nach einem ersten Proof of Concept oder Pilotprojekt stecken. Damit sich das ändert, bedarf es einer funktionierenden Datenkultur. Vor allem gilt es jedoch, die Intelligenz an die richtige Stellen im Prozess zu bringen.
News | Business Process Management | Effizienz
Fünf Gründe für Automatisierung von Data Warehouses
Obwohl die Rolle von Daten bei der Entscheidungsfindung von Unternehmen zunehmend wichtiger wird, führen viele Firmen ihre ETL-Prozesse immer noch manuell durch und nehmen langwierige Prozesse und veralteten Daten in Kauf. In einem modernen Data Warehouse müssen Daten sich schnell und korrekt integrieren lassen, um ihre einfache Nutzung für die Geschäftsberichtserstattung sicherzustellen. Die traditionellen Ansätze…
News | Infrastruktur | Strategien | Ausgabe 11-12-2020
Unified-Data-Analytics-Plattform – Databricks baut das Lakehouse fertig
Die Lakehouse-Architektur soll die Leistung von Data Warehouses mit der Wirtschaftlichkeit von Data Lakes kombinieren.
News | Veranstaltungen
Learn about the latest Innovations for AI, Data Sience, HPC, Rendering and more
Supermicro’s GTC conference sessions are now available free and on-demand with no GTC pass required. Watch now to learn about Supermicro’s maximum acceleration and cost efficiency for AI, deep learning, and HPC applications.
News | Business Intelligence | Business Process Management | Effizienz | Favoriten der Redaktion | Infrastruktur | Lösungen
Robuste und widerstandsfähige Lieferketten: So hält Data Analytics die Supply Chain am Laufen
Die rasche Verbreitung von Covid-19 hat viele Lieferketten unter Stress gesetzt. Hamsterkäufe und Produktionsstopps angesichts fehlender Rohstoffe machten es schwer, die Nachfrage der Märkte zu erfüllen. Da viele Branchen von Lieferungen aus anderen Ländern abhängig sind, müssen Entscheidungsträger in der Lage sein, schnell Anpassungen an der Supply Chain vorzunehmen. Dies funktioniert jedoch nur, wenn verlässliche…
News | Business | Strategien | Ausgabe 3-4-2020
Von Big Data zu Smart Data – Intelligente Daten für Geschäftsentscheidungen
Das Thema Big Data wird bereits seit Jahren in der Fachpresse als Trend bezeichnet. Dabei sind große Datenmengen schon seit geraumer Zeit ein Thema. Allerdings hat sich in der Handhabung von Big Data einiges getan. Der Anspruch, große Datenmengen mithilfe von IT-Unterstützung intelligent und effizient zu nutzen, ist deutlich gestiegen.
News | Business Intelligence | Online-Artikel | Services | Strategien
Fünf Vorurteile über Data Analytics
Die Entwicklungen von Big Data, Machine Learning und künstlicher Intelligenz werden 2019 wieder zu einem spannenden Jahr machen. Dank der Zukunftstechnologien gewinnt vor allem die Datenanalyse an Fahrt und Unternehmen werden noch weniger um die effektive Auswertung ihrer Informationen herumkommen. Manch einer tut sich aber schwer mit dieser neuen, tragenden Säule im Geschäftsalltag. IT-Experten sehen…
News | Digitalisierung | Industrie 4.0 | Infrastruktur | Internet der Dinge | Lösungen | Services
Industrie 4.0: Smart Factory smart umgesetzt
Die Digitalisierung in der Produktion ‒ oft als Smart Factory oder Industrie 4.0 tituliert ‒ ist für Unternehmen zwar schon lange ein Thema, die Umsetzung aber alles andere als trivial. Studien zeigen, dass fast 80 Prozent aller Initiativen, die Produktion zu modernisieren, scheitern. Ein Ansatz, typische Hürden und Herausforderungen zu meistern, ist der Smart Factory…
Trends 2024 | News | Business Intelligence | Digitalisierung | Trends Services | Geschäftsprozesse
Ungenutzt, doch unverzichtbar: Viele Unternehmen verpassen ihre Business-Intelligence-Chance
Neue Studie zeigt, dass Chancen auf Umsatzwachstum und Kosteneffizienz nicht genutzt werden. Eine neue Studie, die im Auftrag von Pleo unter 500 Finanz- und Budgetverantwortlichen mittelständischer Unternehmen im August 2024 in Deutschland durchgeführt wurde, zeigt, dass Business-Intelligence-Tools eine immer wichtigere Rolle in der Finanzstrategie einnehmen. Dennoch stehen viele Unternehmen vor der Herausforderung, das volle…
News | Digitale Transformation | Services
Portale: Digitale Technologien im Kundenservice
Höchste Leistung in kürzester Zeit – So optimieren Sie Serviceprozesse und steigern die Effizienz. In der heutigen Geschäftswelt wird der Kundenservice immer mehr zum entscheidenden Wettbewerbsvorteil. Unternehmen, die ihren Serviceprozess optimieren, profitieren nicht nur von einer höheren Kundenzufriedenheit, sondern auch von gesteigerter Effizienz und neuen Umsatzpotenzialen. Doch der Weg dahin ist voller Herausforderungen. Prozessbrüche…
News | Digitalisierung | Favoriten der Redaktion | Künstliche Intelligenz | Strategien
GenAI-Strategie für den Mittelstand
Nicht nur Konzerne, auch KMU können von generativer KI profitieren. Wegen ihrer limitierten Ressourcen müssen sie dabei aber besonders planvoll vorgehen. Vor allem drei Aspekte sind entscheidend. Mittelständische Unternehmen, die zunehmend unter Kostendruck und Fachkräftemangel leiden, haben gute Chancen von generativer KI zu profitieren. GenAI gibt ihnen die Möglichkeit, die Produktivität ihrer vorhandenen Mitarbeiter…
Trends 2024 | News | Business | Trends Wirtschaft | Künstliche Intelligenz
Recruiting-Studie: Bedarf an Nachwuchskräften bleibt trotz KI-Boom hoch
55 % der Unternehmen bleiben bei ihrer bisherigen Rekrutierungspolitik. 13 % glauben, dass sie mehr Auszubildende brauchen werden. Arbeitsschritte und Bereiche, die aktuell zu den täglichen Aufgaben von Auszubildenden und Nachwuchskräften gehören, könnten bald gänzlich von technischen Anwendungen übernommen werden. Das ist eine These aus der neuesten Studie von Cegid [1]. Darin wird untersucht,…
News | Digitalisierung | Effizienz | Infrastruktur | Künstliche Intelligenz
Daten für KI effizient nutzen: Von der Ingestion bis zur Innovation
Es wird viel über das Training von KI-Modellen geschrieben, aber Datenwissenschaftler verbringen einen Großteil ihrer Zeit mit den Prozessen, die vor und nach dem Modelltraining ablaufen. In all diesen verschiedenen Phasen werden die Daten umgewandelt und erweitert. Um ein effektives und nützliches KI-Modell zu erstellen, müssen die Daten, die dem Modell zugrunde liegen, leicht zu…
News | Effizienz | ERP | Geschäftsprozesse | Künstliche Intelligenz | Strategien
Generative KI für zukunftsorientierte Unternehmen: IBM und SAP erweitern Partnerschaft
Neue Partnerschaft »Value Generation« soll Kunden eine höhere Produktivität ermöglichen und Innovationen mit neuen Funktionen für generative KI und branchenspezifischen Cloudlösungen bieten. IBM und SAP haben heute ihre Vision für den Ausbau ihrer Partnerschaft angekündigt. In deren Rahmen sollen neue Funktionen für generative KI und branchenspezifische Lösungen entwickelt werden, damit Kunden zusätzlichen Mehrwert erschließen…
Trends 2024 | News | Künstliche Intelligenz | Services
KI avanciert 2024 zum stärksten Motor für die Entwicklerproduktivität
Generative KI hat im vergangenen Jahr die Schlagzeilen bestimmt. Kein Wunder also, dass auch 2024 ganz im Zeichen künstlicher Intelligenz stehen wird. Markus Eisele, Developer Strategist bei Red Hat, wagt einen Ausblick darauf, wie und wo die Zukunftstechnologie Entwicklerinnen und Entwickler im kommenden Jahr begegnen und ihre Produktivität verbessern wird. Der Blick in die…
News | Kommentar | Künstliche Intelligenz
Wird KI den Anwalt ersetzen?
Die Vorstellung, dass Algorithmen in unseren Rechtssystemen Entscheidungen treffen, die unser Leben direkt berühren, scheint einem Science-Fiction-Film entsprungen zu sein. Doch die Automatisierung im Sinne von künstlicher Intelligenz ist sowohl in der Justiz wie auch ganz grundsätzlich im Umfeld von Corporate Governance, Risikomanagement und Compliance, kurz GRC, keine Zukunftsmusik mehr: Legal Tech existiert und wird…
News | Rechenzentrum | Ausgabe 11-12-2021
Artificial Intelligence for IT Operations – Warum die Zeit für Mainframe-AIOps gekommen ist
Zunehmend mehr Entscheidern im Bereich Mainframe wird bewusst, dass die traditionelle Art und Weise der Abwicklung des Mainframe-Betriebs bald zurückbleiben wird. Die stetig wachsende Nachfrage nach neueren, schnelleren digitalen Diensten erhöht den Druck auf Rechenzentren, mitzuhalten, weil neue Anwendungen erscheinen, das verarbeitete Datenvolumen kontinuierlich steigt und die Arbeitslasten immer unvorhersehbarer werden.
News | Business | New Work | Ausgabe 7-8-2021
Virtuelles Onboarding – Neue Mitarbeitende digital einbinden
Ob Bewerbungsgespräch oder Einarbeitung: Vor-Ort-Präsenz war früher selbstverständlich. Doch nun müssen neue Kolleginnen und Kollegen virtuell an Bord geholt werden. Dabei haben sich in den vergangenen Monaten einige Hürden gezeigt. Mit Hilfe praktischer Tipps lassen sich diese leicht überwinden.