
foto freepik
Generative KI (GenAI) wird 2025 zweifellos entscheidende Veränderungen bei unserer alltäglichen Arbeit mit Daten anstoßen. KI-basierte Modelle wie ChatGPT und LLama können Texte und Code generieren, Bilder erstellen und Dokumentationen automatisieren – und eröffnen damit unzählige Möglichkeiten zur Effizienzsteigerung in der Datenwissenschaft. Allerdings kann GenAI, je nach Anwendungsgebiet, Arbeitsabläufe auch unnötig verkomplizieren. Die Data-Science-Spezialisten von KNIME zeigen auf, in welchen Fällen GenAI echten Mehrwert für datengetriebene Prozesse bietet und wann andere Data-Science-Ansätze sinnvoller sind [1].
Bei der Datenarbeit eignet sich GenAI für viele Aufgaben, deren Implementierung ansonsten sehr aufwändig wäre. Bei der Sentiment-Analyse beispielsweise benötigt man den geeigneten Datensatz, muss ein neuronales Netzwerk bauen, das Modell trainieren etc. Mit GenAI werden viele dieser Schritte abgekürzt. Technische Lösungen erfordern jedoch oft einen Kompromiss zwischen Implementierungseffizienz und Leistung. GenAI sollte daher nicht als Standardlösung, sondern vielmehr als gezielt eingesetztes, strategisches Tool betrachtet werden.
Checkliste für den Einsatz von GenAI bei der Datenarbeit
Um zu beurteilen, ob der Einsatz von GenAI in einem Projekt tatsächlich einen Mehrwert bietet, sollten Unternehmen folgende vier Kriterien prüfen:
Wie wichtig ist die Genauigkeit bei dieser Anwendung?
GenAI kann in vielen Bereichen beeindruckende Ergebnisse liefern, doch die Zuverlässigkeit großer Sprachmodelle (LLMs) variiert. Wenn ein Projekt die Verarbeitung strukturierter Daten und konsistenter, präziser Ergebnisse erfordert – etwa bei der Vorhersage von Anlagenausfällen in der Fertigung – können traditionelle Data-Science-Techniken wie Regressionsmodelle oft genauere Ergebnisse liefern. Ist Genauigkeit entscheidend, sollte die Leistung von GenAI daher sorgfältig mit seit langem bewährten Methoden verglichen werden.
Kann Transparenz und Erklärbarkeit gewährleistet werden?
Der Mangel an Transparenz in GenAI-Modellen macht es schwierig, die Gründe für die Ergebnisse zu verstehen –– ein großer Nachteil bei Aufgaben, die Rechenschaftspflicht und Überprüfbarkeit erfordern. So muss beispielsweise ein Kredit-Scoring-Modell nachvollziehbar sein, um Fairness zu gewährleisten und gesetzliche Vorgaben einzuhalten. In sensiblen Bereichen wie der medizinischen Diagnostik ist Transparenz sogar noch entscheidender. Traditionelle Methoden wie Random Forest, Support Vector Machines (SVMs), Entscheidungsbäume oder lineare Regression eignen sich in solchen Fällen besser, da sie üblicherweise mehr Erklärbarkeit liefern.
Sind die nötigen Steuerungsoptionen verfügbar?
Herkömmliche Data-Science-Techniken bieten klare Parameter, um das Verhalten eines Algorithmus gezielt zu steuern. Beispielsweise kann das Erhöhen eines Schwellenwerts die Anzahl der Ausreißer reduzieren, während das Hinzufügen weiterer Bäume in einem Random-Forest-Modell in der Regel die Zuverlässigkeit der Ergebnisse verbessert. Im Gegensatz dazu verfügen GenAI-Modelle nur über begrenzte Parameter zur Steuerung von Ausgängen, wie beispielsweise die Anpassung der Eingabeaufforderung. Prompt Engineering bleibt jedoch intransparent, da selbst kleine Änderungen an der Eingabe zu unerwarteten und schwer erklärbaren Abweichungen in der Ausgabe führen können. Da Kontrolle und Transparenz eng miteinander verknüpft sind, eignen sich für Projekte, die eine nachvollziehbare Implementierung der Algorithmen erfordern, oft klassische Methoden besser, wenn diese eine direktere Kontrolle bieten.
In welchem Verhältnis stehen Kosten und Mehrwert?
Die Implementierung von GenAI-Anwendungen kann erhebliche Kosten mit sich bringen – sei es durch Lizenzgebühren für fortschrittliche Lösungen und Modelle oder die interne Entwicklung maßgeschneiderter Lösungen. Zudem erfordert der Implementierungsprozess erhebliche Ressourcen für die Datenvorbereitung, das Feinjustieren von Eingabeaufforderungen und die Nachbearbeitung der Ergebnisse. Gartner prognostiziert, dass bis Ende 2025 rund 30 Prozent der GenAI-Projekte nach dem Proof of Concept scheitern werden [2]. Gründe dafür werden unter anderem hohe Kosten und ein nicht klar erkennbarer Mehrwert für Unternehmen sein. Wenn also ein einfacherer, weniger ressourcenintensiver Ansatz die gleichen Ergebnisse erzielen kann, ist er wahrscheinlich die klügere Wahl.
Abwägungsbeispiel aus der Praxis
Die genannten Abwägungen lassen sich an einem Beispiel aus der Praxis verdeutlichen: Ein Einzelhändler möchte sein Kundenfeedback kategorisieren. In diesem Fall eignet sich GenAI dank seiner Fähigkeit, natürliche Sprache zu verstehen und zu verarbeiten, hervorragend zur Klassifizierung von Inhalten in Themen oder Stimmungen (positives oder negatives Feedback). In diesem Fall sind leichte Abweichungen in der Genauigkeit akzeptabel. Die Transparenz hinsichtlich der Ergebnisfindung ist kein entscheidender Faktor und die Ergebnisse lassen sich mit vergleichsweise einfachen Anpassungen der Eingabeaufforderungen steuern. Die Automatisierung dieses Prozesses spart Zeit und Ressourcen und überwiegt damit potenzielle Risiken sowie die Kosten.
Anders sieht es bei Aufgaben wie der Segmentierung von Einzelhandelskunden oder der Betrugserkennung aus. Hier kann GenAI zu unzuverlässig sein, denn selbst kleine Änderungen in der Eingabe können zu unvorhersehbaren und unerklärlichen Ergebnissen führen. Natürlich kann man Daten in ein Modell wie ChatGPT einspeisen und eine Clusterung des Datensatzes anfordern. ChatGPT führt jedoch im Hintergrund ein Python-Skript aus und dies ist nur für einfache Datensätze und einfache Datenflüsse möglich. Sobald der Datenfluss komplexer wird, beispielsweise durch das Hinzufügen anderer Verfahren zur Merkmalsgenerierung, ist es schwierig, dies in eine KI-Eingabeaufforderung einzuspeisen. Es ist zwar möglich, GenAI so zu verfeinern, dass es mit der Präzision und Verlässlichkeit traditioneller Methoden konkurriert, doch der damit verbundene Aufwand kann die Vorteile schnell zunichtemachen. In diesem Szenario eignen sich daher standardmäßige, zuverlässige und transparente Klassifizierungs- und Techniken zur Ausreißererkennung besser.
»GenAI bietet aufgrund seiner Fähigkeit, Text, Bilder, Code und mehr zu generieren, einen validen Ansatz für viele Anwendungsfälle der Datenwissenschaft. Aber es ist bei weitem nicht die universelle Antwort auf jede Aufgabe. Bei mancher Anwendung wäre der Einsatz von GenAI überdimensioniert, als würde man mit Kanonen auf Spatzen schießen, da hier traditionelle Datenanalysetechniken effizienter und genauso effektiv sind. In anderen Bereichen scheitert der Einsatz heute noch an der Genauigkeit oder Transparenz. GenAI sollte daher passgenau als strategisches Werkzeug und nicht als Standardlösung eingesetzt werden«, resümiert Rosaria Silipo, VP of Data Science Evanglism bei KNIME.
[1] https://www.knime.com/
[2] https://www.gartner.com/en/newsroom/press-releases/2024-07-29-gartner-predicts-30-percent-of-generative-ai-projects-will-be-abandoned-after-proof-of-concept-by-end-of-2025
636 Artikel zu „Data Science“
News | Effizienz | Geschäftsprozesse | Künstliche Intelligenz | Services
HR im digitalen Wandel: Sind Data Science und KI Game-Changer in der Personalwelt?

In Zeiten, in denen Daten eine entscheidende Ressource für Unternehmen sind, sind Data Science und Künstliche Intelligenz (KI) zu wertvollen Werkzeugen auch für HR-Abteilungen geworden. Data Analysten und Data Scientists stehen im Zentrum dieser Entwicklung, die Personalern ermöglicht, datenbasierte Entscheidungen zu treffen und so einen entscheidenden Wettbewerbsvorteil zu erlangen. »Durch die gezielte Nutzung von HR-Daten…
News | Business | Künstliche Intelligenz | Services
Women in Tech – Das macht Data Science attraktiv für Frauen

Datenwissenschaften oder auch Data Science gehören zu den Berufsfeldern, die heute schon stark nachgefragt und zukünftig in allen Branchen relevant sein werden, weil sie Unternehmen fundierte unternehmerische Entscheidungen ermöglichen. Eine interne Auswertung des Bildungsinstituts DataScientest zeigt nun: Gerade für Frauen kann dieses interdisziplinäre Tätigkeitsfeld ein interessanter Game Changer für die eigene Karriere sein, mit der…
News | Trends Services | Künstliche Intelligenz | Trends 2023 | Services
Lerntrends 2023: Data Science besonders beliebt in Deutschland

Weltweit sekündliche KI-Kurs-Anmeldung in 2023. Drei der zehn beliebtesten Kurse in Deutschland im KI-Bereich. Weltweit 2024 Führungs-, Cybersicherheits- und KI-Skills gefragt. Das Jahr 2023 markiert den Durchbruch bei der generativen künstlichen Intelligenz (KI) – mit weitreichenden Folgen für die Arbeitswelt und die Zukunft der Weiterbildung. Denn die neue Technologie erleichtert und demokratisiert den Zugang…
News | Business | Strategien | Ausgabe 11-12-2022
Data Science braucht mehr als Data Scientists – Brücke zum Business
News | Business | Favoriten der Redaktion | Künstliche Intelligenz | Strategien
Brücke zum Business – Data Science braucht mehr als Data Scientists

Wer sich die Digitalisierung wirklich zu eigen machen will, muss das Thema Datenmanagement strategisch angehen. Viele Unternehmen verfolgen laut Solita hier jedoch bislang nur halbherzige Ansätze. Chaos und Disruption, die datentechnisch in vielen Unternehmen heute herrschen, lassen keinen Zweifel aufkommen: Jede größere Organisation braucht inzwischen eine Datenstrategie und sollte das Thema auch nicht auf…
News | Business | Trends Wirtschaft | Digitalisierung | Trends 2022 | Services | Whitepaper
Deutsche Nachwuchskräfte: Schwächelnde Kompetenzen bei Technologie, Wirtschaft und Data Science

Der Global Skills Report 2022 von Coursera zeigt einen deutlichen Rückgang Deutschlands im weltweiten Vergleich. Die fortschreitende digitale Transformation, die Inflation und die weltweite Unbeständigkeit führen zu einer steigenden Nachfrage nach digitalen und persönlichen Kompetenzen, die für den Erfolg in der modernen Wirtschaft unerlässlich sind, so der neueste Global Skills Report der Online-Lernplattform Coursera. Der…
News | IT-Security | Künstliche Intelligenz
Data Science für die IT-Sicherheit: KI-Human-Teams können Cyberangreifer stoppen

Trotz der erstaunlichen Fortschritte bei der Leistung der künstlichen Intelligenz in den letzten Jahren ist keine KI perfekt. Tatsächlich wird die Unvollkommenheit einer KI in der Regel durch die Messung der Genauigkeit des Modells an einem Testdatensatz deutlich gemacht. Perfekte Ergebnisse werden weder erwartet noch sind sie üblich. Christopher Thissen, Data Scientist bei Vectra…
News | Business Intelligence | Business Process Management | Trends Infrastruktur | Cloud Computing | Trends Cloud Computing | Digitalisierung | Trends 2016 | Infografiken
Apache-Spark-Studie zeigt Wachstum bei Anwendern und neuen Workloads wie Data Science und Machine Learning

Zum besseren Verständnis der zunehmenden Bedeutung von Spark bei Big Data hat die Taneja Group ein großes Marktforschungsprojekt durchgeführt und rund 7.000 Teilnehmer befragt. In die weltweit angelegte Analyse wurden Führungskräfte aus Technik und Verwaltung einbezogen, die unmittelbar mit dem Thema Big Data zu tun haben. Die mit überwältigender Resonanz abgeschlossene Studie gibt Aufschluss die…
News | Business Intelligence | Digitalisierung | Kommentar | Lösungen | Services
Die neue Rolle von BI: Data Science für Jedermann

Daten sind das neue Gold. Nur danach muss gegraben und geschürft werden. Ein schweißtreibender Job, wenn Anwender nicht die richtigen Werkzeuge zur Hand haben. Welche Rolle Bottom-up-Strategien und User Experience bei der Umsetzung erfolgreicher BI-Strategien haben, zeigt Tableau derzeit eindrucksvoll mit einer Reihe an neuen Features und Produkten. Mit der digitalen Transformation nehmen Volumen und…
News | Business Intelligence | Digitalisierung | Favoriten der Redaktion | Tipps | Whitepaper
Data Preparation: In 4 Schritten zum Data-Science-Projekt

Die richtige Data Preparation erhöht die Vorhersagequalität von Datenmodellen und steigert die Wirksamkeit von Machine Learning-Zyklen. Die meisten Daten sind ohne eine vorher durchgeführte Data Preparation für KI-gestützte Prognosen ungeeignet: ihre Qualität ist unzureichend, sie liegen nicht in numerischer Form vor, oder es fehlen Werte. Diese Handlungsempfehlungen unterstützen bei der Datenvorbereitung und helfen, den…
News | Trends Wirtschaft | Business Intelligence | Digitalisierung | Trends 2020 | Kommunikation | Lösungen | Services
Mehr als 40 Prozent der Data-Science-Tätigkeiten werden bis 2020 automatisiert sein

Laut des IT-Research und Beratungsunternehmens Gartner werden bis zum Jahr 2020 mehr als 40 Prozent der Data-Science-Tätigkeiten automatisiert sein – dies hat sowohl eine Produktivitätssteigerung zur Folge als auch eine intensivere Nutzung von Daten und Analytics durch sogenannte »Citizen Data Scientists«. Laut Gartner können Citizen Data Scientists die Lücke zwischen den Mainstream-Self-Service-Analytics der Businessanwender und…
Lösungen | Ausgabe 7-8-2016
Wettbewerbsvorteile durch Data-Science

In allen Unternehmen mit mehr oder weniger komplexen Geschäftsprozessen ist die heute anfallende Datenmenge enorm. Es hat sich mittlerweile herumgesprochen, dass eine gezielte Analyse dieser Daten unterschiedliche positive Effekte für ein Unternehmen bringt. Der Bedarf an Data-Science-Know-how ist deshalb groß wie nie, und der Kampf um diese Ressourcen zwischen den Abteilungen ist bereits in vollem Gange.
News | Business | Trends Wirtschaft | Business Intelligence | Digitale Transformation | Trends Geschäftsprozesse | Effizienz | Strategien
Intuitiv versus faktenbasiert: Nachholbedarf bei Data-Science-Nutzung

An der Bedeutung intelligenter Datenanalysen als Innovationsmotor und Treiber der digitalen Transformation herrscht in neun von zehn deutschen Firmen keinerlei Zweifel mehr. Für die meisten von ihnen steht der geschäftliche Nutzen von Data Science inzwischen außer Frage. Gleichwohl vertraut noch immer jedes zweite Unternehmen bei wichtigen Entscheidungen eher der menschlichen Intuition als computergestützten Analysen und…
News | Business | Geschäftsprozesse | Services
Datenintensive Geschäftsmodelle brauchen professionelle Data Governance

Viele moderne Unternehmen sind einem großen Effizienzdruck unterworfen und müssen ihre Prozesse stark anpassen, um wettbewerbsfähig zu bleiben. Dabei setzen sie verstärkt auf datenbasierte Geschäftsmodelle, immer häufiger auf KI-Technologien. Verstärkte Nutzung und Abhängigkeit von digitalen Daten erfordern eine besonders akkurate, konsistente und regelkonforme Datenverarbeitung und -verwaltung. Das ideale Mittel dazu ist Data Governance, der systematische…
News | Künstliche Intelligenz | Services | Ausgabe 3-4-2024
Data Analytics as a Service – Mehr Erkenntnisgewinn für alle
News | Künstliche Intelligenz
Nachfrage von Unternehmen nach KI – Databricks meldet ein jährliches Wachstum von über 70 Prozent in EMEA

Der Pionier der Data Intelligence Platform begrüßt neue Kunden und investiert in EMEA, um die Einführung generativer KI in der Region zu beschleunigen Databricks, das Daten- und KI-Unternehmen, gibt bekannt, dass sein EMEA-Geschäft im vergangenen Geschäftsjahr im Vergleich zum Vorjahr um mehr als 70 Prozent gewachsen ist, angetrieben durch einen Nachfrageschub nach Daten- und KI-Funktionen…
News | Industrie 4.0 | Künstliche Intelligenz
Vier Prinzipien des intelligenten Data Mesh auf dem Weg hin zu Industrie 4.0

Künstliche Intelligenz (KI) und maschinelles Lernen (ML) sind für Fabriken von erheblichem Nutzen. Es gibt jedoch nach wie vor Herausforderungen. Diese liegen normalerweise nicht in der Datenwissenschaft – denn der Code funktioniert in der Regel gut. Bei der Umsetzung von KI/ML-Projekten in großem Maßstab liegen die Herausforderungen vorwiegend in der Architektur und Datenverwaltung. Hersteller müssen…
News | Business Process Management | Digitalisierung | Künstliche Intelligenz | Rechenzentrum | Services
Databricks: Wir sind in allen relevanten Bereichen des Data-Managements der Stand der Dinge

Am 7. November 2023 hat die Firma Databricks in den Münchner Eisbachstudios die Hausmesse Data + AI Summit veranstaltet. Wir haben dort mit Roman Pritzkow gesprochen, den RVP DACH. Herr Pritzkow, zum Einstieg eine provokante Frage: Kann durch KI der Fachkräftemangel gelöst werden? Roman Pritzkow: Eine interessante Frage. Im Augenblick generiert KI mehr Bedarf…
News | Trends 2024 | Trends Services | Services
Top-Skill-Radar »Data Scientist«: Diese Fertigkeiten sind 2024 gefragt

Mehr als 70.000 Freelancer-Profile und 100.000 Projektbeschreibungen analysiert. Python, Power BI und Data Analysis meistgenannte Skills bei freiberuflichen Data Scientists. Auch bei Projektverantwortlichen große Nachfrage nach diesen Fertigkeiten; Experten für weitere Programmiersprachen und Plattformen ebenfalls gesucht. Um mehr als 1.300 Prozent ist das jährlich generierte, weltweite digitale Datenvolumen in den letzten zehn Jahren gestiegen:…
News | Lösungen | Produktmeldung
L’Oréal steigert das Kundenerlebnis durch den Einsatz von Databricks Lakehouse

Databricks, das Daten & KI-Unternehmen, gibt bekannt, dass L’Oréal, der Anbieter von Kosmetikprodukten, sich für Databricks entschieden hat, um die Interoperabilität seiner globalen Beauty Tech Data-Plattform zu ermöglichen und seine Multi-Cloud-Strategie zu verfolgen. Mit seiner starken Führungsposition im digitalen Bereich leistet L’Oréal nun Pionierarbeit im Bereich Beauty Tech. Die Experten der L’Oréal-Gruppe nutzen Daten…
News | Effizienz | Favoriten der Redaktion | Infrastruktur | Rechenzentrum | Ausgabe 3-4-2023
Reduzierung der Umweltauswirkungen von Data Centern – Ökologisierung von Rechenzentren

Es gibt viele Ansätze, Rechenzentren effizienter zu machen und weniger Strom zu verbrauchen, von der Art der erzeugten Elektrizität bis hin zur Aktualisierungsrate neuer Technologien. So können der Standort eines Rechenzentrums, die Nutzung erneuerbarer Energie, das Design des Rechenzentrums, die Flüssigkeitskühlung und die Auswahl geeigneter Server für das RZ den Strombedarf und die Kosten erheblich reduzieren.
News | Business | Tipps
3 Tipps für das Recruiting von Data Scientists im Retail

Spätestens seit dem E-Commerce-Boom sucht der Einzelhandel händeringend nach Data Scientists – noch mit mäßigem Erfolg. Dabei sind Daten das Lebenselixier des modernen Einzelhandels. Um sich als attraktiver Arbeitgeber zu positionieren, müssen Retail-Unternehmen auf dem Arbeitsmarkt das tun, was sie in ihrem Kerngeschäft am besten können: ihr Angebot auf die Zielgruppe zuschneiden. Michael Feindt, strategischer…
News | Business | Künstliche Intelligenz | Strategien | Ausgabe 11-12-2021
Data-Analytics-Strategie – Wie Unternehmen nachhaltig von Data Analytics profitieren

In der Breite nutzen bisher nur wenige Unternehmen künstliche Intelligenz (KI), oft bleibt die Entwicklung nach einem ersten Proof of Concept oder Pilotprojekt stecken. Damit sich das ändert, bedarf es einer funktionierenden Datenkultur. Vor allem gilt es jedoch, die Intelligenz an die richtige Stellen im Prozess zu bringen.
News | Business Process Management | Effizienz
Fünf Gründe für Automatisierung von Data Warehouses

Obwohl die Rolle von Daten bei der Entscheidungsfindung von Unternehmen zunehmend wichtiger wird, führen viele Firmen ihre ETL-Prozesse immer noch manuell durch und nehmen langwierige Prozesse und veralteten Daten in Kauf. In einem modernen Data Warehouse müssen Daten sich schnell und korrekt integrieren lassen, um ihre einfache Nutzung für die Geschäftsberichtserstattung sicherzustellen. Die traditionellen Ansätze…