KI, Training, Inferenz und RAG – neues Potenzial für KI

Illustration Absmeier foto freepik ki

Am 30. November 2022 wurde ChatGPT von OpenAI der Welt vorgestellt, der Rest ist Geschichte – im wahrsten Sinne des Wortes. Seitdem sind zwei Jahre vergangen, und das Interesse an KI ist rasant gestiegen. Dies hat zu einer mehrfachen Steigerung der Marktkapitalisierung von Nvidia, dem führenden Hersteller von Grafikprozessoren, geführt. Auch andere Player wurden geweckt, nicht zuletzt DeepSeek aus China. Parallel dazu überschlagen sich die Meldung um geplante Milliardeninvestitionen rund um KI-Infrastruktur.

 

Markus Grau von Pure Storage analysiert den Hype und fragt, wohin die jüngsten Meldungen und Entwicklungen führen könnten.

 

Es fühlt sich alles ganz anders an als die früheren KI-Durchbrüche in den letzten 70 Jahren, vom Turing-Test über die Niederlagen von Schachgroßmeistern gegen die Maschine bis hin zum autonomen Fahren, gefolgt vom anhaltenden Boom der generativen KI. Das Spiel hat sich grundlegend verändert, aber beruht immer noch auf bestimmten grundlegenden Konzepten. Seit vielen Jahren basieren KI-Fortschritte auf drei Schlüsselentwicklungen: erstens leistungsstärkere Rechenressourcen in Form von GPUs, zweitens verbesserte Algorithmen oder Modelle, im Fall der generativen KI die Transformer-Architektur sowie Large Language Models (LLMs), und drittens Zugang zu riesigen Datenmengen. Auf einer sehr hohen Ebene umfassen die Phasen eines KI-Projekts die Datenerfassung und -aufbereitung, die Modellentwicklung und -schulung sowie die Modellbereitstellung, auch bekannt als Inferenz.

 

Alles dreht sich um die Daten

Datenerfassung und -aufbereitung dürfen nicht übersehen werden: Gute, relevante und »unvoreingenommene« Daten sind der Schlüssel zu einem erfolgreichen KI-Projekt. Es wird oft darauf hingewiesen, dass Unternehmen Schwierigkeiten haben, ihre Daten zu verstehen, die Datenhoheit zu ermitteln und Silos aufzubrechen, damit diese Daten effektiv genutzt werden können. Ohne Zugang zu qualitativ hochwertigen Daten ist der Erfolg einer Initiative unwahrscheinlich. Immer mehr Unternehmen verwenden in ihren KI-Projekten multimodale Daten, nicht nur Text, sondern auch Audio, Bilder und sogar Videos. Die Datenmenge und damit die zugrundeliegenden Speicheranforderungen sind erheblich.

 

Training des Modells

Die Trainingsphase erfolgt in der Regel auf eine von zwei Arten. Beim grundlegenden Modelltraining wird eine riesige Datenmenge genutzt, um ein KI-Modell von Grund auf zu erstellen und dieses Modell iterativ zu trainieren und ein allgemeines Modell für die Verwendung zu erstellen. Dies wird in der Regel von großen Technologieunternehmen mit vielen Ressourcen durchgeführt. Meta hat kürzlich über das Training seines Open-Source-Modells Llama 3.1 mit 405 Milliarden Parametern und über 15 Billionen Token berichtet. Dies nahm etwa 40 Millionen GPU-Stunden auf 16.000 GPUs in Anspruch. Die lange Trainingszeit für das Modell verdeutlicht einen wichtigen Aspekt beim Training großer Modelle: häufiges Checkpointing, um eine Wiederherstellung nach Fehlern zu ermöglichen. Bei großen Modellen ist es unerlässlich, dass der für das Checkpointing verwendete Speicher über eine sehr hohe Schreibleistung und -kapazität verfügt.

Der zweite Trainingsansatz ist die Modell-Feinabstimmung. Dabei wird ein bestehendes Modell, bei dem ein anderer Beteiligter die Hauptarbeit geleistet hat, verwendet und durch weiteres Training domainspezifische Daten auf dieses Modell angewendet. Auf diese Weise profitiert ein Unternehmen von seinem eigenen personalisierten Modell, muss es aber nicht von Grund auf neu trainieren.

Unabhängig vom Ansatz erfordert das Training eine massiv parallele Verarbeitung mit GPUs, was einen hohen Durchsatz und Zugriffsgeschwindigkeiten erfordert, um große Datensätze auf effiziente Weise zu bewältigen. Die Datenspeicherung für das KI-Training muss daher eine sehr hohe Leistung bieten, nicht zuletzt, um die GPUs mit Daten zu versorgen, Skalierbarkeit für die Verwaltung großer Trainingsdatensätze und Zuverlässigkeit angesichts der Bedeutung und der Kosten von Trainingsmodellen.

 

Überführung in die Produktion

Sobald ein Modell trainiert wurde und seine Leistung den Anforderungen entspricht, wird es in die Produktion überführt. Zu diesem Zeitpunkt verwendet das Modell Daten, die es zuvor noch nicht gesehen hat, um Schlussfolgerungen zu ziehen oder Erkenntnisse zu gewinnen. Dies wird als Inferenz bezeichnet und ist der Zeitpunkt, an dem der Wert aus einer KI-Initiative abgeleitet wird. Der Ressourcenverbrauch und die Kosten, die mit der Inferenz verbunden sind, stellen die des Trainings in den Schatten, da die Inferenz ständig und potenziell in großem Umfang Rechen- und Speicherkapazitäten beansprucht, wie im Falle von Millionen von Benutzern, die auf einen Chatbot für den Kundenservice zugreifen.

Der zugrundeliegende Speicher für die Inferenz muss eine hohe Leistung erbringen. Diese ist der Schlüssel für die Bereitstellung zeitnaher Ergebnisse sowie für eine einfache Skalierung ist, um die Speicheranforderungen der Daten zu erfüllen. Die Daten werden in das Modell für die Aufzeichnung eingespeist, und um Daten für das erneute Training bereitzustellen. Die Qualität der Ergebnisse aus der Inferenz steht in direktem Zusammenhang mit der Qualität des trainierten Modells und des Trainingsdatensatzes. Generative KI hat die Genauigkeit der Inferenz auf den Kopf gestellt. Aufgrund der Natur der generativen KI sind Ungenauigkeiten, sogenannte Halluzinationen, sehr wahrscheinlich. Diese Ungenauigkeiten haben zu Problemen geführt, die häufig in die Schlagzeilen geraten sind.

 

Verbesserung der Genauigkeit

Benutzer von ChatGPT werden die Bedeutung der in das Modell eingegebenen Abfrage erkennen. Eine gut strukturierte, umfassende Abfrage kann zu einer viel genaueren Antwort führen als eine knappe Frage. Dies hat zum Konzept des »Prompt Engineering« geführt, bei dem ein großer, gut strukturierter Datensatz als Abfrage an das Modell gesendet wird, um die optimale Ausgabe zu erzielen.

Ein alternativer Ansatz, der immer wichtiger wird, ist Retrieval Augmented Generation (RAG). RAG ergänzt die Abfrage um die eigenen Daten in Form eines anwendungsspezifischen Kontexts, der direkt aus einer Vektordatenbank wie Chroma oder Milvus stammt. Im Vergleich zum Prompt Engineering liefert RAG bessere Ergebnisse und reduziert die Wahrscheinlichkeit von Halluzinationen erheblich. Ebenso wichtig ist die Tatsache, dass aktuelle, zeitnahe Daten mit dem Modell verwendet werden können, anstatt auf einen historischen Stichtag beschränkt zu sein.

RAG ist darauf angewiesen, die Daten eines Unternehmens zu vektorisieren, damit sie in die Gesamtarchitektur integriert werden können. Vektordatenbanken verzeichnen im Vergleich zur Quelle oft ein signifikantes Wachstum der Datensatzgröße, das bis zu 10-mal so hoch sein kann, und sind sehr leistungsempfindlich, da die Benutzererfahrung direkt mit der Antwortzeit der Vektordatenbankabfrage zusammenhängt. Daher spielt der zugrundeliegende Speicher in Bezug auf Leistung und Skalierbarkeit eine wichtige Rolle bei der erfolgreichen Implementierung von RAG.

 

Das Energieproblem der KI

In den letzten Jahren sind die Stromkosten weltweit in die Höhe geschossen, und es gibt keine Anzeichen für eine Verlangsamung. Darüber hinaus hat der Anstieg der generativen KI dazu geführt, dass der Energiebedarf von Rechenzentren um ein Vielfaches gestiegen ist. So schätzt die IEA, dass der Stromverbrauch von KI, Rechenzentren und Kryptowährungen im Jahr 2022 fast zwei Prozent des weltweiten Energiebedarfs ausmachte – und sich dieser Energiebedarf bis 2026 verdoppeln könnte. Dies ist zum Teil auf den hohen Strombedarf von GPUs zurückzuführen, die Rechenzentren belasten und 40 bis 50 Kilowatt pro Rack benötigen – weit über die Kapazität vieler Rechenzentren hinaus.

Die Steigerung der Effizienz im gesamten Rechenzentrum ist von entscheidender Bedeutung, d. h. eine Infrastruktur wie die All-Flash-Datenspeicherung ist für die Verwaltung von Strom und Platz unerlässlich, da jedes Watt, das bei der Speicherung eingespart wird, dazu beitragen kann, mehr GPUs mit Strom zu versorgen. Mit einigen All-Flash-Speichertechnologien ist es möglich, den Energieverbrauch um bis zu 85 Prozent zu senken und bis zu 95 Prozent weniger Rack-Platz gegenüber Wettbewerbslösungen zu belegen. Daraus resultiert ein erheblicher Mehrwert auf Speicherseite als wichtiger Bestandteil des KI-Ökosystems.

 

Datenspeicherung als Teil des KI-Puzzles

Das Potenzial von KI ist nahezu unvorstellbar. Damit KI-Modelle jedoch Ergebnisse liefern können, ist ein sorgfältiger Ansatz beim Training erforderlich, sei es beim grundlegenden Training oder bei der Feinabstimmung, um zu einer genauen und skalierbaren Inferenz zu gelangen. Die Einführung von RAG kann genutzt werden, um die Ausgabequalität noch weiter zu verbessern.

Es ist klar, dass Daten in allen Phasen eine Schlüsselkomponente sind. Flash-Speicher ist unerlässlich, um die transformative Wirkung von KI auf Wirtschaft und Gesellschaft zu entfalten, und bietet eine unübertroffene Leistung, Skalierbarkeit und Zuverlässigkeit. Flash unterstützt den Echtzeitzugriff von KI auf unstrukturierte Daten, erleichtert sowohl das Training als auch die Inferenz und reduziert gleichzeitig den Energieverbrauch und die CO2-Emissionen, was diese Technologie für eine effiziente und nachhaltige KI-Infrastruktur unverzichtbar macht.

 

4264 Artikel zu „Potenzial KI“

Ungenutztes Potenzial: 42 Prozent der deutschen Angestellten arbeiten noch ohne KI

Wirtschaft schöpft Leistungsvermögen von künstlicher Intelligenz zu selten aus. Für die tägliche Arbeit nutzen nur 46 Prozent der deutschen Arbeitnehmenden künstliche Intelligenz (KI) wie Chat GPT oder DeepL. Das zeigt die aktuelle Studie »Cybersicherheit in Zahlen« von der G DATA CyberDefense AG, Statista und Brand eins [1]. Dabei bietet der Einsatz von KI für Unternehmen…

2025: Bewältigung von Datenherausforderungen zur Entfaltung der KI-Potenziale

Durch den rasanten technologischen Wandel sind datengesteuerte Initiativen in modernen Geschäftsstrategien wichtiger denn je. Im Jahr 2025 stehen die Unternehmen jedoch vor neuen Herausforderungen, die ihre Datenstrategien, ihre Bereitschaft für künstliche Intelligenz (KI) und ihr allgemeines Vertrauen in Daten auf die Probe stellen werden. Insgesamt ist die Bereitschaft für KI in internationalen Unternehmen sehr gering…

KI in deutschen Unternehmen – Enormes Potenzial

Die Ergebnisse der Studie »Unlocking Europe’s AI Potential in the Digital Decade«  zeigen, dass Unternehmen in Deutschland das Potenzial von KI erkennen und immer häufiger von den Vorteilen der Technologien profitieren. Die Unternehmen zeigen sich sehr zufrieden mit den Auswirkungen durch die Einführung von KI, da KI zur Steigerung ihres  Unternehmenswerts beiträgt, die Produktivität erhöht…

Potenziale und Grenzen der KI: Aktuelle und zukünftige Anwendungsfälle

Die Transformation in Unternehmen, die durch die Potenziale der künstlichen Intelligenz ermöglicht wird, stellt eine der zentralen Herausforderungen und Chancen der Zukunft dar. Die Schlüsseltechnologie der KI bietet erhebliche Wertschöpfungspotenziale, die durch die rasanten Fortschritte im Bereich der Large Language Models (LLMs) verstärkt werden. Diese Entwicklungen führen zu einer grundlegenden Disruption der bisherigen Ansätze im…

Reputation von Talenten sagt Innovationspotenzial von KI-fokussierten Unternehmen voraus

Die Daten von Zeki zeigen neue Wege auf, um Investitionsmöglichkeiten und -risiken zu erkennen, indem die besten KI-Talente mit fortgeschrittenen Fähigkeiten in Wissenschaft und Technik identifiziert und verfolgt werden.   Zeki, ein in Großbritannien ansässiges Datenunternehmen, das nach eigenen Angaben über den genauesten Deep-Tech-Human-Capital-Intelligence-Datensatz verfügt, der jemals erstellt wurde, veröffentlichte seinen ersten AI Companies Report…

Umwelt- und Klimaschutz: KI-Leuchttürme heben Potenziale von künstlicher Intelligenz

Im Rahmen des Vernetzungstreffens der Förderinitiative »KI-Leuchttürme für Umwelt, Klima, Natur und Ressourcen« hat Bettina Hoffmann, Parlamentarische Staatssekretärin im Bundesumweltministerium, 13 KI-Leuchtturmprojekte gewürdigt. Die Projekte gehören zu insgesamt 53 Vorhaben, die das Bundesumweltministerium mit einem Fördervolumen von insgesamt rund 70 Millionen Euro in ihrer Arbeit unterstützt.   Bettina Hoffmann, Parlamentarische Staatssekretärin im BMUV: »Künstliche Intelligenz…

»Wir sollten KI-Potenziale nutzen und gleichzeitig kritisch bleiben.«

Lori Niles-Hofmann ist seit 25 Jahren Lernstrategin im Bereich Learning & Development (L&D). Ihr Spezialgebiet sind digitale Lerntransformationen. Die Kanadierin tritt auf der diesjährigen LEARNTEC als Keynote-Speakerin auf. Im Gespräch verrät sie vorab, welche Unterschiede es im Umgang mit künstlicher Intelligenz zwischen Europa und Kanada gibt, warum Jobtitel nicht mehr so wichtig sind und wie…

KI im CC: Potenzial und Grenzen der neuen Technologie

  Der Kontakt via WhatsApp, Facebook Messenger, MS Teams oder Slack wird im Kundensupport immer beliebter. Speziell in Deutschland ist aber auch das Telefon nach wie vor ein wichtiger Support-Kanal. Das liegt nicht zuletzt an den mitunter schlechten Erfahrungen mit Chatbots. Aber die werden durch den Einsatz von künstlicher Intelligenz immer besser. Die Analysten Gartner…

Großes Potenzial für KI im Kundenservice

Josef Novak, einer der Mitgründer der Spitch AG, eines internationalen Anbieters von KI-basierten Dialogsystemen, hat im August dieses Jahres die Funktion des Chief Innovation Officer im Unternehmen übernommen. In einem Statement gibt er seine Einschätzung über den aktuellen Stand und die künftige Entwicklung der künstlichen Intelligenz für die Kundenkommunikation ab.   KI-gesteuerter Kundenservice steigert Engagement…

Neue Studie belegt Nachhaltigkeitspotenziale von KI-Anwendungen

Anwendungen der künstlichen Intelligenz können dazu beitragen, die Nachhaltigkeitsziele der Vereinten Nationen und der Bundesregierung zu erreichen. Zu diesem Schluss kommt eine neue Studie, die im Rahmen der Begleitforschung zum Technologieprogramm »Künstliche Intelligenz als Treiber für volkswirtschaftlich relevante Ökosysteme« (KI-Innovationswettbewerb) des Bundesministeriums für Wirtschaft und Klimaschutz (BMWK) durchgeführt wurde.   Die Studie »Nachhaltigkeit durch den…

KI in der Arbeitswelt: 11 Szenarien zeigen Gefahren und Potenziale

  Das Projektkonsortium ExamAI analysiert in zwei neuen Publikationen elf Anwendungsszenarien künstlicher Intelligenz aus den Bereichen Personalmanagement und Produktionsautomatisierung. Der Fokus liegt auf Fairness- und Safety-Aspekten.   Künstliche Intelligenz (KI) erhält zunehmend Einzug in verschiedenste Bereiche der Arbeitswelt und ist teilweise bereits fester Bestandteil betrieblicher Abläufe. Insbesondere im Personal- und Talentmanagement sowie in der maschinellen…

Crowdworking ist noch die Ausnahme – hat aber Potenzial

Jedes fünfte Unternehmen ist offen für den Einsatz von Crowdworkern. Bislang haben vor allem große Unternehmen Crowdworking genutzt. Crowdworking führt in Deutschland bislang ein Nischendasein. Nur jedes vierte Unternehmen (26 Prozent) gibt an zu wissen, was sich hinter dem Begriff verbirgt. Und bislang haben erst 3 Prozent der Unternehmen schon einmal zumindest einzelne Arbeiten mit…

Monetarisierung von Self-Tracking-Daten hat großes Potenzial

Etwa ein Fünftel aller Deutschen trackt in mindestens einem Lebensbereich seine Daten. Der Großteil der sogenannten Self Tracker trackt im Bereich Fitness und Gesundheit. Wie die Studie »Quantified Wealth Monitor 2016« zeigt, würden 54 Prozent der Befragten ihre Daten einer Krankenkasse anvertrauen [1]. Im Zuge der Quantified-Self-Bewegung erfasst bereits ein erheblicher Bevölkerungsteil kontinuierlich Daten über…

Größtes deutsches KI-Verzeichnisses: »alles-ki« empfiehlt KI-basiert passende KI-Lösungen für alle Branchen

Der Einsatz künstlicher Intelligenz sorgt für maximale Effizienzgewinne in allen Branchen – sofern Unternehmen das passende Tool für ihre Problemstellung und Branche finden. Das neue KI-Verzeichnis »alles-ki« findet in Sekunden das richtige KI-Tool aus mehr als 16.600 Lösungen.   Künstliche Intelligenz verändert die Wirtschaft – Experten prognostizieren branchenübergreifend Effizienzgewinne von zirka 20 Prozent. Dabei stehen…

Resilient gegen Desinformation – mit KI im Kampf für gesellschaftlichen Zusammenhalt

Dr. Vera Schmitt arbeitet an der größten deutschsprachigen KI-Plattform zur Desinformationserkennung. Im Interview gibt sie Antworten zu aktuellen Herausforderungen.   Desinformationskampagnen, die den gesellschaftlichen Zusammenhalt bedrohen, nehmen weltweit rasant zu. Doch wie kann die Gesellschaft auf diese Herausforderung reagieren? Dr. Vera Schmitt und ihre Forschungsgruppe XplaiNLP am Quality and Usability Lab der TU Berlin haben…

Whitepaper: KI-Disruption treibt Innovation bei On-Device-Inferenz an

Die Vorstellung des KI-Modells DeepSeek R1 hat in der Technologiebranche für Aufsehen gesorgt, da seine Leistung mit den besten KI-Modellen vergleichbar oder sogar überlegen ist. Dies markiert einen Wendepunkt in der Entwicklung von KI, insbesondere bei hochwertigen, kleinen Sprach- sowie multimodalen Modellen, die für kommerzielle Anwendungen und On-Device-Ausführung vorbereitet sind. Vier Trends treiben diese Veränderung…

Platform Engineering im KI-Zeitalter

Red Hat, weltweiter Anbieter von Open-Source-Lösungen, hat einen Bericht zum Stand des Platform Engineering im Zeitalter der KI erstellt. Er untersucht Trends, Herausforderungen und Best Practices, um besser zu verstehen, wie und warum Unternehmen Platform-Engineering-Verfahren implementieren. Der Report basiert auf einer weltweiten Umfrage unter 1.000 Plattformingenieuren und IT-Entscheidungsträgern. Platform Engineering hat die Art und Weise…

Von KI bis IoT: Technologische Innovationen revolutionieren die Logistik 2025

Dank der rasanten Entwicklung moderner Softwaresysteme wird Software dieses Jahr ein zentraler Treiber der Automatisierung. Durch intelligente Lösungen werden Prozesse nicht nur einfacher steuerbar, sondern auch effizienter und anpassungsfähiger. Sie bilden die Grundlage für intelligente Automatisierung und Business Process Management (BPM), die künftig maßgeblich zur Effizienzsteigerung in der Logistik beitragen. Dabei spielt vor allem künstliche…

KI & Cybersecurity: Drei Sicherheitstrends für 2025

Die gute Nachricht: Dank KI werden Unternehmen 2025 noch mehr Möglichkeiten und fortschrittlichere Tools zur Verfügung stehen, mit denen sie ihre IT-Systeme und Mitarbeitenden effektiv vor Cyberangriffen schützen können. Die schlechte Nachricht: KI ist keine Technologie, die ausschließlich für gute Zwecke genutzt wird. Auch Cyberkriminelle werden sie sich zunutze machen, um Unternehmen gleich mehrere Schritte…