
Unternehmen stehen beim Einsatz agentenbasierter KI-Workflows vor zwei zentralen Herausforderungen: schwer kalkulierbaren Betriebskosten und schwankender Ergebnisqualität. Besonders bei Modellen mit nutzungsabhängiger Abrechnung können steigende Anfragevolumina und komplexe Verarbeitungsschritte zu erheblichen Mehrkosten führen. Gleichzeitig steigt mit wachsender Komplexität das Risiko inkonsistenter oder unzureichender Antworten.
In der Praxis zeigt sich, dass viele Organisationen bei der Überführung von KI-Pilotprojekten in den produktiven Betrieb mit neuen Kostenmodellen konfrontiert werden. Insbesondere eine tokenbasierte Abrechnung kann dazu führen, dass der Ressourcenverbrauch im Hintergrund nur schwer vorhersehbar bleibt. Je komplexer eine Anfrage ausfällt, desto mehr Rechenschritte können erforderlich sein, was sowohl die Kosten als auch die Varianz der Ergebnisse erhöht.
Architekturansatz: Trennung von Entwurfs- und Ausführungsphase
Ein möglicher Lösungsansatz besteht darin, rechenintensive KI-Verfahren primär in der Entwurfsphase einzusetzen. In dieser Phase werden bestehende Prozesse analysiert, optimiert und als strukturierte Workflows modelliert. Solche Workflows können beispielsweise für Serviceanfragen, Genehmigungsprozesse, Schadensbearbeitung oder Abläufe im Gesundheitswesen entwickelt werden.
In der Ausführungsphase kann anschließend ein schlankerer KI-Mechanismus genutzt werden, der Anfragen einordnet, den passenden Workflow auswählt und diesen Schritt für Schritt abarbeitet. Für Teilaufgaben mit höherem Verarbeitungsbedarf – etwa Dokumentenanalyse oder Zusammenfassungen früherer Interaktionen – lassen sich gezielte, klar begrenzte KI-Aufrufe einsetzen. Dadurch wird die Ausführung kontrollierbarer und besser planbar.
Zentrale Vorteile dieses Ansatzes
Vorhersehbarere Ergebnisse: Wenn definierte und freigegebene Workflows die Ausführung steuern, sinkt die Wahrscheinlichkeit stark variierender Antworten. Das ist insbesondere in regulierten Umgebungen relevant, in denen Nachvollziehbarkeit, Konsistenz und Compliance hohe Priorität haben.
Bessere Kostenkontrolle: Wenn aufwändiges KI-Reasoning überwiegend in der Entwurfsphase stattfindet und nicht bei jeder einzelnen Laufzeitentscheidung erneut ausgelöst wird, lassen sich Prozesse effizienter betreiben. Dadurch verbessert sich die Kalkulierbarkeit der Betriebskosten.
Bewertung von Kostenmodellen
Zur wirtschaftlichen Bewertung agentenbasierter Systeme können Unternehmen Rechenmodelle verwenden, die verschiedene Abrechnungslogiken vergleichen. Dazu zählen insbesondere tokenbasierte, nutzerbasierte und fallbasierte Modelle. Der Vergleich sollte sich an realistischen Workflow-Volumina, der Komplexität einzelner Schritte und den Anforderungen an Qualität und Reaktionszeit orientieren.
Ergebnisorientierte Abrechnung als Alternative
Als Alternative zur Abrechnung pro Token oder pro Arbeitsplatz wird zunehmend eine ergebnisorientierte Bepreisung diskutiert. Dabei werden Kosten an abgeschlossene Vorgänge gekoppelt, also an klar definierte, vollständig bearbeitete Aufgaben. Ein solcher Ansatz kann die wirtschaftliche Bewertung vereinfachen, weil er die Abrechnung stärker mit dem tatsächlichen Geschäftsnutzen verknüpft.
Ob ein solches Modell geeignet ist, hängt von mehreren Faktoren ab: der Stabilität der Prozesse, der Messbarkeit von Ergebnissen, den Anforderungen an Transparenz sowie der Integration in bestehende Betriebs- und Governance-Strukturen. Für viele Organisationen kann es jedoch eine Möglichkeit sein, den KI-Einsatz planbarer und näher am operativen Mehrwert auszurichten.
Albert Absmeier & KI
Textquelle:
Pegasystems macht Schluss mit Token-Gebühren
Pegasystems, der Enterprise-KI-Softwareanbieter für geschäftskritische Prozesse, kündigt an, dass Unternehmen mit der kommenden Plattform-Version Pega Infinity 26 agentenbasierte Workflows entwerfen, erstellen und ausführen können, ohne pro Token zu bezahlen. Die Predictable-AI-Architektur verlagert das rechenintensive KI-Reasoning in die Entwurfsphase und beseitigt damit zwei große Hindernisse für Unternehmen: eskalierende Token-Kosten und unzuverlässige Ergebnisse.
Jetzt treffen die Rechnungen für Tokens ein und schockieren die Unternehmen. Während Organisationen ihre agentenbasierten Pilotprojekte in die Produktion bringen, stellen LLM-Anbieter ihre Pauschal-Abonnements auf teurere, tokenbasierte Preismodelle um und verbrauchen hinter den Kulissen still und heimlich kostspielige Reasoning-Tokens. Hinzu kommt: Je komplexer eine Anfrage ist, desto mehr Reasoning-Schritte sind erforderlich und desto wahrscheinlicher ist es auch, dass eine unzureichende und inkonsistente Antwort generiert wird.
Die KI-Architektur macht den Unterschied
Pegasystems wendet KI-Reasoning in der Design Time an, also bei der Neugestaltung veralteter Prozesse und Systeme, wo dessen kreative Leistungsfähigkeit den größten Mehrwert bietet. Mit Pega Blueprint AI und dem neuen Infinity Studio helfen Design-Agenten von Pegasystems dabei, optimale agentenbasierte Workflows für geschäftskritische Prozesse zu entwerfen und zu erstellen. Typische Beispiele dafür sind etwa die Bearbeitung einer Kundenanfrage, die Genehmigung eines Kredits, die Prüfung eines Schadenfalls oder die verbesserte Behandlung von Patienten.
Sobald die Workflows entworfen und bereitgestellt sind, wechselt Pegasystems in einen schlankeren semantischen KI-Modus, der besser für die Run Time geeignet ist, also die Phase, in der Agenten Millionen von Benutzeranfragen effizient und konsistent bearbeiten müssen. Anstatt jeden neuen Workflow aufs Neue zu durchdenken, nutzen die Agenten eine schlanke KI-Abfrage, um die Absicht des Nutzers zu erfassen, den besten Workflow für die Aufgabe zu finden und diesen dann Schritt für Schritt zu befolgen. Wenn ein bestimmter Schritt die intensivere Nutzung eines LLMs erfordert, etwa für das Parsen eines Dokuments oder die Zusammenfassung früherer Interaktionen, enthält der Schritt spezifische und klar abgegrenzte Anweisungen, um Vorhersehbarkeit zu gewährleisten.
Dieser Ansatz bietet zwei entscheidende Vorteile:
Vorhersehbare Ergebnisse: Das erneute Durchdenken jedes einzelnen Workflows führt zu inkonsistenten und unvorhersehbaren Ergebnissen. Mit Pegasystems verbundene Agenten folgen stattdessen konsistent vorab genehmigten Workflows. Das ist für regulierte Branchen entscheidend und für alle Unternehmen von großem Vorteil.
Vorhersehbare Kosten: Der Ansatz von Pegasystems nutzt KI-Reasoning einmalig zur Design Time, anstatt es immer wieder ineffizient in der Run Time einzusetzen. Dadurch können die KI-Agenten Prozesse deutlich effizienter und kostengünstiger steuern.
Token-Rechner macht Kosten ineffizienter KI-Agenten transparent
Mit dem AI Token Cost Calculator hilft Pegasystems Unternehmen dabei, die Vorteile dieses Ansatzes zu quantifizieren. Das interaktive Tool schätzt mögliche Einsparungen, indem es ausgehend vom Workflow-Volumen eines Unternehmens Pega AI mit tokenbasierten Alternativen vergleicht. Viele Unternehmen können je nach Komplexität und Umfang der Workflows Einsparungen von über 95 Prozent erzielen. Der AI Token Cost Calculator steht bereit auf: https://www.pega.com/de/ai-token-calculator .
Für die geleistete Arbeit bezahlen – und nicht für das Nachdenken darüber
Der ergebnisorientierte Ansatz von Pegasystems berechnet die Kosten pro abgeschlossenem Fall – also einer von Anfang bis Ende ausgeführten Aufgabe – und nicht pro Arbeitsplatz oder pro Token. Wenn ein Unternehmen beispielsweise einen KI-Agenten nutzt, um eine bestehende Bestellung zu ändern, wird diese abgeschlossene Interaktion als einzelner Fall erfasst.
Pega Infinity 26 ist ab dem dritten Quartal dieses Jahres verfügbar. Unternehmen zahlen einen einzigen Pauschalpreis pro abgeschlossenem Fall, unabhängig davon, wie viel KI von Pegasystems hinter den Kulissen zum Einsatz kommt. Dadurch werden die Kosten direkt an den geschäftlichen Nutzen gekoppelt.
»Unternehmen wird immer klarer, dass Tokenmaxxing unsinnig ist. Es führt nur zu untragbaren Kosten und unvorhersehbaren Ergebnissen«, erklärt Alan Trefler, Gründer und CEO von Pegasystems. »KI schafft am besten Wert, indem sie zuverlässige Ergebnisse in großem Maßstab liefert. Deshalb berechnen wir unseren Kunden keine Gebühren basierend auf der Anzahl der verwendeten Tokens, sondern nach der sinnvollen Arbeit, die agentenbasierte KI leistet. In Kombination mit einer Architektur, die gezielt auf eine kontrollierte Ausführung ausgelegt ist, bietet Pegasystems Unternehmen eine unvergleichliche Freiheit bei der Nutzung von KI-Agenten.«
Liz Miller, Vice President und Principal Analyst bei Constellation Research, kommentiert: »Wir haben einen Punkt im KI-Hype-Cycle erreicht, an dem Wert und Verantwortlichkeit die Diskussion prägen. KI-Ergebnisse wurden lange mit Geschäftsergebnissen verwechselt, was so Manchen dazu veranlasste, Tokenmaxxing blind zu unterstützen – als wäre das ein Maßstab für den Erfolg von KI-Agenten. Jetzt müssen LLM-Anbieter und Unternehmensanwender einen Return on Investment nachweisen und die steigenden Kosten rechtfertigen. Lösungen, die Token hocheffizient und zielgerichtet nutzen, verschaffen Unternehmen einen entscheidenden Wettbewerbsvorteil und ermöglichen es ihnen, ihre Ambitionen beim Einsatz von KI-Agenten weiter auszubauen.«
Weitere Informationen stehen auf: www.pega.com/dontpayfortokens .
7593 Artikel zu „KI Kosten“
News | Business | Favoriten der Redaktion | Geschäftsprozesse | Künstliche Intelligenz | Services | Tipps
Warum die Kosten der KI‑Nutzung steigen – und welche Rolle Tokens dabei spielen
Die wirtschaftliche Nutzung von KI erlebt 2026 eine Phase massiver Kostensteigerungen. Unternehmen, die KI ursprünglich als Effizienztreiber eingeführt haben, sehen sich nun mit Ausgaben konfrontiert, die in vielen Fällen die Personalkosten übersteigen. Ein zentraler Mechanismus hinter dieser Entwicklung ist das tokenbasierte Abrechnungsmodell moderner Sprachmodelle. Die Analyse zeigt: Die Kombination aus wachsendem Verbrauch, komplexeren Workflows und…
News | E-Commerce | Geschäftsprozesse | Kommentar | Services | Strategien
Zwischen KI-Hype und Kostenrealität: Trends im Retourenmanagement 2026
Kommentar von Artjom Bruch, CEO von Trusted Returns Schon seit Jahren wächst der Onlinehandel – doch 2026 steht der E‑Commerce unter ganz anderem Druck als noch in den letzten Jahren: Margen schrumpfen, Marktplätze gewinnen an Macht, KI verändert Einkaufspfade – und die Retourenabwicklung bleibt der teuerste blinde Fleck. Artjom Bruch, CEO von Trusted Returns,…
News | Business | Digitale Transformation | Favoriten der Redaktion | Künstliche Intelligenz | Tipps
Die Schattenkosten von KI-Investitionen und wie man sie sichtbar macht
In den vergangenen Jahren hat der Hype um künstliche Intelligenz zu Milliarden-Investitionen und großen Erwartungen geführt. Organisationen hoffen auf spürbare Effizienz- und Produktivitätssteigerungen sowie eine grundlegende Verbesserung ihrer Abläufe. In Deutschland erwarten laut der Bitkom-Studie »Künstliche Intelligenz in der deutschen Wirtschaft« 73 Prozent der Unternehmen eine Stärkung ihrer Wettbewerbsfähigkeit, 64 Prozent sinkende Kosten und 68…
News | Trends 2025 | Cloud Computing | Trends Wirtschaft | Künstliche Intelligenz | Strategien
Das Cloud-Kosten-Dilemma: Steigende Ausgaben behindern KI-Innovation in Europa
Während Unternehmen in ganz Europa weiterhin stark in KI investieren, zeigt sich eine harte Realität: Die mit der Cloud-Infrastruktur verbundenen Kosten steigen rasant an und zwingen Unternehmen dazu, schwierige Entscheidungen über die Verteilung ihrer IT-Budgets zu treffen. In meiner Rolle habe ich die Herausforderungen aus erster Hand erlebt, mit denen Unternehmen konfrontiert sind, wenn es…
News | Business | Trends 2025 | Trends Wirtschaft | Trends Services | Künstliche Intelligenz
Zwei Drittel der Unternehmen nutzen kostenpflichtige KI-Dienste
Unternehmen, die KI einsetzen, sind zumeist bereit dafür zu zahlen. KI findet Einzug in Produkte und Dienstleistungen – wird aber auch für die Verbesserung des eigenen Geschäftsbetriebs genutzt. Mit dem KI-Chat eine Antwortmail entwerfen, lange Texte zusammenfassen oder in der Entwicklungsabteilung Softwarecode schreiben: Unternehmen, die künstliche Intelligenz nutzen, setzen dabei überwiegend auf kostenpflichtige Dienste.…
News | Business | Trends 2025 | Trends Wirtschaft | Digitalisierung | Künstliche Intelligenz | New Work
Unternehmen setzen verstärkt auf KI, um Personalmangel und steigende Kosten zu kompensieren
62 % der deutschen Unternehmen blicken optimistisch auf das Jahr 2025 – dennoch bleiben Inflation, hohe Energiekosten und der Fachkräftemangel große Herausforderungen, insbesondere aufgrund der damit verbundenen finanziellen Belastungen. Über die Hälfte (55 %) der deutschen Unternehmen gibt an, dass steigende Lohn- und Sozialabgaben sowie andere Faktoren sie eher dazu veranlassen, auf künstliche Intelligenz (KI)…
News | Cloud Computing | Trends Cloud Computing | Trends Services | Services | Whitepaper
KI-Boom und Kostendruck geben AWS-Partnergeschäft starke Wachstumsimpulse
ISG hat 47 Dienstleister untersucht, die im deutschen Teil des Ökosystems von Amazon Web Services tätig sind. Gute Marktchancen haben Provider, die Beratungs-, Migrations- und Betriebsleistungen aus einer Hand bieten. Auch hierzulande zählt Amazon Web Services (AWS) zu den wichtigsten Anbietern von Public Cloud Services für Geschäftskunden. Dank dessen anhaltend hoher Innovationskraft, etwa bei…
News | Business | Effizienz | Favoriten der Redaktion | Künstliche Intelligenz | Whitepaper
KI und Kosten-Nutzen-Rechnung: Wenn ein Wunderkind erwachsen werden soll
Für den kosteneffizienten Einsatz von KI braucht es mehr als die Technologie selbst. Fünf Mythen, bei denen Finanzdienstleister aufhorchen sollten. Der Siegeszug der KI: Von Marketing bis Marktforschung, Big-Data-Analyse bis Betrugsprävention integrieren Finanzdienstleister künstliche Intelligenz (KI) in ihre Geschäftsprozesse. In der Regel arbeiten sie dabei mit den marktbeherrschenden Public-Cloud-Anbietern zusammen. Aber auch mittelständische Private-Cloud-Dienstleister…
News | Business | Business Process Management | Trends 2024 | Trends Cloud Computing | Geschäftsprozesse | Whitepaper
SAP Application Management: Unternehmen erwarten Kosteneinsparungen durch KI von bis zu 30 Prozent
Steigende Komplexität der IT-Landschaft macht die nahtlose Integration und Kommunikation zwischen SAP- und Nicht-SAP-Anwendungen zu einem zentralen Anliegen der Befragten. Cloud ist Trend: Über 70 Prozent der befragten Unternehmen entscheiden sich für die neueste Version von SAP S/4HANA, bevorzugt in der Cloud. Hohe Anforderungen an SAP-Partner: Kompetenzen rund um die Sicherheit der SAP-Systeme und einen…
News | Business | Künstliche Intelligenz | Strategien | Ausgabe 5-6-2024
KI: Strategie-Tipps zur Leistungs- und Kostenoptimierung – Kostentreiber bändigen
News | Trends 2024 | Favoriten der Redaktion | Trends Services | Künstliche Intelligenz | Whitepaper
Herausforderungen, ROI, Kosten & Co: Wie wird KI in Unternehmen wirklich eingesetzt?
Fivetran, der Anbieter für Data Movement, präsentiert die Ergebnisse einer Umfrage, die zeigt: 81 % der befragten Unternehmen vertrauen ihren KI/ML-Ergebnissen, obwohl sie zugeben, fundamentale Datenineffizienzen zu haben. Sie verlieren im Durchschnitt 6 % ihres weltweiten Jahresumsatzes, beziehungsweise 406 Millionen US-Dollar bei einem durchschnittlichen Jahresumsatz von 5,6 Milliarden US-Dollar der befragten Unternehmen. Die Ursache sind…
News | Effizienz | Services | Strategien | Ausgabe 1-2-2024
Softwarekosten drastisch reduzieren – So macht es der Anlagenbauer KIESELMANN
Die KIESELMANN GmbH zählt zu den führenden Herstellern von Fluidtechnik. Sieben Gesellschaften entwickeln und fertigen im baden-württembergischen Knittlingen Prozessarmaturen und Anlagen aus Edelstahl. Vom deutschen Produktionsstandort aus gehen die Anlagen und Komponenten in die ganze Welt. Dass an den 350 PC-Arbeitsplätzen IT-seitig alles reibungslos läuft – ohne dass die Kosten explodieren – darum kümmert sich ein Team aus ERP- und IT-Sicherheitsspezialisten, Microsoft-Lizenzverwaltern und Administratoren.
News | Business | Favoriten der Redaktion | Künstliche Intelligenz | Strategien | Tipps
Kostentreiber KI: Strategie-Tipps zur Leistungs- und Kostenoptimierung
Unternehmen nutzen vermehrt künstliche Intelligenz zur Optimierung ihrer operativen Effizienz und Produktinnovation. Eine aktuelle Umfrage des Beratungsunternehmens McKinsey zeigt, dass 40 Prozent der befragten Unternehmen aufgrund der rapiden Fortschritte im Bereich der generativen KI ihre Investitionen in KI-Technologien generell erhöhen wollen [1]. Ein Nachteil des zunehmenden Einsatzes ist jedoch, dass KI – insbesondere generative…
Strategien | Top-Thema | Ausgabe 9-10-2016
Mehr Transparenz für Kostenblöcke: Neue Wege im Benchmarking der Applikationsentwicklung
News | Trends Wirtschaft | Digitalisierung | Infografiken | Trends 2016 | Marketing
Teure Technik: So viel kosten Kinderhobbys in Deutschland
Ca. 550 Euro kostet ein Kind im Monat – davon fließen 12 bis 16 Prozent in Freizeitaktivitäten. Jugendliches Interesse an Soft- und Hardware am teuersten. Kinder kosten Geld – und das nicht nur in Bezug auf Unterbringung, Verpflegung oder Bildung. Auch für die Freizeitaktivitäten müssen Eltern monatlich einen gewissen Betrag einplanen. Vexcash hat sich intensiver…
Trends 2026 | News | Künstliche Intelligenz | New Work | Whitepaper
KI-Tools erobern den Arbeitsalltag – Studie zeigt: Jedes dritte Unternehmen hat keine klaren Richtlinien
75 Prozent der Beschäftigten nutzen inzwischen KI-Tools im Arbeitsalltag. Gleichzeitig verfügt jedes dritte Unternehmen über keine klaren Richtlinien für deren Einsatz. Der »Arbeitsplatz-Trendreport 2026« von SPS und der WORKTECH Academy zeigt: Nicht die Technologie selbst wird für Unternehmen zur Herausforderung, sondern ihre Integration in bestehende Kernprozesse.
News | Favoriten der Redaktion | Kommentar | Künstliche Intelligenz
Die verdrängte Frage der KI: Wer verliert?
Ein Plädoyer für Ehrlichkeit und dafür, dass die Verwerfungen durch KI ein Auftrag an Unternehmen, Gesellschaft und Politik sind. Kommentar von Stefan Maier*, Beirat bei Prior1 Kürzlich stand ich auf einer Bühne in Köln, beim Unternehmertreffen der Gemeinwohl-Ökonomie. Ich sprach über unsere Erfahrungen mit KI, über Chancen und Verantwortung. Und dann kam diese eine…
News | Favoriten der Redaktion | Künstliche Intelligenz | Strategien
Kleine KI-Modelle sehen robuster – wenn sie eine visuelle Kindheit durchleben
Forschungsprojekt der Universität Osnabrück ist Titelstory von Nature Machine Intelligence. Künstliche Intelligenz wird immer größer, immer datenhungriger und immer rechenintensiver. Doch eine neue Studie der Universität Osnabrück zeigt: Für robustes Sehen ist größer nicht immer besser. Entscheidend kann vielmehr sein, wie ein KI-System lernt. In einer neuen Publikation in Nature Machine Intelligence, die…
News | Business Process Management | Cloud Computing | Effizienz | Infrastruktur | Künstliche Intelligenz | Rechenzentrum
Globaler Namespace: Infrastruktur allein löst die Fragmentierung von KI-Daten nicht
KI scheitert in Unternehmen häufig nicht an mangelnder Infrastrukturleistung, sondern an fragmentierten Daten über Silos, Clouds, Regionen und operative Domänen hinweg. Agentische KI verschärft dieses Problem, weil autonome Systeme Daten in Echtzeit über verschiedene Umgebungen hinweg nutzen, interpretieren und für Entscheidungen operationalisieren. Ein moderner globaler Namespace entwickelt sich damit von einer Storage-Abstraktion zu einer einheitlichen…
Trends 2026 | News | Business | Business Process Management | Trends Services | Services
Die (negativen) finanziellen Folgen von KI in der Softwareentwicklung
Fast jedes dritte deutsche Unternehmen verzeichnet Verluste von mehr als einer Million US-Dollar. Die Studie Quality Transformation Report zeigt die Folgen des zunehmenden KI-Einsatzes in der Softwareentwicklung auf: Mangelhafte Softwarequalität kostet jedes fünfte Unternehmen weltweit mehr als eine Million US-Dollar jährlich – in Deutschland ist es sogar fast jedes dritte [1]. Auch kritische Branchen wie…

