Warum die Kosten der KI‑Nutzung steigen – und welche Rolle Tokens dabei spielen

foto magnific

Die wirtschaftliche Nutzung von KI erlebt 2026 eine Phase massiver Kostensteigerungen. Unternehmen, die KI ursprünglich als Effizienztreiber eingeführt haben, sehen sich nun mit Ausgaben konfrontiert, die in vielen Fällen die Personalkosten übersteigen. Ein zentraler Mechanismus hinter dieser Entwicklung ist das tokenbasierte Abrechnungsmodell moderner Sprachmodelle. Die Analyse zeigt: Die Kombination aus wachsendem Verbrauch, komplexeren Workflows und steigenden Infrastrukturkosten verschiebt die betriebswirtschaftliche Kalkulation grundlegend.

 

  1. Token als neue Recheneinheit der KI – und als Kostentreiber

Tokens sind die kleinsten Verarbeitungseinheiten, mit denen Sprachmodelle wie GPT, Claude oder Gemini arbeiten. Jede Eingabe und jede Ausgabe erzeugt Token – und damit Kosten. Aktuelle Berichte zeigen, wie stark dieser Verbrauch inzwischen eskaliert:

  • Unternehmen zahlen nicht nur für Software, sondern für jeden einzelnen Verarbeitungsschritt eines Modells.
  • Moderne KI‑Workflows erzeugen Millionen Tokens pro Stunde, insbesondere bei globalen Anwendungen.
  • Autonome KI‑Agenten verbrauchen ein Vielfaches klassischer Chatbots, da sie planen, Tools aufrufen, Ergebnisse prüfen und sich selbst korrigieren – jeder Schritt erzeugt zusätzliche Token.

Damit verschiebt sich die Kostenstruktur: Weg von Lizenzmodellen, hin zu verbrauchsabhängigen Abrechnungen, die schwer kalkulierbar sind.

 

  1. Beispiele aus der Praxis: Wenn Token-Budgets explodieren

Mehrere große Unternehmen zeigen, wie dramatisch die Kostenentwicklung ausfallen kann:

  • Uber hat sein gesamtes KI‑Budget für 2026 bereits vor Jahresmitte aufgebraucht – ein Großteil davon entfiel auf Token‑Kosten.
  • ServiceNow und weitere Unternehmen meldeten ebenfalls, dass Token‑Budgets bereits im ersten Halbjahr erschöpft waren.
  • Nvidia berichtet, dass die Ausgaben für Rechenleistung (»Compute«) inzwischen deutlich über den Personalkosten liegen.

Diese Fälle verdeutlichen, dass KI‑Nutzung im großen Stil nicht mehr als »Nebenposten« im IT‑Budget betrachtet werden kann.

 

  1. Warum die Kosten so stark steigen

3.1. Höherer Tokenverbrauch durch komplexere KI‑Systeme

Autonome Agenten, Multi‑Step‑Workflows und Retrieval‑Augmented‑Generation (RAG) erzeugen exponentiell mehr Token als einfache Chatbots. Eine einzelne Compliance‑Prüfung kann – je nach Modell – zwischen 2 und 20 Euro kosten. Bei tausenden Vorgängen pro Monat entstehen sechsstellige Kostenblöcke.

3.2. Steigende Infrastrukturkosten

Neben Token fallen weitere Kosten an:

  • Rechenleistung (GPU‑Cluster, Cloud‑Compute)
  • Speicher und Datenhaltung
  • Netzwerkkapazitäten
  • Modellbetrieb und Monitoring

Diese Infrastruktur treibt die globalen IT‑Ausgaben 2026 auf geschätzte 6,31 Billionen USD – ein Plus von 13,5  % gegenüber 2025. KI‑Infrastruktur ist einer der Haupttreiber.

3.3. Dynamische und schwer planbare Preismodelle

Anbieter passen ihre Preise und Limits laufend an:

  • Anthropic führte separate Credit‑Limits für Drittanbieter‑Agenten ein.
  • Unternehmen mit Jahresverträgen stehen plötzlich vor leeren Token‑Konten, weil der Verbrauch schneller steigt als geplant.

Damit wird Budgetplanung zu einem beweglichen Ziel.

 

  1. Wirtschaftliche Folgen: KI wird zur strategischen Kostenfrage

Die steigenden Kosten führen zu einer Neubewertung der KI‑Strategie:

  • Viele Unternehmen geben inzwischen mehr für KI‑Compute aus als für ihre gesamte Belegschaft.
  • Mittelständische Unternehmen unterschätzen die laufenden Kosten autonomer KI‑Workflows.
  • Startups verschieben ihre Investitionslogik: Statt Personalwachstum finanzieren sie »skalierbare Intelligenz«.

Damit wird KI nicht nur ein technologisches, sondern ein betriebswirtschaftliches Steuerungsthema.

 

  1. Handlungsempfehlungen für Unternehmen

5.1. Token‑Monitoring und Kostenkontrolle einführen

Unternehmen benötigen ein präzises Monitoring des Tokenverbrauchs pro Use Case. Ohne diese Transparenz entsteht eine »offene Stromrechnung mit unbekanntem Ende«.

5.2. Architekturentscheidungen überdenken

  • Einsatz kleinerer, spezialisierter Modelle (SLMs)
  • On‑Premises‑ oder Hybrid‑Ansätze zur Reduktion von Cloud‑Compute
  • Caching, Prompt‑Optimierung, RAG‑Effizienzsteigerung

5.3. Wirtschaftliche Bewertung pro Use Case

Nicht jeder KI‑Einsatz rechnet sich. Unternehmen sollten:

  • Kosten pro Vorgang berechnen
  • Nutzen (Zeitersparnis, Qualität, Automatisierungsgrad) quantifizieren
  • Alternativen prüfen (klassische Automatisierung, regelbasierte Systeme)

5.4. Vertragsmodelle aktiv managen

Da Anbieter ihre Limits und Preise dynamisch anpassen, müssen Unternehmen:

  • Verträge regelmäßig prüfen
  • Token‑Kontingente anpassen
  • Multi‑Vendor‑Strategien erwägen

 

Fazit

Die Kosten der KI‑Nutzung steigen 2026 massiv – und Token sind dabei der zentrale Hebel. Während KI weiterhin enorme Potenziale bietet, zwingt die neue Kostenstruktur Unternehmen zu einer professionellen, datengetriebenen Steuerung ihrer KI‑Workloads. Wer Tokenverbrauch, Infrastrukturkosten und Preismodelle nicht aktiv managt, riskiert Budgetüberschreitungen in Millionenhöhe. Gleichzeitig eröffnet die Entwicklung neue strategische Optionen: Skalierung durch Intelligenz statt Personal – allerdings nur, wenn die Kosten beherrschbar bleiben.

Albert Absmeier & KI

 


 

Weitere Quellen:

Microsoft hat diese Woche seine internen Claude‑Code‑Lizenzen eingestellt, nachdem die tokenbasierte Abrechnung die Kosten untragbar gemacht hatte – selbst für ein Unternehmen mit praktisch unbegrenzten Cloud‑Ressourcen. Der CTO von Uber verschickte ein internes Memo, in dem er warnte, dass das Unternehmen sein gesamtes KI‑Budget für 2026 in nur vier Monaten aufgebraucht habe. Die Preise für amerikanische KI‑Software sind um 20 % bis 37 % gestiegen, und GitHub (im Besitz von Microsoft) stellt seine Pauschalpläne zugunsten nutzungsbasierter Abrechnung über alle Produkte hinweg ein.

Meine Einschätzung

Die Ära der KI‑Subventionen endet gerade in Echtzeit. Dasselbe Unternehmen, das 13 Milliarden Dollar in OpenAI investiert und die Azure‑Infrastruktur aufgebaut hat, die einen Großteil der Rechenleistung von Anthropic antreibt, hat sich die Rechnung für ein Coding‑Tool eines Konkurrenten angesehen und entschieden, dass sie den Preis nicht lohnt. Das ist kein Produktivitätsproblem seitens Anthropic. Die tokenbasierte Preisgestaltung zwingt jeden Unternehmenskunden dazu, sich mit den tatsächlichen Kosten für den Betrieb dieser Modelle im großen Maßstab auseinanderzusetzen – und diese erweisen sich als deutlich höher, als es die Pauschalpreis‑Experimente vermuten ließen.

Anthropic, OpenAI und Google haben in den letzten sechs Monaten allesamt effektiv ihre Preise erhöht. Unternehmen, die ihre Arbeitsprozesse unter der Annahme aufgebaut haben, dass die KI‑Kosten weiter sinken würden, sehen nun, wie ihre Jahresbudgets innerhalb weniger Monate aufgebraucht werden. Von hier aus erscheinen zwei Entwicklungen wahrscheinlich: Entweder reduzieren Unternehmen ihre KI‑Nutzung, um innerhalb ihrer Budgets zu bleiben, was das Umsatzwachstum verlangsamt, das die Anbieter benötigen, um ihre Bewertungen vor Börsengängen zu rechtfertigen – oder die Anbieter senken die Preise und tragen die Verluste selbst, was die Stückökonomie genau im falschen Moment weiter verschlechtert. Beide Wege führen zum selben Ergebnis: Die Zahlen gehen nicht mehr auf, und irgendjemand muss die Abschreibung vornehmen.

Evolving AI

 

Mangelnde Kostentransparenz: KI-Entwicklung wird teurer

Softwarehäuser und IT-Beratungen in Deutschland geben zwischen 1.000 und 5.000 Euro pro Entwickler und Jahr für KI aus, wie eine Umfrage des IT-Profimagazins iX in Ausgabe 6/2026 unter fünf Unternehmen zeigt. Die großen KI-Anbieter drehen weiter an der Preisschraube, Unternehmen müssen sich auf deutlich höhere Kosten vorbereiten.

Die befragten Unternehmen – QAware, codecentric, TNG, Mayflower und NETWAYS – entwickeln KI-Systeme für Kunden und nutzen Coding-Agenten intensiv in der eigenen Arbeit. Seit Ende 2025 ist der Einsatz deutlich gestiegen: Bei QAware etwa sprangen die monatlichen Ausgaben für KI-Dienste von 3.000 Euro im Herbst 2025 auf 15.000 Euro Anfang 2026.

»Im Vergleich zu den horrenden Zahlen, die für US-Tech-Riesen durch das Internet geistern, nimmt sich das bescheiden aus«, ordnet Ulrich Wolf, stellvertretender Chefredakteur der iX, die Angaben ein. »Doch die Preise steigen bereits jetzt, denn die KI-Anbieter fahren ihre Dumping-Angebote gerade zurück, mit denen sie ihre Produkte durch günstige Abos in den Markt drückten.«

Kostenkontrolle wird also wichtiger. Doch spezielle Kontrollwerkzeuge sind noch die Ausnahme, wie Wolf erklärt. Die meisten Unternehmen prüfen ihre Ausgaben direkt in den Verwaltungsoberflächen der Anbieter. Nur codecentric setzt ein Gateway ein, das alle Anfragen an verschiedene KI-Anbieter bündelt und die Kosten für jedes Projekt einzeln ausweist.

Eine Alternative zu teuren Cloud-Diensten sind Open-Weights-Modelle auf eigenen Servern. Diese frei verfügbaren Sprachmodelle können die Kosten senken, sind aber nicht ganz so leistungsfähig und erfordern eigene GPU-Rechner – und die werden gerade massiv teurer. TNG betreibt neunzehn Server mit je acht Grafikprozessoren und kauft für jeden neuen Mitarbeiter eine weitere GPU. Ein Rechner mit acht Nvidia-B300-GPUs kostete vor drei Monaten 480.000 Euro, heute sind es 800.000 Euro.

»Ein ungelöster Punkt ist die Kostenweitergabe«, fasst Wolf zusammen. Bisher tragen die Dienstleister die Ausgaben für KI-Abfragen selbst oder verstecken sie in ihren Margen. Doch je mehr automatisierte Arbeitsabläufe den Verbrauch steigern, desto weniger funktioniert das. Statt wie bisher nur Zeit und Material abzurechnen, müsste künftig auch der Token-Verbrauch berechnet werden. Wie sich das am Markt durchsetzen lässt, ist unklar.

Alle Befragten rechnen damit, dass die Ausgaben weiter steigen. »Dass Softwareentwicklung zu einem kapitalintensiven Geschäft wird, ist keine Zukunftsvision mehr, sondern bereits Gegenwart«, konstatiert Wolf. Ein passendes Abrechnungsmodell dafür fehlt noch. Die KI-Kosten belasten die Budgets bereits jetzt spürbar und die Branche muss Wege finden, diese Ausgaben wirtschaftlich abzubilden.

In weiteren Beiträgen der Ausgabe beleuchtet iX, wie sich KI-Kosten vorab schätzen lassen und stellt KI-Gateways vor, die die Ausgaben überwachen. Zudem betrachtet die Redaktion Messlücken beim KI-Einsatz in Unternehmen und ob sich die Investitionen tatsächlich auszahlen.

Besuchen Sie den Newsroom: https://www.heisegroup.de/presse#/pressreleases/ix-magazin-mangelnde-kostentransparenz-3449784

 

7532 Artikel zu „KI Kosten“

Zwischen KI-Hype und Kostenrealität: Trends im Retourenmanagement 2026

Kommentar von Artjom Bruch, CEO von Trusted Returns   Schon seit Jahren wächst der Onlinehandel – doch 2026 steht der E‑Commerce unter ganz anderem Druck als noch in den letzten Jahren: Margen schrumpfen, Marktplätze gewinnen an Macht, KI verändert Einkaufspfade – und die Retourenabwicklung bleibt der teuerste blinde Fleck. Artjom Bruch, CEO von Trusted Returns,…

Die Schattenkosten von KI-Investitionen und wie man sie sichtbar macht

In den vergangenen Jahren hat der Hype um künstliche Intelligenz zu Milliarden-Investitionen und großen Erwartungen geführt. Organisationen hoffen auf spürbare Effizienz- und Produktivitätssteigerungen sowie eine grundlegende Verbesserung ihrer Abläufe. In Deutschland erwarten laut der Bitkom-Studie »Künstliche Intelligenz in der deutschen Wirtschaft« 73 Prozent der Unternehmen eine Stärkung ihrer Wettbewerbsfähigkeit, 64 Prozent sinkende Kosten und 68…

Das Cloud-Kosten-Dilemma: Steigende Ausgaben behindern KI-Innovation in Europa

Während Unternehmen in ganz Europa weiterhin stark in KI investieren, zeigt sich eine harte Realität: Die mit der Cloud-Infrastruktur verbundenen Kosten steigen rasant an und zwingen Unternehmen dazu, schwierige Entscheidungen über die Verteilung ihrer IT-Budgets zu treffen. In meiner Rolle habe ich die Herausforderungen aus erster Hand erlebt, mit denen Unternehmen konfrontiert sind, wenn es…

Zwei Drittel der Unternehmen nutzen kostenpflichtige KI-Dienste

Unternehmen, die KI einsetzen, sind zumeist bereit dafür zu zahlen. KI findet Einzug in Produkte und Dienstleistungen – wird aber auch für die Verbesserung des eigenen Geschäftsbetriebs genutzt.   Mit dem KI-Chat eine Antwortmail entwerfen, lange Texte zusammenfassen oder in der Entwicklungsabteilung Softwarecode schreiben: Unternehmen, die künstliche Intelligenz nutzen, setzen dabei überwiegend auf kostenpflichtige Dienste.…

Unternehmen setzen verstärkt auf KI, um Personalmangel und steigende Kosten zu kompensieren

62 % der deutschen Unternehmen blicken optimistisch auf das Jahr 2025 – dennoch bleiben Inflation, hohe Energiekosten und der Fachkräftemangel große Herausforderungen, insbesondere aufgrund der damit verbundenen finanziellen Belastungen. Über die Hälfte (55 %) der deutschen Unternehmen gibt an, dass steigende Lohn- und Sozialabgaben sowie andere Faktoren sie eher dazu veranlassen, auf künstliche Intelligenz (KI)…

KI-Boom und Kostendruck geben AWS-Partnergeschäft starke Wachstumsimpulse

ISG hat 47 Dienstleister untersucht, die im deutschen Teil des Ökosystems von Amazon Web Services tätig sind. Gute Marktchancen haben Provider, die Beratungs-, Migrations- und Betriebsleistungen aus einer Hand bieten.   Auch hierzulande zählt Amazon Web Services (AWS) zu den wichtigsten Anbietern von Public Cloud Services für Geschäftskunden. Dank dessen anhaltend hoher Innovationskraft, etwa bei…

KI und Kosten-Nutzen-Rechnung: Wenn ein Wunderkind erwachsen werden soll

Für den kosteneffizienten Einsatz von KI braucht es mehr als die Technologie selbst. Fünf Mythen, bei denen Finanzdienstleister aufhorchen sollten.   Der Siegeszug der KI: Von Marketing bis Marktforschung, Big-Data-Analyse bis Betrugsprävention integrieren Finanzdienstleister künstliche Intelligenz (KI) in ihre Geschäftsprozesse. In der Regel arbeiten sie dabei mit den marktbeherrschenden Public-Cloud-Anbietern zusammen. Aber auch mittelständische Private-Cloud-Dienstleister…

SAP Application Management: Unternehmen erwarten Kosteneinsparungen durch KI von bis zu 30 Prozent

Steigende Komplexität der IT-Landschaft macht die nahtlose Integration und Kommunikation zwischen SAP- und Nicht-SAP-Anwendungen zu einem zentralen Anliegen der Befragten. Cloud ist Trend: Über 70 Prozent der befragten Unternehmen entscheiden sich für die neueste Version von SAP S/4HANA, bevorzugt in der Cloud. Hohe Anforderungen an SAP-Partner: Kompetenzen rund um die Sicherheit der SAP-Systeme und einen…

Herausforderungen, ROI, Kosten & Co: Wie wird KI in Unternehmen wirklich eingesetzt?

Fivetran, der Anbieter für Data Movement, präsentiert die Ergebnisse einer Umfrage, die zeigt: 81 % der befragten Unternehmen vertrauen ihren KI/ML-Ergebnissen, obwohl sie zugeben, fundamentale Datenineffizienzen zu haben. Sie verlieren im Durchschnitt 6 % ihres weltweiten Jahresumsatzes, beziehungsweise 406 Millionen US-Dollar bei einem durchschnittlichen Jahresumsatz von 5,6 Milliarden US-Dollar der befragten Unternehmen. Die Ursache sind…

Softwarekosten drastisch reduzieren – So macht es der Anlagenbauer KIESELMANN

Die KIESELMANN GmbH zählt zu den führenden Herstellern von Fluidtechnik. Sieben Gesellschaften entwickeln und fertigen im baden-württembergischen Knittlingen Prozessarmaturen und Anlagen aus Edelstahl. Vom deutschen Produktionsstandort aus gehen die Anlagen und Komponenten in die ganze Welt. Dass an den 350 PC-Arbeitsplätzen IT-seitig alles reibungslos läuft – ohne dass die Kosten explodieren – darum kümmert sich ein Team aus ERP- und IT-Sicherheitsspezialisten, Microsoft-Lizenzverwaltern und Administratoren.

Kostentreiber KI: Strategie-Tipps zur Leistungs- und Kostenoptimierung

Unternehmen nutzen vermehrt künstliche Intelligenz zur Optimierung ihrer operativen Effizienz und Produktinnovation. Eine aktuelle Umfrage des Beratungsunternehmens McKinsey zeigt, dass 40 Prozent der befragten Unternehmen aufgrund der rapiden Fortschritte im Bereich der generativen KI ihre Investitionen in KI-Technologien generell erhöhen wollen [1].   Ein Nachteil des zunehmenden Einsatzes ist jedoch, dass KI – insbesondere generative…

Teure Technik: So viel kosten Kinderhobbys in Deutschland

Ca. 550 Euro kostet ein Kind im Monat – davon fließen 12 bis 16 Prozent in Freizeitaktivitäten. Jugendliches Interesse an Soft- und Hardware am teuersten. Kinder kosten Geld – und das nicht nur in Bezug auf Unterbringung, Verpflegung oder Bildung. Auch für die Freizeitaktivitäten müssen Eltern monatlich einen gewissen Betrag einplanen. Vexcash hat sich intensiver…

Wie das Gehirn Relevanz erkennt – und KI davon lernt

Vom Gehirn inspirierte künstliche Intelligenz (KI) löst zentrale Aufgaben visueller Aufmerksamkeit.   Die Leistung des menschlichen Gehirns, aus der Fülle von Informationen, die es ununterbrochen aufnimmt, die relevanten zu filtern, wird als Aufmerksamkeit bezeichnet. Wissenschaftlerinnen und Wissenschaftler  des Forschungszentrums BIFOLD an der Technischen Universität Berlin haben nun in enger Zusammenarbeit mit Forschern des »Kording Lab«…

Deutschland bei KI-Fitness vor den USA – aber hinter China und dem eigenen Potenzial

Globale AI-Performance-Studie mit Einordnung für Deutschland: Drei Viertel der KI-Wertschöpfung entfallen weltweit auf nur 20 Prozent der Unternehmen. Deutschland im AI Fitness Index vor den USA, UK und Japan, aber mit deutlichem Rückstand bei KI-getriebenem Umsatzwachstum. Nur jedes vierte deutsche Unternehmen richtet KI auf Wachstum aus. Stärke bei Governance und Daten wird nicht in Geschäftswirkung…

Die DSGVO im KI-Zeitalter: Wenn Maßnahmen nicht mehr zur Realität passen

Executive Summary TOM-Dokumentationen (Art. 32 DSGVO) sind veraltet, weil sie zwischen 2018–2022 entstanden und nicht auf autonome KI‑Agenten, Prompt‑Injection‑Risiken oder dynamische Modelle ausgelegt sind. Art. 32 basiert auf einem Akteursmodell, das nicht mehr existiert: DSGVO setzt vorhersehbare, zweckgebundene menschliche oder systemische Akteure voraus – KI‑Agenten brechen diese Logik. Drei neue technische Anforderungen werden notwendig: Authentifizierung gegen den…

Fast die Hälfte der Beschäftigten verlässt sich zu stark auf KI

Management Summary: KI steigert Produktivität, erhöht aber die Abhängigkeit: 46 Prozent der Beschäftigten in der DACH-Region sagen, dass sie sich bereits zu stark auf KI verlassen. Besonders junge Mitarbeitende sehen Kompetenzverlust: Vor allem in der Gen Z wächst die Sorge, dass intensive KI-Nutzung Fähigkeiten, Selbstvertrauen und Karrierechancen schwächt. Fehlende Leitplanken verschärfen Risiken: Druck zur KI-Nutzung…

Millionen für KI und kein Effekt: Warum Finanzchefs 2026 umsteuern müssen

Management Summary Viele CFO-Organisationen investieren 2026 weiter massiv in KI, erzielen aber keinen belastbaren Wertbeitrag. Der Engpass liegt nicht in der Technologie, sondern in fehlender Governance, fragmentierten Datenmodellen und einer falschen Verortung von KI als IT-Thema statt als Fachtransformation. Wer jetzt umsteuert, sollte das Fundament priorisieren: integrierte Datenbasis, klare Steuerungslogik und eine Umsetzung, die Business…