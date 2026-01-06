Mit über einer Billion verarbeiteten Tokens gehört das deutsche KI-Unternehmen TNG Technology Consulting zu den zehn bedeutendsten Modellautoren von Open-Source Large Language Modellen (LLMs) auf der weltweiten KI-Plattform OpenRouter. In der von Andreessen Horowitz ermittelten Top-10-Liste ist TNG mit dem achten Platz der einzige deutsche Vertreter.

Das deutsche KI-Unternehmen TNG Technology Consulting aus München erreicht in einer Liste der bedeutendsten Modellautoren von frei verfügbaren LLMs den achten Platz. Zu diesem Schluss kommt eine neue empirische Studie der US-amerikanischen Wagniskapitalfirma Andreessen Horowitz in Zusammenarbeit mit OpenRouter, einer der größten Aggregator-Plattformen für die Nutzung von kommerziellen und Open-Source LLMs [1].

TNG belegt in der Auflistung der Schlüsselspieler für Open-Source LLMs den achten Platz. (© TNG Technology Consulting GmbH)

In der Studie »State of AI – An Empirical 100 Trillion Token Study with OpenRouter« wird das Verhalten von drei Millionen Usern auf OpenRouter analysiert. Als zentrale Metrik für die Platzierung in der Liste dient die Anzahl der verarbeiteten Tokens, also grob die Anzahl der vom Sprachmodell gelesenen und geschriebenen Silben, im Zeitraum von November 2024 bis November 2025. Hier kommt TNG auf einen Wert von 1,13 Billionen und damit einen weltweiten Marktanteil von über 1 % auf OpenRouter. TNG ist das einzige deutsche Unternehmen, das eine Top-10-Platzierung verbuchen kann, und zusammen mit Mistral AI aus Frankreich einer der zwei Vertreter aus Europa. Die übrigen Plätze belegen die drei großen amerikanischen Unternehmen Meta, OpenAI und Google sowie fünf chinesische Firmen, allen voran DeepSeek und Alibaba Qwen.

Die Top-10-Platzierung ist auf die hohe weltweite Nutzung der »Chimera«-Modelle von TNG zurückzuführen, die das Unternehmen im April und Juli 2025 veröffentlicht hat. Diese Modelle sind mit der »Assembly of Experts«-Methode gebaut, einer Eigenentwicklung, mit der aus mehreren Basismodellen ein neues Modell mit optimierten Eigenschaften konstruiert werden kann. Insbesondere das Modell »R1T2 Chimera« auf Basis von DeepSeek-Modellen wird in der KI-Community sehr intensiv genutzt [2]. In Summe verarbeiten die Chimera-Modelle aktuell rund 20 Milliarden Tokens pro Tag.

»Dass unsere Innovation zur Erstellung von Sprachmodellen in der weltweiten Nutzung einen Spitzenplatz belegt, ist eine Bestätigung unserer intensiven KI-Forschung und Produktentwicklung. Die internationale Wahrnehmung eilt der Wahrnehmung in Deutschland aktuell noch voraus. Unsere Chimera-Methode stellt auch einen wichtigen Baustein für souveräne KI-Lösungen ›aus Europa für Europa‹ dar, sowohl für Unternehmen als auch für Behörden und Regierungen«, kommentiert Robert Dahlke, Geschäftsführer von TNG und einer der Chimera-Entwickler, die Platzierung. »›China Speed‹, also hart und fokussiert zu arbeiten und einen Wettlauf der Ideen auszurichten, um marktfähige Produkte in hohem Tempo zu konstruieren, geht auch in Deutschland«, ergänzt Henrik Klagges, ebenfalls Chimera-Entwickler und der Kopf hinter der TNG-Vision. »Man muss es nur wollen.«

Es wird viel über die Vorteile von SLMs (Small Language Models) diskutiert. Und doch geht die Diskussion oft an der Sache vorbei. Denn es geht nicht um Größe oder Komplexität. Es geht vielmehr darum, wie SLMs konzipiert sind, um Entscheidungen zu treffen und die richtige Balance zu finden zwischen ihrer Spezialisierung und ihrer Fähigkeit zu breiterem, allgemeinem Wissen. Der wahre Wert eines SLM liegt in seiner Fähigkeit, spezialisiertes Wissen und Argumente zu liefern, die dem Generalisten, dem LLM (Large Language Model), helfen, fundierte Entscheidungen zu treffen, zu bestimmen, wann der Experte hinzugezogen werden muss, und das Richtige zu tun.

Wie die meisten Technologien, die sich durchsetzen, haben SLMs ihre Vorteile. Aber sie sind wie Spezialisten: Sie zeichnen sich in bestimmten Bereichen aus, zum Beispiel Recht oder Finanzen. Das ist gleichzeitig das Problem mit den Spezialisten: Sie haben einen engen Fokus, und ihre Definition ändert sich im Laufe der Zeit. Zum Beispiel hat ein SLM, das sich auf zivile Infrastrukturen konzentriert, keinen Einblick in die Verkehrsinfrastruktur oder in die Überschneidungen der beiden Fachgebiete. So wie sich die menschliche Intelligenz weiterentwickelt, müssen sich auch die Spezialgebiete und damit die SLMs verändern. Um effektiv zu bleiben, müssen SLMs wachsen und neue Daten verarbeiten. Nur so können sie unser Verständnis von Intelligenz imitieren.

SLM oder LLM – einfach ein Sprachmodell! Werden SLMs also zu LLMs werden? Wer kann überhaupt sagen, wo ein SLM aufhört und ein LLM beginnt? Da sich die Modelle weiterentwickeln, werden die Grenzen zwischen ihnen verschwimmen. Wir sollten Debatten über die Vorteile vermeiden, die die Größe eines Modells bietet, und sie einfach Sprachmodelle nennen.

Versteht man SLMs als die Experten und LLMs als die Allrounder, wird es interessant: Das LLM ist eher ein »Entscheider« – es kann bestimmen, welche Spezialisierung für eine bestimmte Aufgabe erforderlich ist. Sobald es diese Entscheidung getroffen hat, kann es die entsprechenden SLMs für das bereichsspezifische Fachwissen anzapfen, das benötigt wird, um das Problem zu durchdenken und eine Antwort zu finden. In diesem Sinne leiten LLMs den Prozess, während SLMs das tiefe, spezialisierte Wissen bereitstellen. Man könnte sich sogar ein SLM vorstellen, das darauf spezialisiert ist, zu bestimmen, welche SLMs für eine bestimmte Aufgabe zu Rate gezogen werden sollen.

So wie politische Berater eine Führungskraft anweisen können, Spezialisten auf ihrem jeweiligen Gebiet zu konsultieren, werden diese Modelle zunehmend als Kontrollinstanz fungieren: Sie treffen Entscheidungen, lenken das Gespräch und verweisen an den richtigen Experten für die jeweilige Aufgabe.

Sprachmodelle: Balance zwischen Tiefe und Breite. Allerdings ist es nicht möglich, ein Modell so zu trainieren, dass es alle Bereiche abdeckt. Deshalb gibt es immer einen Kompromiss zwischen Tiefe und Breite. Ein Modell kann entweder tief in einen einzelnen Bereich eintauchen oder ein breiteres Netz über viele Bereiche auswerfen. Aber es gibt immer eine Grenze dafür, wie sehr es sich wirklich spezialisieren kann, ohne sein allgemeines Wissen zu verlieren.

Die eigentliche Herausforderung entsteht, wenn mehrere Bereiche zusammengeführt werden sollen. Je mehr Bereiche einbezogen sind, desto schwieriger wird es, herauszufinden, welches Fachwissen in einer bestimmten Situation benötigt wird. Es ist, als würde man mit zu vielen Bällen jonglieren. Irgendwann wird etwas herunterfallen.

Wenn dann noch das Problem der Analyse-Paralyse hinzukommt, bei der ein Übermaß an Informationen das Weiterkommen verhindert, entsteht ein echter Engpass bei der Entscheidungsfindung. Das ist das Paradoxon der Wahl: Zu viel Wissen kann den Fortschritt behindern.

Wir dürfen nicht vergessen, dass auch ein LLM seine eigenen Grenzen hat. Die Komplexität der Aufgabe bedeutet oft, dass es einen Kompromiss gibt zwischen der Zeit, die sie brauchen, um ein Problem zu durchdenken, und der Zeit, die sie brauchen, um eine Antwort zu geben. Je länger sie zum Nachdenken brauchen, desto langsamer können sie Antworten geben. Das ist so, als würde man von einem Generalisten verlangen, schnell zu sein, aber gleichzeitig erwarten, dass er Stunden braucht, um eine perfekte Lösung zu finden. Und obwohl die Wahrscheinlichkeit, die richtige Antwort zu erhalten, mit der Zeit zunimmt, erreichen Modelle, genau wie Menschen, einen Punkt, an dem der Nutzen abnimmt.

Nützliche Tendenzen bei künstlicher Intelligenz. Bei den SLM gibt es einige klare Einschränkungen, insbesondere was den Zugang zu Wissen und die Fähigkeit zur Bewältigung komplexer, realer Situationen betrifft. Aber man kann von diesen Modellen nicht erwarten, dass sie alles können, und genau wie größere Modelle erben sie oft Tendenzen von den Menschen, die sie trainieren.

Andererseits kann diese Tendenz auch von Vorteil sein: In manchen Fällen ist sie ein Schutzmechanismus. Das lässt sich mit den Grundwerten oder Standardprozeduren vergleichen, die ein Unternehmen braucht, um Ordnung und Konsistenz zu wahren. Ohne diese Leitprinzipien könnte es zu Chaos kommen.

In der künstlichen Intelligenz (KI) sind einige Tendenzen also nützlich. Sie können den Modellen helfen, in ihren spezialisierten Bereichen schnelle, maßgebliche Entscheidungen zu treffen. Problematisch wird es, wenn diese Tendenzen falsch angewandt werden oder zu starr sind und die Anpassungsfähigkeit einschränken. Eine gewisse Voreingenommenheit in einem SLM kann für eine begrenzte, spezialisierte Aufgabe von Vorteil sein. Allerdings muss sichergestellt werden, dass sie nicht zu weit geht und das Modell in seiner Fähigkeit einschränkt, sich weiterzuentwickeln und komplexere Aufgaben zu bewältigen.

Warum die Debatte am Thema vorbeigeht. Die Herausforderungen, Kompromisse zwischen Tiefe und Breite zu finden, die Risiken der Analyse-Unfähigkeit und die Nuancen der Tendenzen weisen alle auf eine wichtige Erkenntnis hin: Bei der Weiterentwicklung dieser Modelle müssen wir uns weniger auf ihre Benennung konzentrieren, sondern mehr auf ihre Fähigkeit, die Komplexität zu bewältigen und fundierte, ausgewogene Entscheidungen zu treffen.

Die eigentliche Frage ist, wie diese Modelle uns helfen können, in einer immer komplexeren Welt Klarheit zu finden.

Steve Mayzak,

Global Managing Director of Search AI

bei Elastic

1039 Artikel zu „KI LLM“