Warum Wikipedia den Einsatz generativer KI einschränkt: Habsburg KI als datenökologisches Risiko

Illustration Absmeier foto freepik ki

Die Entscheidung der englischsprachigen Wikipedia, den Einsatz großer Sprachmodelle (Large Language Models, LLMs) zum Schreiben oder Umschreiben von Artikeln weitgehend zu untersagen, markiert einen Wendepunkt im gesellschaftlichen Umgang mit generativer künstlicher Intelligenz. Auf den ersten Blick wirkt das Verbot paradox: Gerade LLMs sind in der Lage, formal korrekte, gut strukturierte und enzyklopädisch anmutende Texte zu erzeugen. Doch die Maßnahme ist weniger Ausdruck von Technikfeindlichkeit als vielmehr eine Reaktion auf ein inzwischen gut dokumentiertes Phänomen der KI‑Forschung: den sogenannten Model Collapse, auch bekannt als Model Autophagy Disorder (MAD). Emily Bender nennt es »Habsburg AI«. Die Inzucht‑Analogie mag überspitzt erscheinen, ist aber einprägsam.

 

Unter Model Collapse versteht man die fortschreitende Verschlechterung generativer Modelle, wenn diese wiederholt mit Daten trainiert werden, die von früheren KI‑Systemen erzeugt wurden. Mehrere unabhängige Forschungsarbeiten, unter anderem von Oxford, Cambridge und veröffentlicht in Nature, zeigen übereinstimmend, dass sich die statistischen Ausgabeverteilungen solcher Modelle mit jeder Generation verengen. Zunächst verschwinden seltene oder randständige Muster; in späteren Phasen konvergieren die Ausgaben zunehmend auf einen engen Mittelwert. Die Modelle verlieren damit schrittweise die Fähigkeit, die ursprüngliche Vielfalt ihrer Trainingsdaten abzubilden. [ibm.com]

 

Das zugrunde liegende Problem ist struktureller Natur

Generative KI lernt nicht Bedeutung oder Wahrheit, sondern Wahrscheinlichkeiten: welche Wortfolgen, Satzmuster oder Bildstrukturen in den Trainingsdaten häufig auftreten. Menschlich erzeugte Daten enthalten dabei eine hohe Varianz – kreative Brüche, Fehler, Minderheitenperspektiven, ungewöhnliche Metaphern oder widersprüchliche Argumentationsweisen. KI‑generierte Daten hingegen sind zwangsläufig statistisch geglättet. Sie bevorzugen das Wahrscheinliche, das Sichere und das Mittelmaß. Werden solche Ausgaben erneut als Trainingsmaterial verwendet, trainiert das Modell nicht mehr auf der Realität, sondern auf einer vereinfachten Kopie derselben.

 

Alles ist korrekt – aber nichts ist neu

Dieser Effekt äußert sich je nach Modalität unterschiedlich. Bei Texten führt Model Collapse primär zu einer sprachlichen Verarmung. In frühen Phasen verschwinden seltene Wörter, ungewöhnliche Satzkonstruktionen und originelle Argumentationsmuster. Später dominieren wiederkehrende Phrasen, formelhafte Übergänge und eine charakteristische »LLM‑Sprache«. Die Texte bleiben grammatikalisch korrekt und logisch konsistent, verlieren jedoch Originalität, argumentative Tiefe und stilistische Vielfalt. Der subjektive Eindruck lässt sich treffend so zusammenfassen: Alles ist korrekt – aber nichts ist neu.

 

Alles sieht gut aus – aber alles sieht gleich aus

Bei Bildern zeigt sich derselbe Mechanismus als visuelle Degeneration. Während erste Generationen KI‑erzeugter Bilder oft als ästhetisch ansprechend wahrgenommen werden – mit klarer Beleuchtung, symmetrischen Kompositionen und »perfekten« Motiven –, gehen bei wiederholtem Training auf synthetischen Daten feine Texturen, zufällige Unregelmäßigkeiten und natürliche Asymmetrien verloren. In späteren Stadien verstärken sich Artefakte, bestimmte Muster tauchen ubiquitär auf, und Bildinhalte beginnen zu verschmelzen. Das Ergebnis wirkt sauber, aber monoton: Alles sieht gut aus – aber alles sieht gleich aus.

 

Autophagie

Besonders tückisch ist, dass Model Collapse kurzfristig wie ein Qualitätsgewinn erscheinen kann. Die Glättung statistischer Ausreißer führt zu konsistenteren, fehlerärmeren Ausgaben. Erst langfristig wird sichtbar, dass diese »Verbesserung« mit einem Verlust an Anpassungsfähigkeit, Robustheit und Kreativität einhergeht. Forschende sprechen deshalb von einem selbstverstärkenden Rückkopplungseffekt: Kleine Fehler, Verzerrungen oder Halluzinationen werden nicht korrigiert, sondern über Generationen hinweg weitervererbt und verstärkt – ein Prozess, den die Literatur als »Selbstkonsum« oder Autophagie beschreibt.

 

Ein Akt der Datenökologie

Vor diesem Hintergrund erhält die Entscheidung der Wikipedia eine besondere Bedeutung. Wikipedia fungiert weltweit als zentrale Referenz‑ und Trainingsquelle für KI‑Systeme. Gelangen in großem Umfang KI‑generierte Texte in dieses Ökosystem, besteht die Gefahr einer globalen Rückkopplungsschleife: KI schreibt Wikipedia‑Artikel, diese werden als vermeintliche »Ground Truth« in künftige Trainingsdaten aufgenommen, und neue Modelle reproduzieren und verstärken die synthetischen Muster. Mit jeder Iteration wird die Kontamination schwerer zu erkennen und kostspieliger zu beheben. Das Verbot ist daher weniger eine redaktionelle Maßnahme als vielmehr ein Akt der Datenökologie – ein Versuch, die Qualität einer zentralen Wissensressource und damit auch der zukünftigen KI‑Systeme zu schützen.

 

Qualität und Herkunft der Daten entscheiden(d)

Die Forschung ist sich in einem Punkt bemerkenswert einig: Ohne einen kontinuierlichen Zufluss frischer, menschlich erzeugter und vielfältiger Daten ist Model Collapse langfristig unvermeidlich. Synthetische Daten können in begrenztem, kontrolliertem Umfang sinnvoll sein, etwa zur Datenaugmentation oder in klar abgegrenzten Domänen. Sie können jedoch den Verlust realweltlicher Varianz nicht kompensieren. KI kann Realität komprimieren – sie kann sie nicht regenerieren.

Die Wikipedia‑Entscheidung ist daher nicht nur ein medienpolitisches Signal, sondern ein frühes institutionelles Eingreifen in ein grundlegendes technisches Problem. Sie macht deutlich, dass die Nachhaltigkeit generativer KI nicht allein eine Frage von Rechenleistung oder Modellarchitektur ist, sondern in hohem Maße von der Qualität und Herkunft der Daten abhängt, auf denen diese Systeme lernen.

Albert Absmeier & KI

 

Quellen

  1. Shumailov, I., Shumaylov, Z., Zhao, Y., Papernot, N., Anderson, R., & Gal, Y. (2024). AI models collapse when trained on recursively generated data. Nature, 631, 755–759. https://doi.org/10.1038/s41586-024-07566-y [nature.com]
  2. Alemohammad, S., Casco-Rodriguez, J., Luzi, L., Humayun, A. I., Babaei, H., LeJeune, D., Siahkoohi, A., & Baraniuk, R. G. (2023). Self-Consuming Generative Models Go MAD. arXiv preprint arXiv:2307.01850. https://doi.org/10.48550/arXiv.2307.01850 [arxiv.org]
  3. Xing, X., Shi, F., Huang, J., Wu, Y., Nan, Y., Zhang, S., Fang, Y., Roberts, M., Schönlieb, C.-B., Del Ser, J., & Yang, G. (2025). On the caveats of AI autophagy. Nature Machine Intelligence, 7, 172–180. https://doi.org/10.1038/s42256-025-00984-1 [nature.com]
  4. Ropek, L. (2026). Wikipedia cracks down on the use of AI in article writing. TechCrunch (26 March 2026). [techcrunch.com]
  5. Bansal, A. (2026). Wikipedia bans AI-generated article content after RfC. MediaNama (26 March 2026). [medianama.com]

 


Ergänzung:

Wer hat den Begriff »Habsburg AI« geprägt?

Der Begriff »Habsburg AI« wurde von Jathan Sadowski geprägt, einem Wissenschaftler im Bereich Technik‑ und Gesellschaftsforschung. Er verwendete die Metapher, um zu beschreiben, wie KI‑Modelle degenerieren können, wenn sie wiederholt mit KI‑generierten Daten trainiert werden – analog zur genetischen Degeneration der Habsburger durch Inzucht. [straitstimes.com]

Welche Rolle spielt Emily Bender?

Die im Text erwähnte Emily M. Bender ist Linguistin und KI‑Ethikerin (University of Washington). Sie ist bekannt für Begriffe und Konzepte wie:

  • „Stochastic Parrots“ (mit Timnit Gebru u. a.)
  • grundlegende Kritik an Sprachmodellen, Trainingsdaten und KI‑Hype

In dem Text wird »Habsburg AI« sinngemäß Emily Bender zugeschrieben, weil ihre Arbeiten inhaltlich sehr gut zu dieser Kritik passen (Daten‑Feedback‑Loops, Modellkollaps). Die Urheberschaft des Begriffs selbst liegt jedoch bei Jathan Sadowski, nicht bei ihr. [straitstimes.com]

Warum kommt es oft zur Verwechslung?

  • Bender ist eine der prominentesten Stimmen zur Kritik an LLM‑Training und Datenqualität.
  • Der Begriff »Habsburg AI« wird häufig in denselben Debatten verwendet wie Benders Arbeiten.
  • Autoren schreiben den Begriff daher manchmal verkürzt oder ungenau ihr zu.

 

 

4897 Artikel zu „KI Risiko“

Unternehmensrisiko: KI im Einsatz ohne Kontrolle

Die meisten Unternehmen können nicht sagen, wie schnell sie ein KI-System in einer Krise stoppen könnten – und viele könnten danach nicht erklären, was schiefgelaufen ist.   KI-Technologie wird in europäischen Unternehmen in rasantem Tempo eingeführt, aber viele haben sie ohne die passende Governance- und Sicherheitsinfrastruktur implementiert. Das geht aus einer neuen Studie von ISACA…

Agents of Chaos: KI-Agenten als neue Risikoklasse

Autonome KI‑Agenten auf Basis von Large Language Models (LLMs) entwickeln sich rasant von experimentellen Chatbots zu handlungsfähigen Systemen, die eigenständig Aufgaben ausführen, Werkzeuge nutzen, kommunizieren und Entscheidungen treffen. Das Paper »Agents of Chaos« analysiert erstmals systematisch, welche neuen Sicherheits‑, Datenschutz‑ und Governance‑Risiken dadurch entstehen [1].   Die Studie basiert auf einer zweiwöchigen Red‑Teaming‑Untersuchung mit realistisch…

Mehr Risikokapital für KI – weniger für Energie

Laut Internationaler Energieagentur konkurrieren Energie‑Startups immer stärker mit KI‑Firmen um Risikokapital (Venture Capital, VC) [1]. Der KI‑Boom verschiebe Kapital und Aufmerksamkeit – auch von großen generalistischen Fonds – in Richtung KI. Die IEA weißt zugleich daraufhin, dass der Rückgang energiebezogener VC‑Finanzierung auch mit dem Auslaufen eines großen Finanzierungszyklus in der Elektromobilität (EVs und EV‑Batterien) zusammenhängt.…

Welche Compliance-Risiken beschert KI deutschen Unternehmen – Vom Regelhüter zum Risikonavigator

Das Interview mit Oliver Riehl, Regional Vice President DACH bei NAVEX, beleuchtet die Herausforderungen und Chancen, die künstliche Intelligenz (KI) für deutsche Unternehmen im Bereich Compliance mit sich bringt. Riehl betont, dass KI helfen kann, Ordnung in die wachsende Komplexität der Regularien zu bringen, jedoch eine gute Governance und klare Richtlinien erforderlich sind, um effektiv eingesetzt zu werden. Zudem wird die Bedeutung einer vertrauensvollen Compliance-Kultur hervorgehoben, um Datenverluste zu vermeiden und die Effizienz von Hinweisgebersystemen zu steigern.

Prüfbare KI-Qualität: MISSION KI präsentiert Qualitätsstandard und digitales Prüfportal für Niedrigrisiko-KI

Der VDE hat sich an dem Projekt MISSION KI – Nationale Initiative für Künstliche Intelligenz und Datenökonomie beteiligt. Entstanden sind ein Qualitätsstandard und ein Portal für die strukturierte Bewertung der Qualität von KI-Systemen, die sich unterhalb der Hochrisikoschwelle befinden.   Die Partner des Projekts MISSION KI – Nationale Initiative für Künstliche Intelligenz und Datenökonomie haben…

Cybervorfälle sind das größte Geschäftsrisiko – KI in diesem Zusammenhang Fluch und Segen zugleich

Cyberangriffe sind in Deutschland das größte Geschäftsrisiko – noch vor Naturkatastrophen, politischen Risiken oder regulatorischen Herausforderungen. Das zeigt die aktuelle Umfrage Allianz Risk Barometer 2025. Jüngste Vorfälle zeigen: Bedrohung ist real Allein im Juli 2025 sorgten zahlreiche Bedrohungen für Schlagzeilen. Darunter sogenannte DDoS-Attacken auf kommunale Websites von Stadtverwaltungen, S-Bahnen und Landratsämtern. Solche Angriffe verfolgen das…

KI ohne wirksames Risikomanagement ist verantwortungslos

Globale Technologien und lokale Gesetze erfordern verantwortungsvollen Umgang mit KI.   Die Entwicklung von künstlicher Intelligenz schreitet weiter voran, doch weltweit fehlt es an einheitlichen Vorgaben. Während die EU mit dem AI Act und der Datenschutzgrundverordnung (DSGVO) zwei rechtlich verbindliche Regelwerke geschaffen hat, gibt es international viele Lücken. Für global tätige Unternehmen bedeutet das vor…

KI zwingt Unternehmen, Abstriche in Sachen Hybrid-Cloud-Sicherheit zu machen – Public Cloud als größtes Risiko

KI verursacht größeres Netzwerkdatenvolumen und -komplexität und folglich auch das Risiko. Zudem gefährden Kompromisse die Sicherheit der hybriden Cloud-Infrastruktur, weshalb deutsche Sicherheits- und IT-Entscheider ihre Strategie überdenken und sich zunehmend von der Public Cloud entfernen. Gleichzeitig gewinnt die Netzwerksichtbarkeit weiter an Bedeutung.

it-sa 2024: Zwischen KI-gestützter Bedrohungsabwehr und digitaler Identität – Von reaktiver Gefahrenabwehr zu proaktivem Risikomanagement

Die Messehallen in Nürnberg verwandelten sich auch 2024 wieder zum Epizentrum der IT-Sicherheits­branche. Die it-sa bestätigte einmal mehr ihre Position als Europas führende Fachmesse für Cybersecurity. Die Rekordbeteiligung internationaler Aussteller unterstrich dabei den Stellenwert der Veranstaltung weit über den deutschsprachigen Raum hinaus. Während die Gänge von geschäftigem Treiben erfüllt waren, kristallisierten sich rasch die dominierenden Themen heraus: Der Umgang mit künstlicher Intelligenz, die Bedeutung digitaler Identitäten und die wachsende Verschmelzung von IT- und OT-Security.

71 Prozent der Verbraucher sieht KI als Risiko für Datensicherheit

Große Mehrheit der Endkunden prüft Wechsel zur Konkurrenz, wenn Anbieter ihre Daten nicht wirksam schützen.   Weltweit sind Verbraucher sehr besorgt über die Menge an Daten, die Unternehmen über sie sammeln, den Umgang damit und sehen auch deren Sicherheit gefährdet – insbesondere durch die den zunehmenden Einsatz von künstlicher Intelligenz. Das belegt eine Umfrage von…

Risikomanagement: KI-gestützte Risikoanalyse

Mit KI-gestützten Projektmanagement-Anwendungen schneller, flexibler und sicher zum Erfolg.   Mit auf KI- und maschinellem Lernen (ML)-gestützten Datenanalysetools können Unternehmen ihr gesamtes Projektportfolio scannen und die risikoreichsten Projekte und Arbeitspakete identifizieren. Außerdem lassen sich auf Projektbasis Simulationen durchführen und wahrscheinliche Risiken aufzeigen, die bei einer manuellen Analyse möglicherweise nicht erkennbar sind.   Monte-Carlo-Analyse (Szenarioanalyse) Die…

Deutschland zu risikoscheu bei Nutzung und Einsatz von KI

Verbraucher erkennen die Vorteile von KI für Wirtschaft und Gesellschaft. Bedenken vor allem in Bezug auf Cybersicherheit.   Nach dem »Jahr der künstlichen Intelligenz (KI)« hat eine aktuelle, repräsentative Umfrage von Splunk, Anbieter in den Bereichen Cybersicherheit und Observability, ein gemischtes, aber weitgehend positives Bild der öffentlichen Einstellung zur KI aufgezeigt. Die Mehrheit der Befragten…

Mobile Sicherheit und Risikomanagement: Wettbewerbsanalyse und Ranking der führenden Anbieter für In-App-Schutzlösungen

In einer neuen Marktstudie hat das Analystenhaus Quadrant Knowledge Solutions die Stärken und Schwächen von In-App-Schutzlösungen untersucht. Neben einer Wettbewerbsanalyse umfasst die Untersuchung ein Ranking der führenden Technologieanbieter. Die »Quadrant Knowledge Solutions SPARK Matrix« beinhaltet eine detaillierte Analyse der globalen Marktdynamik, der wichtigsten Trends, der Anbieterlandschaft und Wettbewerbsposition. Darüber hinaus bietet die Studie strategische Informationen,…

Künstliche Intelligenz: Bürger sehen mehr Risiko als Nutzen in KI

Künstliche Intelligenz wird unsere Gesellschaft grundlegend verändern, das steht fest. Ob diese Veränderungen positiv oder negativ sein werden, darüber sind sich die Deutschen nicht einig, wie eine Umfrage von YouGov zeigt. Während 15 Prozent aller Befragten glauben, der Nutzen von KI sei größer als das Risiko, denken immerhin 26 Prozent das Gegenteil. Beinahe die Hälfte…

KI beginnt mit Vertrauen: Daten-Governance als Schlüssel zwischen Strategie und messbaren Resultaten

Der Erfolg von KI hängt weniger von Modellen als von vertrauenswürdigen, geschäftlich nutzbaren Daten ab, weshalb viele Initiativen an fehlender Daten‑Governance scheitern. Moderne Daten‑Governance wird dabei als Enabler verstanden, der Klarheit, Verantwortlichkeiten und Datenqualität schafft und KI so skalierbar und wirksam macht. Entscheidend ist ein dynamischer Data‑First‑Ansatz, der Governance als kontinuierliches Change Management etabliert und…

70 Prozent der Unternehmen genehmigen KI-Projekte trotz Sicherheitsbedenken

Jeder sechste Entscheider in Deutschland stuft Besorgnis als »extrem« ein – und wurde dennoch zugunsten von Wettbewerbsdruck und internen Forderungen übergangen.   TrendAI, ein Geschäftsbereich von Trend Micro und Anbieter von KI-Sicherheit, veröffentlicht neue Forschungsergebnisse, die zeigen, dass Unternehmen weltweit den Einsatz von künstlicher Intelligenz vorantreiben, obwohl bekannte Sicherheits- und Compliance-Risiken bestehen [1]. Eine neue…

Business-KI: Amazon Quick bringt agentische KI in den DACH-Raum

Amazon Quick jetzt in der AWS Region Europa (Frankfurt) verfügbar.   KI hat sich im Alltag längst als selbstverständlicher Helfer etabliert. In Unternehmen sieht die Realität allerdings oft anders aus. Genau hier unterstützt die agentische KI-Anwendung Amazon Quick von AWS. Sie hilft bei Recherchen, Business-Intelligence-Analysen und der Automatisierung von Workflows. Ab sofort können Unternehmen in…

Island ermöglicht sicheren und vertraulichen Einsatz von KI in Unternehmen

Neuer KI-Browser, Sicherheitsfunktionen, Agentensteuerung und Publishing ermöglichen den Einsatz von KI im großen Maßstab.   Island, das Unternehmen für Enterprise-Workspace, stellt neue KI-Lösungen für den sicheren Einsatz in Unternehmensumgebungen vor. Sie helfen Organisationen, künstliche Intelligenz sicher einzuführen und zu skalieren. Während generative KI, KI-Browser und autonome Agenten zunehmend den Arbeitsalltag prägen, liefert Island das, was…

Massive Dynamik hin zum KI‑gestützten Prozessmanagement

Künstliche Intelligenz entwickelt sich im Prozessmanagement vom Analyse‑Werkzeug zum aktiven Gestalter und läutet das Zeitalter des »Agentic BPM« ein. Immer mehr Unternehmen setzen bereits auf generative KI und KI‑Agenten, doch strategische Nutzung, Governance und Datenqualität bremsen oft die Skalierung. Wer jetzt gezielt in Entscheidungsintelligenz, Kompetenzen und saubere Prozessarchitekturen investiert, verschafft sich nachhaltige Effizienz‑ und Innovationsvorteile.…

Smarte Industrie durch KI, IoT und Automatisierung

Mit dem zunehmenden Digitalisierungsgrad und dem Einsatz künstlicher Intelligenz können viele Aufgaben im Industriebereich effizienter, präziser und zuverlässiger ausgeführt werden. Damit entwickelt sich KI auch in der Produktion zu einem Eckpfeiler für mehr Wettbewerbsfähigkeit, Innovation und bessere Entscheidungsfindung durch schnellere, tiefgreifende Datenanalysen.   Im deutschen verarbeitenden Gewerbe sind KI-Lösungen bereits angekommen, aktuell jedoch noch in…