Wie sich fehlerhafte Vorhersagestrategien durch gängige maschinelle Lernmodelle verbreiten

foto freepik ki

KI-Modelle wie GPT, Llama, CLIP und andere generative Modelle dienen aktuell bereits häufig als Ausgangsbasis für spezialisierte KI-Modelle, die in der Wissenschaft, Industrie und nicht zuletzt in der medizinischen Diagnostik eingesetzt werden. Das wirft die berechtigte Frage nach der Erklärbarkeit dieser Modelle auf: Wie korrekt und transparent treffen die Ursprungsmodelle ihre Entscheidungen? Bei GPT und Co handelt es sich um sogenannte Foundation-Modelle, sie werden mithilfe von sogenannten unüberwachten Lernmethoden (unsupervised Learning), beispielsweise durch Selbstüberwachung, trainiert. Das Problem: Stützt sich ein Foundation-Modell bei seinen korrekten Entscheidungen – beispielsweise – auf Artefakte in den Daten, dann kann dieser sogenannte Clever-Hans-Effekt das Modell erheblich beeinträchtigen. Noch schwerwiegender: Dieser Effekt überträgt sich dann auch auf alle Modelle, die auf dem kompromittierten Foundation-Modell aufbauen.

Ein Team von Wissenschaftlern des Berlin Institute for the Foundations of Learning and Data (BIFOLD) an der TU Berlin hat mehrere gängige Foundation-Modelle im Bereich der Bilderkennung analysiert und nachgewiesen, dass diese tatsächlich von Clever-Hans-Effekten betroffen sind. Diese fehlerhafte Vorhersagestrategie blieb bei gängigen Evaluationsbenchmarks unentdeckt und wurde jetzt erstmals nachgewiesen. Die Forschungsarbeit wurde in der renommierten Fachzeitschrift Nature Machine Intelligence veröffentlicht.

 

Der Clever-Hans-Effekt im maschinellen Lernen beschreibt, wenn ein KI-Modell richtige Vorhersagen trifft, aber für diese Entscheidung irrelevante oder unerwartete Muster nutzt – ähnlich wie das berühmte Pferd Clever Hans, das nicht rechnen konnte, aber erfolgreiche entsprechende Signale seines Besitzers las. Ein Beispiel für den Clever-Hans Effekt wäre ein Bildklassifikationsmodell, das zum Beispiel Pferde erkennen soll, seine Entscheidung aber schwerpunktmäßig auf der Existenz eines unbemerkten Schriftzuges (Pferdebilder) am Rand der Bilder trifft.

Für die neue Publikation demonstrierten die Forscher die Existenz der Clever-Hans-Effekte beispielsweise im Kontext medizinischer Daten: Das Foundation-Modell PubMedCLIP, das für medizinische Bildanalyse entwickelt wurde, erkennt zwar erfolgreich zwei ähnliche Lungenröntgenbilder als ähnlich, trifft seine Entscheidung jedoch hauptsächlich aufgrund irreführender Text-Anmerkungen auf beiden Röntgenbildern und nicht aufgrund von ähnlichen Pixelverteilungen in den Lungenregionen. Dies kann zu erheblichen Problemen bei realen diagnostischen Aufgaben führen. Die fehlerhafte Strategie des Modells, sich auf Text-Anmerkungen statt auf Bildinformationen zu stützen, ist jedoch ein direktes »Erbe« des Ausgangs-Modell CLIP. CLIP ist ein weitverbreitetes Foundation-Modell für Bilddatenanalyse, das auf unüberwachtem Lernen beruht. Da CLIP, genau wie viele weitere bekannte Foundation-Modelle, die auf unüberwachtem Lernen beruhen, als Basis für diverse neue Anwendungen dient, werden diese Modelle zu einer zentralen potenziellen Fehlerquelle. »Wir halten es für essenziell, das unüberwachte Lernparadigma, auf dem diese Modelle basieren, zu überdenken. Nur so können wir sicherstellen, dass die darauf aufbauenden spezialisierten Modelle zuverlässig sind und nicht mit Clever-Hans-Effekten kontaminiert werden«, betont BIFOLD-Wissenschaftler Prof. Dr. Grégoire Montavon.

Erklärbare KI deckt Clever-Hans-Effekte auf

Entdeckt haben die Wissenschaftler diesen »Domino-Effekt« mithilfe von modernen Methoden der Erklärbaren KI auf der Basis von LRP (Layer-wise Relevance Propagation). »Besonders nützlich ist hierbei die Erklärbare-KI-Methode BiLRP, die nicht nur aufzeigt, welche Pixel das Modell betrachtet, sondern auch, wie diese Pixel miteinander interagieren, um zwei Bilder als ähnlich oder unähnlich erscheinen zu lassen«, erklärt Gregoire Montavon. So fanden sie beispielsweise heraus, dass das CLIP-Modell bestimmte Merkmale wie Text oder Gesichter übermäßig stark berücksichtigt. Zudem konnten sie in einigen Fällen ebenfalls zeigen, dass die Erklärbare KI auch genutzt werden kann, um diese Fehler aus dem Basis-Foundation-Modell zu entfernen.

Unüberwachtes Lernen existierte bereits bevor Foundation-Modelle aufkamen und wurde auf nahezu jede Art von Datensatz angewendet, für den keine Labels verfügbar sind. Klassische Probleme, bei denen unüberwachtes Lernen zum Einsatz kam waren zum Beispiel das Clustern von Daten oder das Erkennen von Anomalien in einem Datensatz – ein häufig genutztes Verfahren der Qualitätssicherung in der industriellen Fertigung. Dabei entscheidet eine KI anhand von Bildern eines industriell gefertigten Produkts, ob ein Herstellungsfehler aufgetreten ist oder nicht. In der Publikation zeigen die BIFOLD-Forscher, dass auch diese Modelle mit Clever-Hans-Strategien arbeiten.

»Das unüberwachte Lernen ist ein zentrales Merkmal der großen Foundation-Modelle. Das wir in diesen Modellen verbreitet Clever-Hans-Effekte nachweisen konnten, ist ein Grund zur Besorgnis. Vor allem weil diese Foundation-Modelle die Basis vieler nachgelagerter spezialisierter KI-Modelle sind und die Clever-Hans-Effekte sich so immer weiterverbreiten. Unsere jüngsten Entwicklungen der Erklärbaren KI zeigen erstmals einen effektiven Weg, um diesen Domino-Effekt in Foundation-Modellen zu erkennen und zu beheben«, erläutert BIFOLD Co-Direktor Klaus-Robert Müller.

 

Zur Publikation: https://www.nature.com/articles/s42256-025-01000-2

 

5036 Artikel zu „KI Problem“

Probleme mit dem Datenvertrauen führen zu negativen Auswirkungen auf Daten- und KI-Initiativen

Precisely, Anbieter von Datenintegrität, veröffentlichte eine neue Studie, die in Zusammenarbeit mit dem Center for Applied AI and Business Analytics am LeBow College of Business der Drexel University (Drexel LeBow) durchgeführt wurde [1]. Die wichtigsten Erkenntnisse aus dem diesjährigen »2025 Outlook: Data Integrity Trends and Insights« beleuchten die drängendsten Herausforderungen, denen sich Unternehmen bei der…

Generative KI: Mehrheit fürchtet Bias, Datenschutzverletzungen und Urheberrechtsprobleme

Applause befragt über 3.000 Fachleute weltweit zu ihrer Nutzung und ihren Bedenken von Nutzung generativer KI am Arbeitsplatz. 90 Prozent der Teilnehmer weltweit befürchten, dass KI-Voreingenommenheit die Genauigkeit der Antworten beeinträchtigen könnte. 67 Prozent glauben, dass generative KI-Dienste den Datenschutz verletzen.   Applause, ein Anbieter für Software-Testing und digitale Qualitätssicherung, hat die Ergebnisse seiner ersten…

Probleme der IT-Infrastruktur: »Das Dreckige Dutzend«

»Das Dreckige Dutzend« ist weit mehr als ein US-Kriegsfilm. Der Begriff ist sehr oft auf verschiedene Weise in verschiedenen Branchen genutzt worden, vom Einzelhandel bis zur Luftfahrtindustrie. Für die IT-Branche hat Eric Herzog, CMO bei Infinidat, eine Liste der »Dreckigen Dutzend« erstellt. Es handelt sich um eine Liste von Problemen der IT-Infrastruktur, die aktuelle Unternehmensimplementierungen…

KI: Die Diskrepanz zwischen ethischem Handeln und Problembewusstsein

  Das Bewusstsein für ethische Fragestellungen beim Einsatz von Künstlicher Intelligenz (KI) ist in Unternehmen und Verwaltungen gestiegen. Dennoch fällt die diesjährige Erfolgsbilanz gemischt aus, da nur in Teilbereichen Verbesserungen erzielt wurden. Ein Grund: Nur 53 Prozent der Organisationen verfügen über eine Führungskraft, die für ethische und vertrauenswürdige KI-Systeme verantwortlich ist. Zugleich sind im Vergleich…

Das neue SEO: Webseiten für die Kommunikation mit KI-Agenten vorbereiten

Unternehmen müssen das Thema KI-Agenten aus zwei unterschiedlichen Perspektiven betrachten. Einerseits geht es darum, welche Aufgaben Mitarbeitende bereits heute mit KI-Agenten wie ChatGPT Tasks oder Operator automatisieren können. Andererseits stellt sich die Frage, welche Anpassungen auf der Unternehmenswebsite notwendig sind, um die Interaktion mit KI-Agenten entweder zu optimieren oder gezielt zu unterbinden.   Was sind…

Erste Schritte für ein Daten- und KI-Governance-Programm

Vertrauenswürdige KI-Ergebnisse benötigen eine Grundlage aus präzisen, transparenten und regelkonformen Daten, die im gesamten Unternehmen zuverlässig und sicher zur Verfügung stehen. Dies kann nur mit ganzheitlichen, skalierbaren und KI-gestützten Data-Governance-Lösungen erreicht werden, die es Unternehmen ermöglichen, Rollen, Verantwortlichkeiten und Prozesse für ein transparentes und sicheres Daten-Monitoring im gesamten Betrieb zu definieren. In einem Data-Governance-Framework können…

Speichertechnologie als heimlicher Held der KI-Revolution

Von autonomen Fahrzeugen bis hin zur Genomforschung verschiebt KI die Grenzen des Möglichen – die geeignete Speicherinfrastruktur trägt dazu bei, diese Entdeckungen zu beschleunigen.   Im Wettlauf um die künstliche Intelligenz gibt die Speichertechnologie den Takt vor. Während Algorithmen und Rechenleistung im Rampenlicht stehen, sind es die Speicherinfrastrukturen, die KI-Durchbrüche ermöglichen. Die ersten KI-Bemühungen wurden…

2025: Wie KI die Regeln der Arbeitswelt neu definiert

Im Jahr 2025 ist künstliche Intelligenz (KI) längst keine Zukunftsvision mehr, sondern ein fester Bestandteil der Wirtschaft. Sie verändert Branchen, prägt die Arbeitswelt neu und beeinflusst die Art, wie Unternehmen mit ihren Kunden interagieren. KI wird zunehmend alltagstauglich und hilft Unternehmen, innovativer zu arbeiten, Abläufe effizienter zu gestalten und wirtschaftlichen Mehrwert zu schaffen. Laut McKinsey…

Fakten statt Fiktion: Was tun gegen KI-Halluzinationen und KI-Bias?

Generative KI ist unglaublich gut darin, Informationen zu recherchieren und aufzubereiten. Unfehlbar ist sie allerdings nicht – sie kann durchaus falsch liegen oder vorurteilsbehaftete Ergebnisse liefern. Doch es gibt Maßnahmen, mit denen Unternehmen das Risiko von Halluzinationen und Bias minimieren können.  Immer mehr Unternehmen setzen generative KI (GenAI) ein, um beispielsweise Mitarbeitern den Zugang zu…

KI-Agenten sollen durchschnittlich 18 Arbeitsstunden pro Woche einsparen

IT-Verantwortliche in Deutschland vertrauen auf KI-Agenten und investieren mit 2,6 Millionen Euro mehr als britische und US-amerikanische Unternehmen.   Nach einer Umfrage der generativen Integrationsplattform SnapLogic gehen deutsche Führungskräfte im IT-Bereich davon aus, dass KI-Agenten im Durchschnitt 18 Arbeitsstunden pro Woche einsparen könnten [1]. Fast die Hälfte (47 %) vertraut ihnen dabei, so effizient wie…

Deutschland und KI – ein schwieriges Verhältnis

Die Entwicklung und Adaption von künstlicher Intelligenz in Deutschland geht einigen viel zu langsam. Ist das wirklich so? Tatsächlich haben wir die KI weder verschlafen noch mutwillig ein- und ausgebremst. Aber es gibt eine Reihe von Besonderheiten, die der Nutzung von KI als Wirtschaftsfaktor nicht förderlich sind.   Länder wie die USA und China gelten…

Europa ist endlich aus dem KI-Schlaf aufgewacht

KI-Experte Eckhart Hilgenstock rät Unternehmen zu einem »Chief Artificial Intelligence Officer«. Mit der Ankündigung einer »Europa-KI« ist der alte Kontinent »endlich aus dem KI-Schlaf aufgewacht«, sagt der auf die KI-Einführung in Unternehmen spezialisierte Interim Manager Eckhart Hilgenstock. Die Bekanntgabe der EU-Kommission, bis zu 54 Millionen Euro in neue Sprachmodelle (OpenEuroLLM) zu investieren wertet er als…

Deutsche Industrie setzt auf KI und Nachhaltigkeit – aber wirtschaftliche Hürden bremsen den Fortschritt

Die Studie »2025 Industrial Technology Index« von TE Connectivity zeigt, dass ein Mangel an Schulungsprogrammen die Integration von künstlicher Intelligenz in Unternehmen weltweit verzögert, obwohl die Technologie auf große Zustimmung stößt [1]. Das belegen auch die deutschen Ergebnisse: Ingenieure und Manager setzen auf Nachhaltigkeit und sind offen für KI. Jedoch behindern wirtschaftliche Zwänge und strukturelle…

So wird KI den Umgang mit Software im Alltag und der Wirtschaft verändern

Künstliche Intelligenz (KI) wird unser Leben und Wirtschaften ähnlich revolutionieren wie das Internet. Sowohl für Unternehmen als auch für Privatpersonen wird KI-basierte Software zunehmend an Bedeutung gewinnen. Alltag und Berufsleben werden sich verändern und mit ihnen der Umgang mit Software. Optimierungsspezialisten identifizieren fünf Schlüsselmerkmale dieser Transformation.   »KI wird die Art und Weise, wie wir…

Unternehmen setzen verstärkt auf KI, um Personalmangel und steigende Kosten zu kompensieren

62 % der deutschen Unternehmen blicken optimistisch auf das Jahr 2025 – dennoch bleiben Inflation, hohe Energiekosten und der Fachkräftemangel große Herausforderungen, insbesondere aufgrund der damit verbundenen finanziellen Belastungen. Über die Hälfte (55 %) der deutschen Unternehmen gibt an, dass steigende Lohn- und Sozialabgaben sowie andere Faktoren sie eher dazu veranlassen, auf künstliche Intelligenz (KI)…

Manager fühlen sich ohnmächtig: Gravierende Defizite im Bereich Digitalisierung und KI

In einer Blitzumfrage von Heinermann Consulting zu den Leadership Trends 2025 wurden Führungskräfte aus der ersten bis dritten Ebene namhafter deutscher Unternehmen zu ihren größten Herausforderungen befragt. Ein zentrales Ergebnis der Umfrage ist, dass viele Führungskräfte sich derzeit als Opfer der herrschenden Umstände fühlen. Besonders in Krisenzeiten fehlt es oft an den notwendigen Konzepten und…

KI-Verantwortungskrise: Führungskräfte fordern eindeutige KI-Governance

Das rasante Wachstum von KI überfordert die Governance. Führungskräfte ringen um eine Balance zwischen Innovation, Verantwortung und Ethik. Das schafft rote Linien für die zukünftige Nutzung von KI.   Laut einer aktuellen Studie von NTT DATA, einem Anbieter von digitalen Business- und Technologie-Services, droht eine Verantwortungslücke die durch KI möglich gewordenen Fortschritte zu untergraben. Mehr…

Climb Channel Solutions punktet mit neuartigem Value-Add-Konzept – Umfassende praktische KI-Unterstützung

Der internationale Technologie-Distributor Climb Channel Solutions ist als neuer Herausforderer auf dem anspruchsvollen DACH-Markt angetreten. Mehrwert verspricht er vor allem mit seiner »Climb AI Academy«. Hier bekommen Partner ihr Rüstzeug, um sich als Trusted Advisor ihrer Kunden erfolgreich im KI-Umfeld zu positionieren.

Cloud und KI – Untrennbar gut oder gut trennbar?

Wer künstliche Intelligenz im Unternehmen einsetzen will, kommt über kurz oder lang nicht an der Cloud vorbei. Für die effiziente KI-Nutzung müssen dabei zwei Bedingungen erfüllt sein: Zum einen ist ein gutes Gesamtkonzept zwingend erforderlich und zum anderen muss ein professioneller Cloud-Betrieb sichergestellt sein.