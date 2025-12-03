Sprachmodelle, die auf künstlicher Intelligenz (KI) basieren, antworten auf jede Frage – aber nicht immer mit der richtigen Antwort. Hilfreich wäre es daher für Nutzerinnen und Nutzer zu wissen, wie vertrauenswürdig ein KI-System ist. Ein Team der Ruhr-Universität Bochum und der TU Dortmund schlägt sechs Dimensionen vor, mit denen sich die Vertrauenswürdigkeit eines Systems beschreiben lässt – egal, ob es sich dabei um Personen, Institutionen, klassische Maschinen oder KI-Systeme handelt.

Das Konzept beschreiben Dr. Carina Newen und Prof. Dr. Emmanuel Müller von der TU Dortmund zusammen mit dem Philosophen Prof. Dr. Albert Newen von der Ruhr-Universität Bochum im internationalen philosophischen Fachjournal »Topoi«, online veröffentlicht am 14. November 2025 [1].

Ob ein bestimmtes KI-System vertrauenswürdig ist, kann nicht mit »Ja« oder »Nein« beantwortet werden. Die Autoren und Autorin schlagen vor, für jedes System zu beurteilen, wie ausgeprägt sechs verschiedene Dimensionen sind, und so ein Profil der Vertrauenswürdigkeit zu erstellen.

Bei den Dimensionen handelt es sich um:

Objektive Funktionalität:

Wie gut erledigt das System seine Kernaufgabe und wird die Qualität überprüft und garantiert? Transparenz:

Wie transparent sind die Prozesse des Systems? Unsicherheit von zugrunde liegenden Daten und Modellen:

Wie verlässlich und gesichert gegen Missbrauch sind Daten und Modelle? Verkörperung:

In welchem Maße handelt es sich um ein verkörpertes oder ein virtuelles System? Unmittelbarkeit:

In welchem Maße findet Austausch mit dem System statt? Verpflichtung:

In welchem Maße kann das System eine Verpflichtung gegenüber dem Vertrauenden haben?

»Anhand dieser Kriterien kann man sichtbar machen, dass die Vertrauenswürdigkeit gegenwärtiger KI-Systeme – wie ChatGPT oder autonome Fahrzeuge – in den meisten Dimensionen noch starke Defizite aufweist«, so das Bochumer-Dortmunder Team. »Es wird zugleich deutlich, wo der Nachholbedarf besteht, wenn KI-Systeme eine hinreichende Vertrauenswürdigkeit erreichen sollen.«

Zentrale Dimensionen aus technischer Sicht

Aus technischer Sicht sind die Dimensionen Transparenz und Unsicherheit von zugrunde liegenden Daten und Modellen entscheidend. Sie betreffen prinzipielle Defizite von KI-Systemen. »Das sogenannte deep learning produziert bei großen Datenmengen bemerkenswerte Leistungen. KI-Systeme sind zum Beispiel im Schach jedem Menschen überlegen«, erläutert Emmanuel Müller. »Aber die zugrunde liegenden Prozesse sind für uns intransparent, wodurch bislang ein zentrales Defizit der Vertrauenswürdigkeit entsteht.«

Ähnlich verhält es sich mit der Unsicherheit von Daten und Modellen. »KI-Systeme werden schon von Firmen eingesetzt, um Bewerbungen vorzusortieren«, gibt Carina Newen ein Beispiel. »Dabei stecken in den Daten, mit denen die KI trainiert wird, Vorurteile, die das KI-System dann fortschreibt.«

Zentrale Dimensionen aus philosophischer Sicht

Aus philosophischer Sicht führt das Team das Beispiel ChatGPT an, das zwar bei jeder Frage und Aufgabe eine klug klingende Antwort produziert, dabei aber halluzinieren kann: »Das KI-System erfindet Informationen, ohne dies sichtbar zu machen«, betont Albert Newen: »KI-Systeme können und werden als Informationssysteme hilfreich sein, aber wir müssen lernen, sie stets mit kritischem Verstand zu betrachten und nicht blind zu vertrauen.«

Als fragwürdig stuft Newen hingegen die Entwicklung von Chat-Bots als Ersatz für menschliche Kommunikation ein. »Zwischenmenschliches Vertrauen zu einem Chat-Bot aufzubauen, ist gefährlich, weil ein solcher keinerlei Verpflichtung gegenüber dem vertrauenden Menschen hat«, so Newen. »Es ergibt keinen Sinn zu erwarten, dass der Chat-Bot Versprechen einhalten kann.«

Die Profilbetrachtung von Vertrauenswürdigkeit in den verschiedenen Dimensionen kann laut der Autorin und den Autoren helfen zu verstehen, in welchem Maße Menschen KI-Systemen als Informationsexperten vertrauen können. Zugleich helfe es zu sehen, warum kritischer Alltagsverstand mehr denn je gefragt sein wird.

Kooperation im Ruhr Innovation Lab

Die Ruhr-Universität Bochum und die TU Dortmund, die derzeit in der Exzellenzstrategie gemeinsam als Ruhr Innovation Lab antreten, kooperieren eng zu Themen, die dazu beitragen, im digitalen Zeitalter eine zukunftsfähige und resiliente Gesellschaft zu entwickeln. Die aktuelle Veröffentlichung entstammt einer Zusammenarbeit des Instituts für Philosophie II in Bochum mit dem Research Center Trustworthy Data Science and Security, das die beiden Partneruniversitäten gemeinsam mit der Universität Duisburg-Essen in der Universitätsallianz Ruhr gegründet haben. Die Autorin Carina Newen hat als erste Doktorandin des Centers promoviert.

Handlungsempfehlungen für den Umgang mit KI

Der Artikel schlägt ein sechs‑dimensionales Rahmenmodell vor, mit dem sich die Vertrauenswürdigkeit von KI‑Systemen systematisch bewerten lässt: Objective Functionality, Transparency, Uncertainty Quantification, Embodiment, Immediacy Behaviors, Commitment. Diese Dimensionen helfen, konkrete Maßnahmen zu priorisieren und Risiken sichtbar zu machen.

Objective Functionality — Sicherstellen, dass KI tut, was sie soll

Definieren Sie klare Erfolgskriterien für jede KI‑Anwendung (Messgrößen, Akzeptanzkriterien, Fehlertoleranz).

Führen Sie standardisierte Tests vor Produktivsetzung durch (Unit, Integration, Real‑World‑Simulations).

Etablieren Sie Langzeit‑Kontrollen (Monitoring, regelmäßige Reviews, Versionierung) und dokumentieren Sie Änderungen systematisch.

Transparency — Nachvollziehbarkeit erhöhen

Dokumentationspflicht: Modellarchitektur, Trainingsdatenquellen, Updates und bekannte Limitationen müssen dokumentiert und zugänglich sein.

Reputation und unabhängige Prüfungen: Beauftragen Sie externe Audits und veröffentlichen Sie zusammenfassende Prüfberichte.

Erklärbarkeit: Setzen Sie erklärbare Modelle oder Erklärungs‑Layer (XAI) dort ein, wo Entscheidungen Menschen stark betreffen.

Uncertainty Quantification — Unsicherheiten messen und kommunizieren

Implementieren Sie Unsicherheitsmetriken (epistemic/aleatoric) und zeigen Sie diese in Nutzerinterfaces, zum Beispiel Konfidenzintervalle oder Warnstufen.

Bias‑Checks und Daten‑Profiling: Regelmäßige Analysen auf Verzerrungen in Trainingsdaten; dokumentierte Maßnahmen zur Bias‑

Robustheitstests: Adversarial‑Tests, Stresstests und Szenarien‑Analysen, um externe Einflüsse und Angriffsvektoren zu identifizieren.

Embodiment und Immediacy Behaviors — Nutzerinteraktion gestalten

Passende Form der Interaktion wählen: Entscheiden Sie bewusst, ob ein System embodied (z. B. Roboter) oder disembodied (z. B. Chatbot) sein soll — je nach Vertrauenserfordernis.

Soziale Responsivität kontrollieren: Bei dialogischen Systemen Grenzen setzen (z. B. Transparenz über KI‑Status, Fallback‑Strategien bei Fehlern).

Illusion von Kontrolle vermeiden: Nutzer klar informieren, welche Entscheidungen automatisiert sind und welche menschliche Kontrolle erfordern.

Commitment — Verantwortung und rechtliche Absicherung

Verantwortlichkeiten festlegen: Klare Zuordnung von rechtlicher und operativer Verantwortung (wer haftet, wer überwacht).

Vertragliche und organisatorische Verpflichtungen: SLAs, Audit‑Rechte, Meldepflichten bei Vorfällen; rechtliche Absicherung durch Compliance‑

Meta‑Commitment implementieren: Systeme so gestalten, dass sie Mechanismen zur Selbstüberwachung und Fehlerberichterstattung besitzen.

Operative Umsetzung und Governance

Governance‑Board einrichten: Interdisziplinäres Team (Technik, Recht, Ethik, Fachbereich) für Freigaben und Reviews.

Rollout‑Strategie: Stufenweise Einführung (Pilot → begrenzter Einsatz → Skalierung) mit klaren Abbruchkriterien.

Schulungen und Awareness: Mitarbeitende in Umgang, Grenzen und Risiken von KI schulen; Nutzer‑Guidelines bereitstellen.

Priorisierungsempfehlung für die Praxis

Sofort: Erfolgskriterien definieren, Verantwortlichkeiten klären, Pilot‑Governance einrichten.

Kurzfristig (1–3 Monate): Transparenz‑Dokumentation, Basis‑Unsicherheitsmetriken, externe Auditplanung.

Mittelfristig (3–12 Monate): Robuste Monitoring‑Pipelines, regelmäßige Bias‑Analysen, rechtliche Absicherung.

Langfristig: Zertifizierungen, kontinuierliche Verbesserung, gesellschaftliche Folgen evaluieren.

Albert Absmeier & KI

