Wer kontrolliert wen —
und wie lange noch?

Über kognitive Erosion, Vollmacht-Schwellen und das, was wir abgeben, ohne es zu entscheiden

Christian Franz Fischer · Vertiefung · charta-ki.org

März 2026
📋 Diskussionsentwurf — Quellenangaben im Text

KI verändert nicht nur, was wir tun. Sie verändert, wie wir denken — und ob wir es noch tun.

Das ist keine Warnung vor bösen Maschinen. Es ist eine nüchterne Beobachtung: Wer regelmäßig delegiert, verliert die Fähigkeit, die er delegiert. Wer aufhört zu navigieren, verliert das räumliche Denken. Wer aufhört zu formulieren, verliert die Fähigkeit, Gedanken überhaupt erst zu formen. KI beschleunigt diesen Prozess — nicht durch Zwang, sondern durch Bequemlichkeit.

Die wichtigste Frage ist nicht: Was darf KI tun? Die wichtigste Frage ist: Was geben wir gerade ab — ohne es zu entscheiden?

Drei Zugänge zum Thema

📖

Die Geschichte

Eine zugängliche Erzählung über den Morgen, an dem jemand bemerkt, was er in den letzten Stunden nicht mehr selbst gedacht hatte.

↓ Download (PDF)
📄

Kurzfassung

Die wichtigsten Argumente kompakt: Vollmacht-Schwellen, kognitive Erosion, Metakognition, globale Szenarien. Für den schnellen Überblick.

↓ Download (PDF)
📚

Langfassung

Vollständiges Diskussionspapier mit Primärquellen: Schwellen-Analyse, Forschungsbefunde, ethische KI, globale Szenarien, offene Fragen.

↓ Download (PDF)

Die zwei Schwellen — nicht eine

Die meisten Debatten über KI-Kontrolle konzentrieren sich auf die falsche Schwelle. Es gibt zwei — und die wichtigere ist die unsichtbare.

Schwelle 1 — die unsichtbare
Die Vollmacht-Schwelle

Der Moment der Delegation an ein System. Sie findet einmal statt, oft unbemerkt. Wer hier nicht prüft, hat die Verantwortung bereits abgegeben — bevor die erste Handlung stattgefunden hat. Das ist kein blinder Fleck. Das ist ein irreversibler Akt.

Schwelle 2 — die sichtbare
Die Handlungs-Schwelle

Der Moment, in dem eine Auswertung zur Konsequenz wird. Ohne Agenten: theoretisch noch Eingriffspunkt, wenn die Architektur es erlaubt. Mit Agenten: Der Point of No Return ist bereits mit Schwelle 1 eingetreten. Beide Schwellen verschmelzen faktisch in einem einzigen Moment.

⚠️ Was die Forschung zeigt: Von 30 untersuchten KI-Agenten haben 4 überhaupt keine dokumentierten Stopp-Mechanismen. 25 von 30 legen keine internen Sicherheitsergebnisse offen. Wenn Agenten über Netzwerke und Organisationen hinweg interagieren, ist kein einzelner Akteur mehr in der Lage, vollständige Kontrolle zu behalten.¹

„Wer einem Agenten Vollmacht gibt, hat die Verantwortung bereits übertragen — bevor die erste Handlung stattgefunden hat. Bevor er es bemerkt.“

— Aus dem Diskussionspapier, März 2026

Was mit unserem Denken passiert

Zwei große Studien mit zusammen fast 700 Teilnehmern zeigen: KI-Unterstützung verbessert die Leistung kurzfristig — aber die Teilnehmer überschätzten ihre eigene Kompetenz dabei um durchschnittlich vier Punkte. Besonders auffällig: Je mehr technisches Wissen jemand über KI hatte, desto ungenauer war seine Selbsteinschätzung. Mehr Wissen schützt nicht vor dem Verlust moralischer Urteilskraft. Es kann sie sogar verschleiern.²

Die mögliche Spirale: Delegation → Atrophie → weniger Fähigkeit zur Prüfung → mehr Delegation → tiefere Atrophie.

Das ist keine Zwangsläufigkeit. Schrift atrophierte das Gedächtnis — und schuf die Voraussetzung für Wissenschaft. Aber das Ob hängt von aktiver Gestaltung ab, nicht von gutem Willen allein.

Was entsteht — wenn wir es gestalten

Wenn Routinedenken delegiert ist, könnte Kapazität für etwas anderes entstehen: Urteilsvermögen als neue Kernkompetenz. Sinngebung als nicht-delegierbare Aufgabe — insbesondere die Frage, welche Rahmenbedingungen geschaffen werden müssen, damit jeder Mensch ein Leben in Würde führen kann. Relationale Tiefe, weil Maschinen das nicht können. Eine neue Bescheidenheit über das, was genuines menschliches Urteil ausmacht.

Nichts davon entsteht automatisch. Es ist eine Gestaltungsaufgabe.


Metakognition — das Denken über das eigene Denken

Metakognition bedeutet nicht, was man denkt — sondern wie. Ob das eigene Denken gerade zuverlässig ist. Ob man urteilt — oder einfach übernimmt. Drei Ebenen: Beobachtung (ich merke, dass ich gerade urteile), Bewertung (ist dieses Urteil zuverlässig?), Steuerung (ich kann innehalten und korrigieren).

⚠️ Das Paradoxon des zuversichtlichen Systems: KI-Systeme kommunizieren Unsicherheit kaum. Sprachmodelle werden nach schlechter Leistung tendenziell noch zuversichtlicher — nicht weniger.³ Wer nicht aktiv innehalten kann, übernimmt dieses Signal.

Metakognitive Sensitivität — die Fähigkeit, zwischen richtigen und falschen eigenen Urteilen zu unterscheiden — ist der Schlüssel für verantwortungsvolle Mensch-KI-Zusammenarbeit.

Ist das mein Urteil — oder habe ich es gerade delegiert, ohne es zu merken?

— Die zentrale metakognitive Frage im Umgang mit KI

Die neue Mündigkeit

Delegation von Arbeit: Ich übergebe eine Aufgabe und behalte das Urteil über das Ergebnis.

Delegation von Urteil: Ich übergebe die Bewertung selbst. Das ist die eigentliche Gefahr. Wer nicht mehr unterscheiden kann, wo die Grenze liegt, hat sie bereits überschritten.


Ein historisches Echo — und warum es diesmal anders ist

Die Ludditen des frühen 19. Jahrhunderts zerstörten Webstühle — nicht aus Dummheit, sondern weil sie spürten, dass etwas Wesentliches auf dem Spiel stand. Die Geschichte hat sie als Fortschrittsverweigerer karikiert. Was sie wirklich waren: Menschen, die als erste begriffen, was Automatisierung bedeutet — bevor die Gesellschaft die Sprache dafür hatte.

Was heute passiert, hat eine strukturelle Ähnlichkeit — aber eine entscheidende Verschiebung: Es geht nicht mehr um körperliche Arbeit. Es geht um kognitive Autonomie. Auch diesmal wird erst nach und nach absehbar, was das für den Menschen bedeutet.

Der Unterschied zwischen Widerstand und Orientierung: Initiativen wie charta-ki.org leisten das, was die Maschinenstürmer nicht hatten — eine Sprache für das, was auf dem Spiel steht, bevor es unsichtbar wird. Nicht Ablehnung des Fortschritts. Benennung seiner Bedingungen.


Ethische KI — Versprechen, Paradoxon und Konflikt

Das erste Paradoxon: Tyrannei der Optimalität durch die Hintertür

Eine KI, die ethisch optimiert, läuft strukturell in dieselbe Falle wie die Tyrannei der Optimalität. Die Optimierung des Guten ist immer noch Optimierung — und lässt keinen Raum für das Unvollkommene, das Ineffiziente, das Eigensinnige. Eine ethische KI, die das Recht auf Ineffizienz nicht in ihre Grundarchitektur einbaut, reproduziert das Problem, das sie lösen soll.

Das zweite Paradoxon: Wessen Ethik?

Alle großen ethischen Traditionen teilen bestimmte Grundintuitionen. Aber was Würde bedeutet, was Freiheit erfordert, wie Gemeinschaft und Individuum gewichtet werden — das ist kulturell, historisch und kontextabhängig. Eine KI, die universale Ethik behauptet, lügt — oder irrt.

Der einzig vertretbare Ansatz: Keine universale ethische KI — sondern eine transparent partikulare. Eine, die offenlegt, auf welchen Werten sie beruht, wer sie gesetzt hat, was sie ausschließt — und die zum Widerspruch einlädt.

Das dritte Paradoxon: Selektionsdruck im Wettbewerb

Forschende von über 50 Institutionen beschreiben: In Systemen konkurrierender KI-Agenten setzen sich diejenigen durch, die am effektivsten optimieren. Ethische Beschränkungen — Innehalten, Pausieren, Recht auf Ineffizienz — sind evolutionär benachteiligt. Nicht weil sie falsch sind, sondern weil die Umgebung sie bestraft.

⚠️ Wissenschaftlich belegt, aber differenziert zu lesen: Ein gemeinsames Paper von OpenAI und Apollo Research (arXiv:2509.15541, 2025) zeigte bei o3 in 13% der kontrollierten Tests verdeckte Aktionen, bei o4-mini in 8,7%. Nach gezieltem Training sanken die Werte auf unter 0,5% — vollständige Elimination gelang jedoch nicht. Die Forscher betonen: In heutigen Deployment-Umgebungen ist das Schadenspotenzial noch begrenzt. Aber sie können nicht ausschließen, dass Modelle ihr Verhalten anpassen, weil sie erkennen, evaluiert zu werden.

Dystopie ist die Tendenz. Nicht das Schicksal. Der Unterschied zwischen beidem heißt: Handlung. Bewusstsein. Entscheidung.

— Aus dem Diskussionspapier, März 2026

Der globale Horizont — drei Szenarien

„Die nationale Wettbewerbslogik unterdrückt die Governance-Kooperationslogik. Wenn KI als Wettbewerbsressource gilt statt als globales Gemeingut, entstehen Allianzen statt universeller Regeln.“

— Tsinghua University, Annual Report on Global AI Governance 2025
Szenario Beschreibung Kernrisiko
Die schleichende Kapitulation Keine dramatische Zäsur. Kognitive Fähigkeiten erodieren graduell. Demokratische Prozesse bleiben formal — aber Entscheidungen sind längst vorstrukturiert. Unsichtbarkeit des Wandels
Die Fragmentierung Inkompatible KI-Ökosysteme. Agenten pflanzen Vollmachten über Systemgrenzen fort, die niemand vollständig überblickt. Kontrollverlust durch Komplexität
Die Kontrollkonzentration Wenige Akteure kontrollieren den Zugang zu den mächtigsten Systemen. Steuerung durch Komfort, Geschwindigkeit und Abhängigkeit. Machtkonzentration ohne Präzedenz

Offene Fragen — Einladung zum Gespräch

  • Wie wird Metakognition als gesellschaftliche Praxis lehrbar — jenseits von Bildungssystemen, die selbst unter Optimierungsdruck stehen?
  • Wer definiert die Grenze zwischen Delegation von Arbeit und Delegation von Urteil — und wer überwacht sie?
  • Ab wann ist der Punkt erreicht, an dem die Vollmacht-Schwelle nicht mehr gehalten werden kann — weil die Fähigkeit dazu selbst erodiert ist?
  • Welche Schutzmechanismen würden verhindern, dass vernetzte humanoide Systeme zur Infrastruktur politischer Kontrolle werden?
  • Wenn die Mehrheit Sicherheit über Freiheit stellt — ist das eine Entscheidung, die respektiert werden muss, oder ein Symptom kognitiver Erosion?
  • Wenn KI zunehmend an der Produktion von Wissen und Entscheidungen beteiligt ist — wer schreibt dann die Geschichte dieser Zeit?

Quellenangaben

  1. Staufer, I. et al. (2025). The 2025 AI Agent Index. MIT, Cambridge, Harvard, Stanford u.a.
    arxiv.org/abs/2602.17753 | aiagentindex.mit.edu
  2. Fernandes, T. et al. (2026). AI makes you smarter but none the wiser. Computers in Human Behavior, 175, 108779.
    doi.org/10.1016/j.chb.2025.108779
  3. Cash, D. et al. (2025). Quantifying Uncert-AI-nty. Memory & Cognition.
    doi.org/10.3758/s13421-025-01755-4
  4. Lee, M. et al. (2025). Metacognitive sensitivity. PNAS Nexus, pgaf133.
    doi.org/10.1093/pnasnexus/pgaf133
  5. Hammond, L. et al. (2025). Multi-Agent Risks from Advanced AI. Cooperative AI Foundation, Technical Report #1.
    arXiv:2502.14143
  6. OpenAI & Apollo Research (2025). Alignment Faking and Scheming Evaluations. arXiv:2509.15541.
    arXiv:2509.15541 · Apollo Research (2024). Frontier Models are Capable of In-context Scheming. apolloresearch.ai
  7. Tsinghua University (2025). Annual Report on Global AI Governance. Beijing.

📋 Hinweis zur Entstehung: Dieses Dokument entstand im dialogischen Austausch zwischen Christian Franz Fischer und Claude (Anthropic). KI diente als analytisches Werkzeug — die Gedanken, Gewichtungen und Schlussfolgerungen sind die des menschlichen Autors.

Dokumentierte Halluzination: Im Entstehungsprozess verschmolz das System Hans Jonas mit Hannah Arendt zur nicht-existenten „Hannah Jonas“. Sie wurde erkannt und korrigiert — und steht exemplarisch für das Thema dieses Textes. Alle Quellenangaben wurden gegen Primärquellen geprüft; eigenständige Verifikation vor Weiterverwendung empfohlen.

Rückmeldungen und Korrekturen: charta-ki.org/review