Eine Fortbildung für Lehrkräfte zum Thema neurodiverse Lernende soll Teilnehmenden vermitteln, wie sie Schüler*innen mit ADHS besser unterstützen können – doch echte Fallbeispiele sind knapp, und Rollenspiele mit Kolleg*innen fühlen sich oft künstlich an. Hier kommen KI-Personas ins Spiel: Sie sollen realistische, interaktive Simulationen bieten, in denen Pädagog*innen üben können, auf typische Verhaltensweisen einzugehen – Unterbrechungen, schnelle Themenwechsel, Schwierigkeiten bei der Aufgabenorganisation.
Doch was passiert, wenn die KI nach wenigen Sätzen plötzlich wie eine perfekt organisierte Musterschüler*in klingt – oder ihre Rolle als Lernende verlässt? Genau hier setzt die Studie „LLM-Based Educational Simulation: Evaluating Temporal Student Persona Stability Across ADHD Profiles“ an. Sie untersucht, ob große Sprachmodelle wie Claude Opus 4.5, GPT 5.1, Gemini 3.1 Pro, Grok und Deepseek, eine vorgegebene Lernenden-Persona mit ADHS über mehrere Gespräche hinweg konsistent darstellen können – und zeigt dabei auf, dass KI-Personas ohne klares Design ihre spezifischen Merkmale verlieren.
Die Erkenntnisse der Studie sind dabei nicht nur für Trainings, sondern auch für den Einsatz in professionellen Beratungssettings relevant. Immer häufiger wird diskutiert, KI auch in der Beratung von Erwachsenen einzusetzen – sei es in der Berufsberatung, der psychologischen Begleitung oder der sozialen Arbeit. Hier ist es besonders wichtig, dass die KI dauerhaft in einer bestimmten Rolle bleibt, um realistische und belastbare Gesprächsverläufe zu ermöglichen. Ohne gezielte Steuerung gleiten KI-Systeme in generische Muster ab – und verlieren damit ihren pädagogischen oder beratenden Mehrwert. Die Studie liefert damit nicht nur eine Warnung, sondern auch konkrete Handlungsempfehlungen, wie KI in Trainings- und Beratungskontexten stabil und verantwortungsvoll eingesetzt werden kann.
Die Studie: Was passiert, wenn KI Lernende spielt?
Die Studie geht der Frage nach, ob große Sprachmodelle in der Lage sind, eine vorgegebene Lernenden-Persona mit ADHS über mehrere Gespräche und Dialog-Turns hinweg konsistent darzustellen. Dabei nutzen die Autor*innen einen doppelten Messansatz: Einerseits geben die KI-Personas selbst Auskunft über ihre simulierte ADHS-Ausprägung, andererseits wird ihr tatsächliches Dialogverhalten von externen Bewerter*innen analysiert. Dieser Ansatz ermöglicht es, zu unterscheiden, ob die KI ihre Rolle nur behauptet – etwa durch standardisierte Selbstbeschreibungen – oder ob sie diese auch aktiv „auslebt“ und in ihrem Verhalten widerspiegelt.
Die Ergebnisse zeigen ein interessantes Spannungsfeld: Während die Selbstwahrnehmung der KI überraschend stabil bleibt – das Modell hält also seine interne Zuschreibung als Persona mit ADHS über mehrere Dialoge hinweg aufrecht –, kommt es im tatsächlichen Verhalten zu einem deutlichen Drift. In freien, unstrukturierten Gesprächen verlieren die KI-Personas zusehends ihre typischen ADHS-Merkmale: Sie wirken organisierter, weniger impulsiv und weniger ablenkbar. Die Studie bezeichnet dieses Phänomen als Persona-Drift – ein schleichender Verlust der spezifischen Rollenmerkmale, der die Simulation unbrauchbar macht. Der entscheidende Faktor, der diesem Drift entgegenwirkt, ist Struktur. In klar definierten, gescripteten Interaktionen – etwa festgelegte Lernsituationen wie Gruppenarbeiten, Feedbackgespräche oder Aufgabenklärungen – bleibt die Persona deutlich konsistenter. Freie Chats ohne Rahmen führen dagegen fast zwangsläufig dazu, dass die KI in einen generischen „Hilfsmodus“ verfällt und damit ihre Rolle als Lernender oder Beratungssuchender verlässt.
Interaktionsdesign: Wie das Gespräch die KI formt
Die Studie macht eines deutlich: Nicht das Modell entscheidet über die Qualität der Simulation, sondern das Design der Interaktion. Für Bildner*innen und Berater*innen bedeutet das, dass sie KI nicht einfach als „Werkzeug“ einsetzen können, das von selbst funktioniert. Stattdessen müssen sie das Gespräch aktiv gestalten, um sicherzustellen, dass die KI ihre Rolle nicht verliert – sei es als Lernende in einer Fortbildung oder als Beratungssuchende in einem Coaching-Prozess.
Um das Interaktionsdesign konkret zu stärken, sollten Sie vier zentrale Prinzipien beachten: Rollenklarheit, situative Einbettung, standardisierte Nachfragen und klare Gesprächsziele.
Zunächst braucht es eine präzise Rollenbeschreibung, die weit über ein einfaches Label hinausgeht. Statt nur zu sagen „Simuliere eine Person mit ADHS“, müssen der KI konkrete Verhaltensmuster, sprachliche Besonderheiten und typische Herausforderungen vorgegeben werden. Für eine Beratungssituation könnte das etwa so aussehen: „Du bist einer Erwachsener mit ADHS, die sich wegen Überforderung im Berufsalltag an dich wendet. Du springst häufig zwischen Themen hin und her, verlierst den Faden und brauchst klare Impulse, um bei der Sache zu bleiben. Deine Sätze sind oft fragmentarisch, und du reagierst empfindlich auf Unterbrechungen.“ Je detaillierter die Vorgabe, desto stabiler bleibt die KI in ihrer Rolle.
Der zweite Schritt ist die situative Einbettung in konkrete, realistische Szenarien. Offene Gespräche ohne Rahmen führen fast immer zum Persona-Drift. Stattdessen sollten Sie klare Settings wählen, die der KI Orientierung geben: eine Gruppenarbeit, in der die Persona ihre Unaufmerksamkeit zeigt, ein Feedbackgespräch mit typischen ADHS-Herausforderungen oder ein Beratungsgespräch, in dem sie als Rat suchender Erwachsener agiert. Diese Strukturen zwingen die KI, sich an die vorgegebenen Rollenmerkmale zu halten.
Drittens sind standardisierte Follow-ups entscheidend, um die Konsistenz der Persona zu überprüfen. Wiederkehrende Fragen wie „Wie gehst du vor, wenn du eine Aufgabe nicht verstehst?“ oder „Was lenkt dich gerade am meisten ab?“ helfen, Verhaltensänderungen sichtbar zu machen. Besonders in längerfristigen Beratungsprozessen, in denen die KI ihre Rolle über mehrere Sitzungen hinweg beibehalten muss, sind solche wiederkehrenden Elemente unverzichtbar.
Und schließlich: Die KI sollte nie „einfach nur reden“, sondern immer einem klaren didaktischen oder beratenden Zweck dienen. Ob als Fallbeispiel in einer Fortbildung, als Rollenspielpartnerin für Gesprächstrainings oder als simulierter Beratungssuchende*r – ohne ein definiertes Ziel verliert die Interaktion ihre Richtung, und die KI fällt schnell in generische Antwortmuster zurück.
Für Bildner*innen und Berater*innen bedeutet das: KI ist kein Selbstläufer. Wer sie effektiv nutzen will, muss Zeit in die Vorbereitung stecken – Rollen präzise definieren, Gespräche strukturieren und die Interaktion gezielt steuern. Nur so lässt sich verhindern, dass die KI ihre Rolle verliert und die Simulation ihren pädagogischen oder beratenden Mehrwert einbüßt. Dabei ist es entscheidend, Prompten nicht als technische Fertigkeit, sondern als kommunikativen Skill der Mensch-Maschine-Interaktion zu verstehen. Es geht nicht darum, der KI einen statischen Befehl zu geben, sondern einen dialogischen Rahmen zu schaffen, in dem die KI ihre Rolle aktiv ausfüllen kann. Das erfordert nicht nur technisches Know-how, sondern vor allem pädagogische und kommunikative Kompetenz – etwa die Fähigkeit, Feedback-Schleifen zu nutzen, Nachfragen gezielt einzusetzen und die Interaktion als lernenden Prozess zu gestalten.
Bias – Welches Bild von Lernenden steckt in der KI?
Ein besonders beunruhigender Befund der Studie ist das Default-Verhalten der Sprachmodelle, das aufzeigt, welche impliziten Normalitätsvorstellungen in KI-Systemen verankert sind. Wird eine KI einfach als „Schüler*in“ oder „Beratungssuchende*r“ angesprochen – ohne genauere Vorgaben zu Verhaltensweisen, Hintergründen oder spezifischen Merkmalen –, neigt sie dazu, stark ausgeprägte ADHS-Merkmale zu simulieren, selbst wenn eigentlich eine „neutrale“ oder unauffällige Person gewünscht ist. Dieses Phänomen offenbart, dass KI-Systeme nicht neutral sind, sondern auf Basis ihrer Trainingsdaten bestimmte Bilder von Lernenden reproduzieren – ohne dass es den Nutzer*innen bewusst wird. Die Gefahr liegt darin, dass diese Default-Personas Stereotype verstärken, etwa die Annahme, dass unaufmerksame oder unruhige Lernende automatisch chaotisch, unmotiviert oder weniger leistungsfähig sind. Für die Bildungsarbeit hat das weitreichende Konsequenzen: Lehrkräfte oder Beraterinnen könnten durch solche impliziten Vorgaben unbewusst ihre Erwartungen an reale Schülerinnen oder Klientinnen anpassen und damit verzerrte Wahrnehmungen verstärken. Gleichzeitig wird die Vielfalt realer Lernbiografien auf vereinfachte, oft klischeehafte Muster reduziert, was die Gefahr birgt, dass komplexe individuelle Bedürfnisse und Stärken unsichtbar bleiben. Besonders problematisch wird dies, wenn KI-generierte Fallbeispiele ungeprüft in Fortbildungen, Lehrmaterialien oder Beratungshandbücher übernommen werden – und so unreflektierte Vorurteile in pädagogische oder beratende Praktiken einsickern.
Grenzen: Was LLM-Personas (nicht) können
Die Studie macht vor allem die Grenzen von KI-Simulationen deutlich: Feine Nuancen lassen sich schwer abbilden. Besonders mittlere oder uneindeutige ADHS-Ausprägungen werden unzuverlässig dargestellt, und komplexe, individuelle Verhaltensmuster – wie sie bei neurodiversen Menschen typisch sind – reduzieren sich oft auf grobe Klischees. Das bedeutet, dass LLM-Personas zwar gut für prototypische Trainingsfälle geeignet sind, etwa zur Sensibilisierung für ADHS oder andere neurodiverse Profile, sie aber keine professionelle Einschätzung ersetzen können – weder in der Pädagogik noch in der Beratung. Sie sollten daher nicht als Ersatz für reale Perspektiven verstanden werden, sondern als Reflexions- und Übungsmaterial, das es ermöglicht, typische Herausforderungen zu simulieren, Sensibilität zu schärfen und Handlungsstrategien in einem geschützten Rahmen auszuprobieren.
