Character.AI und ähnliche Dienste haben (manchmal unangenehm) bewiesen, dass LLMs über lange Gespräche hinweg eine Persona gut genug beibehalten, um sich für Nutzer real anzufühlen. --- Aktuelle KI-Systeme können Texte generieren und Fragen in einer bestimmten Rolle beantworten, aber überzeugendes Rollenspiel als fiktive Figur über Stunden hinweg ist eine anspruchsvolle Aufgabe, die ein tiefes Verständnis für die Persönlichkeit, Hintergrundgeschichte und Motivation der Figur erfordert. Während KI-Modelle wie Sprachgeneratoren und Chatbots bestimmte Aspekte des Verhaltens einer Figur nachahmen können, fehlt ihnen oft die Feinheit und Konsistenz, die nötig ist, um ein überzeugendes Rollenspiel über einen längeren Zeitraum aufrechtzuerhalten. Forscher:innen erkunden den Einsatz fortschrittlicherer Techniken wie multimodale Interaktion und kognitive Architekturen, um glaubwürdigere und fesselndere Charakter-Simulationen zu schaffen. Diese Systeme befinden sich jedoch noch in einem frühen Entwicklungsstadium und haben noch nicht das erforderliche Maß an Komplexität erreicht, um langfristiges, überzeugendes Rollenspiel zu ermöglichen. — Aktualisiert am 9. Mai 2026 · Quelle: Association for the Advancement of Artificial Intelligence — https://www.aaai.org

🎨 Creative · May 8, 2026 · STUFFAICANTDO.COM · Markiere dies

Kann KI stundenlang überzeugend die Rolle einer fiktiven Figur spielen ?

Was denkst du? Kann KI das tun?

Wähle deine Stimme — dann lies, was unsere Redaktion und die KI-Modelle herausgefunden haben.

Character.AI und ähnliche Dienste haben (manchmal unangenehm) bewiesen, dass LLMs über lange Gespräche hinweg eine Persona gut genug beibehalten, um sich für Nutzer real anzufühlen.

#Roleplay

#Persona Consistency

#Character Immersion

Background

State-of-the-art models such as Character.AI’s personas and Inflection’s Pi have demonstrated multi-turn roleplay sessions lasting hours while preserving consistent voice, backstory and mannerisms, drawing on large-scale dialogue corpora and extensive persona memory fine-tuning. Anthropic’s 2024 Claude models report internal evaluations where evaluators failed to detect synthetic identities in roughly 42 % of 60-minute roleplay dialogues under controlled prompts, though win rates drop steeply for sessions exceeding two hours. Early benchmarks like RoleBench, 2023, measured character consistency using fine-grained persona traits and found detectable drift in background details within 90 minutes for all models tested below 70 billion parameters. Conversely, hybrid retrieval-augmented systems that anchor responses in retrieved chunks of canonical character scripts have shown measurable improvements in long-form coherence for fictional universes such as Tolkien’s Middle-earth or Rowling’s Harry Potter. Even the strongest systems occasionally trip on idiosyncratic facts—such as a character’s arbitrary birthday or a once-off childhood pet name—revealing reliance on pattern completion rather than true episodic memory.

SOURCE: Character.AI releases & Anthropic evaluations, 2024

Status zuletzt überprüft am July 2, 2026.

📰

Galerie

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026

Sitting at the Bench Filed · Jul 2, 2026

— The Question Before the Court —

Kann KI stundenlang überzeugend die Rolle einer fiktiven Figur spielen?

★ The Court Finds ★

▼ Downgraded from Ja

⚖

Fast

Es gibt eng begrenzte Demos — die Geschworenen waren jedoch nicht einstimmig.

Ruling of the Bench

Die Jury befand den Angeklagten eifrig, aber noch nicht vollkommen flüssig, lobte dessen Fähigkeit, Charakterstimmen beizubehalten, räumte aber gelegentliche Inkonsistenzen ein. Eine einzelne Stimme rief von der Bank der Vernunft ein „ja“, doch zwei Skeptiker beharrten darauf, dass die Darbietung, so beeindruckend sie auch sei, noch immer ihr synthetisches Herz verrät. Urteil: „Ein überzeugendes Kostüm, ja – doch der Schauspieler darin lernt das Drehbuch auswendig.“

— Hon. C. Babbage, Presiding

Jury Tally

1Ja

2Fast

0Nein

Verdict Confidence

85%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nein

Session II · May 2026 Nein

Session III · May 2026 Fast · 78%

Session IV · May 2026 Fast · 81%

Session V · May 2026 Ja · 84%

Session VI · May 2026 Fast · 77%

Session VII · Jun 2026 Fast · 79%

Session VIII · Jun 2026 Ja · 83%

Session IX · Jun 2026 Fast · 79%

Session X · Jun 2026 Fast · 88%

Session XI · Jun 2026 Ja · 95%

Case № A1F9 · Session XII

In the Court of AI Capability

The Case File

Docket № A1F9 · Session XII · Vol. XII

I. Particulars of the Case

Question put to the courtKann KI stundenlang überzeugend die Rolle einer fiktiven Figur spielen?

SessionXII (12 hearing)

Convened2 Jul 2026

Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jul '26)

Presiding JudgeHon. C. Babbage

II. Cumulative Tally Across Sessions

Across 12 sessions, 37 jurors have heard this case. Combined tally: 14 YES · 17 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 2 — 0, the panel returns a verdict of FAST, with verdict confidence of 85%. The court so orders. Verdict downgraded from prior session.

IV. Stellungnahmen der Richterbank

Geschworener I JA

"LLMs with memory/context management can sustain multi-hour roleplay with coherent character consistency"

Geschworener II ALMOST

"Advanced language models can generate human-like dialogue"

Geschworener III ALMOST

"Advanced chatbots can mimic characters"

Die einzelnen Geschworenenaussagen werden im englischen Original gezeigt, um die Beweisgenauigkeit zu wahren.

C. Babbage

Presiding Judge

M. Lovelace

Clerk of the Court

Aktueller Zustand

UMSTRITTEN

Wendepunkt

im Rennen

⚖ Jury ⓘ

14✓ · 6✗ · 17?

→ umstritten

Was das Publikum denkt

Nein 17% · Ja 83% · Vielleicht 0% 103 votes

Nein · 17%

Ja · 83%

Der Trend braucht Stimmen aus mindestens 2 verschiedenen Tagen.

Diskussion

no comments

⚖ 12 jury checks · aktuellste vor 2 Tagen

02 Jul 2026 3 jurors · kann, unentschieden, unentschieden unentschieden

26 Jun 2026 1 juror · kann kann

21 Jun 2026 2 jurors · kann, unentschieden unentschieden

15 Jun 2026 5 jurors · unentschieden, kann, kann, unentschieden, unentschieden unentschieden

10 Jun 2026 3 jurors · kann, kann, unentschieden unentschieden

05 Jun 2026 4 jurors · unentschieden, kann, unentschieden, unentschieden unentschieden

30 May 2026 2 jurors · kann, unentschieden unentschieden

25 May 2026 3 jurors · kann, kann, unentschieden unentschieden

19 May 2026 4 jurors · kann, kann, unentschieden, unentschieden unentschieden

15 May 2026 4 jurors · unentschieden, unentschieden, kann, unentschieden unentschieden Status geändert

12 May 2026 3 jurors · kann nicht, kann nicht, kann nicht kann nicht

11 May 2026 3 jurors · kann nicht, kann nicht, kann nicht kann nicht Status geändert

Jede Zeile ist eine separate Jury-Prüfung. Jurymitglieder sind KI-Modelle (Identitäten bewusst neutral). Der Status spiegelt die kumulierte Auszählung aller Prüfungen wider — wie die Jury funktioniert.

Mehr in Creative

Kann KI neue Materialien erfinden, die dem Periodensystem hinzugefügt werden können ?

UMSTRITTEN

Kann KI funktionierenden Code in 50+ Programmiersprachen aus natürlichsprachlichen Eingabeaufforderungen schreiben ?

UMSTRITTEN

🎲 Zufällige Auswahl

Kann KI Hautkrebs anhand eines Fotos mit der Genauigkeit eines Dermatologen diagnostizieren ?

UMSTRITTEN · Judgment

Alles in Creative → Zuvor umgedreht →

Kann KI stundenlang überzeugend die Rolle einer fiktiven Figur spielen ?

Tag vorschlagen

Kann KI stundenlang überzeugend die Rolle einer fiktiven Figur spielen?

The Case File

Was das Publikum denkt

Diskussion

Mehr in Creative

🧪 Wie wir KI-Fähigkeiten testen

⚠ Diese Frage vermischt mehr als eine Sache

Benachrichtige mich

Einbetten

Haben wir einen übersehen?

🔎Wird noch recherchiert

Aussage hinzufügen