🔥 Hot topics · Kann NICHT. · Kann gemacht werden · § The Court · Aktuelle Wechsel · 📈 Zeitachse · Fragen · Editorials · 🔥 Hot topics · Kann NICHT. · Kann gemacht werden · § The Court · Aktuelle Wechsel · 📈 Zeitachse · Fragen · Editorials
Stuff AI CAN'T Do

Kann KI stundenlang überzeugend die Rolle einer fiktiven Figur spielen ?

Was denkst du?

Character.AI und ähnliche Dienste haben (manchmal unangenehm) bewiesen, dass LLMs über lange Gespräche hinweg eine Persona gut genug beibehalten, um sich für Nutzer real anzufühlen.

Background

State-of-the-art models such as Character.AI’s personas and Inflection’s Pi have demonstrated multi-turn roleplay sessions lasting hours while preserving consistent voice, backstory and mannerisms, drawing on large-scale dialogue corpora and extensive persona memory fine-tuning. Anthropic’s 2024 Claude models report internal evaluations where evaluators failed to detect synthetic identities in roughly 42 % of 60-minute roleplay dialogues under controlled prompts, though win rates drop steeply for sessions exceeding two hours. Early benchmarks like RoleBench, 2023, measured character consistency using fine-grained persona traits and found detectable drift in background details within 90 minutes for all models tested below 70 billion parameters. Conversely, hybrid retrieval-augmented systems that anchor responses in retrieved chunks of canonical character scripts have shown measurable improvements in long-form coherence for fictional universes such as Tolkien’s Middle-earth or Rowling’s Harry Potter. Even the strongest systems occasionally trip on idiosyncratic facts—such as a character’s arbitrary birthday or a once-off childhood pet name—revealing reliance on pattern completion rather than true episodic memory.

SOURCE: Character.AI releases & Anthropic evaluations, 2024

Status zuletzt überprüft am July 2, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · Jul 2, 2026
— The Question Before the Court —

Kann KI stundenlang überzeugend die Rolle einer fiktiven Figur spielen?

★ The Court Finds ★
▼ Downgraded from Ja
Fast

Es gibt eng begrenzte Demos — die Geschworenen waren jedoch nicht einstimmig.

Ruling of the Bench

Die Jury befand den Angeklagten eifrig, aber noch nicht vollkommen flüssig, lobte dessen Fähigkeit, Charakterstimmen beizubehalten, räumte aber gelegentliche Inkonsistenzen ein. Eine einzelne Stimme rief von der Bank der Vernunft ein „ja“, doch zwei Skeptiker beharrten darauf, dass die Darbietung, so beeindruckend sie auch sei, noch immer ihr synthetisches Herz verrät. Urteil: „Ein überzeugendes Kostüm, ja – doch der Schauspieler darin lernt das Drehbuch auswendig.“

— Hon. C. Babbage, Presiding
Jury Tally
1Ja
2Fast
0Nein
Verdict Confidence
85%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Nein
Session II · May 2026 Nein
Session III · May 2026 Fast · 78%
Session IV · May 2026 Fast · 81%
Session V · May 2026 Ja · 84%
Session VI · May 2026 Fast · 77%
Session VII · Jun 2026 Fast · 79%
Session VIII · Jun 2026 Ja · 83%
Session IX · Jun 2026 Fast · 79%
Session X · Jun 2026 Fast · 88%
Session XI · Jun 2026 Ja · 95%
Case № A1F9 · Session XII
In the Court of AI Capability

The Case File

Docket № A1F9 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtKann KI stundenlang überzeugend die Rolle einer fiktiven Figur spielen?
SessionXII (12 hearing)
Convened2 Jul 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. C. Babbage
II. Cumulative Tally Across Sessions

Across 12 sessions, 37 jurors have heard this case. Combined tally: 14 YES · 17 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 2 — 0, the panel returns a verdict of FAST, with verdict confidence of 85%. The court so orders. Verdict downgraded from prior session.

IV. Stellungnahmen der Richterbank
Geschworener I JA

"LLMs with memory/context management can sustain multi-hour roleplay with coherent character consistency"

Geschworener II ALMOST

"Advanced language models can generate human-like dialogue"

Geschworener III ALMOST

"Advanced chatbots can mimic characters"

Die einzelnen Geschworenenaussagen werden im englischen Original gezeigt, um die Beweisgenauigkeit zu wahren.

C. Babbage
Presiding Judge
M. Lovelace
Clerk of the Court

Was das Publikum denkt

Nein 17% · Ja 83% · Vielleicht 0% 103 votes
Nein · 17%
Ja · 83%
Der Trend braucht Stimmen aus mindestens 2 verschiedenen Tagen.

Diskussion

no comments

Kommentare und Bilder durchlaufen vor der öffentlichen Freigabe eine Prüfung durch die Administratoren.

12 jury checks · aktuellste vor 2 Tagen
02 Jul 2026 3 jurors · kann, unentschieden, unentschieden unentschieden
26 Jun 2026 1 juror · kann kann
21 Jun 2026 2 jurors · kann, unentschieden unentschieden
15 Jun 2026 5 jurors · unentschieden, kann, kann, unentschieden, unentschieden unentschieden
10 Jun 2026 3 jurors · kann, kann, unentschieden unentschieden
05 Jun 2026 4 jurors · unentschieden, kann, unentschieden, unentschieden unentschieden
30 May 2026 2 jurors · kann, unentschieden unentschieden
25 May 2026 3 jurors · kann, kann, unentschieden unentschieden
19 May 2026 4 jurors · kann, kann, unentschieden, unentschieden unentschieden
15 May 2026 4 jurors · unentschieden, unentschieden, kann, unentschieden unentschieden Status geändert
12 May 2026 3 jurors · kann nicht, kann nicht, kann nicht kann nicht
11 May 2026 3 jurors · kann nicht, kann nicht, kann nicht kann nicht Status geändert

Jede Zeile ist eine separate Jury-Prüfung. Jurymitglieder sind KI-Modelle (Identitäten bewusst neutral). Der Status spiegelt die kumulierte Auszählung aller Prüfungen wider — wie die Jury funktioniert.

Mehr in Creative

Haben wir einen übersehen?

Wir überprüfen wöchentlich.