🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře · 🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře
Stuff AI CAN'T Do

Může AI hrát roli fiktivního charakteru přesvědčivě po dobu několika hodin ?

Co si myslíš?

Character.AI a podobné služby prokázaly (někdy nepříjemně) to, že velké jazykové modely udržují osobnost během dlouhých rozhovorů dostatečně dobře na to, aby se uživatelům zdály skutečné.

Background

State-of-the-art models such as Character.AI’s personas and Inflection’s Pi have demonstrated multi-turn roleplay sessions lasting hours while preserving consistent voice, backstory and mannerisms, drawing on large-scale dialogue corpora and extensive persona memory fine-tuning. Anthropic’s 2024 Claude models report internal evaluations where evaluators failed to detect synthetic identities in roughly 42 % of 60-minute roleplay dialogues under controlled prompts, though win rates drop steeply for sessions exceeding two hours. Early benchmarks like RoleBench, 2023, measured character consistency using fine-grained persona traits and found detectable drift in background details within 90 minutes for all models tested below 70 billion parameters. Conversely, hybrid retrieval-augmented systems that anchor responses in retrieved chunks of canonical character scripts have shown measurable improvements in long-form coherence for fictional universes such as Tolkien’s Middle-earth or Rowling’s Harry Potter. Even the strongest systems occasionally trip on idiosyncratic facts—such as a character’s arbitrary birthday or a once-off childhood pet name—revealing reliance on pattern completion rather than true episodic memory.

SOURCE: Character.AI releases & Anthropic evaluations, 2024

Stav naposledy zkontrolován July 2, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · čvc 2, 2026
— The Question Before the Court —

Může AI hrát roli fiktivního charakteru přesvědčivě po dobu několika hodin?

★ The Court Finds ★
▼ Downgraded from Ano
Téměř

Existují omezené ukázky — ale porota nebyla jednomyslná.

Ruling of the Bench

Porota shledala obžalovaného horlivého, ale ještě ne zcela plynulého, přičemž ocenila jeho schopnost udržet charakteristické hlasy, přičemž uznala občasné prohřešky v důslednosti. Jediný hlas zvolal „ano“ z lavice rozumu, ale dva skeptici trvali na tom, že výkon, ač působivý, stále prozrazuje své syntetické srdce. Rozsudek: „Přesvědčivý kostým, ano – ale herec uvnitř si stále pamatuje scénář.“

— Hon. C. Babbage, Presiding
Jury Tally
1Ano
2Téměř
0Ne
Verdict Confidence
85%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Ne
Session II · May 2026 Ne
Session III · May 2026 Téměř · 78%
Session IV · May 2026 Téměř · 81%
Session V · May 2026 Ano · 84%
Session VI · May 2026 Téměř · 77%
Session VII · Jun 2026 Téměř · 79%
Session VIII · Jun 2026 Ano · 83%
Session IX · Jun 2026 Téměř · 79%
Session X · Jun 2026 Téměř · 88%
Session XI · Jun 2026 Ano · 95%
Case № A1F9 · Session XII
In the Court of AI Capability

The Case File

Docket № A1F9 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtMůže AI hrát roli fiktivního charakteru přesvědčivě po dobu několika hodin?
SessionXII (12 hearing)
Convened2 čvc 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. C. Babbage
II. Cumulative Tally Across Sessions

Across 12 sessions, 37 jurors have heard this case. Combined tally: 14 YES · 17 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 2 — 0, the panel returns a verdict of TéMěř, with verdict confidence of 85%. The court so orders. Verdict downgraded from prior session.

IV. Prohlášení soudců
Porotce I ANO

"LLMs with memory/context management can sustain multi-hour roleplay with coherent character consistency"

Porotce II ALMOST

"Advanced language models can generate human-like dialogue"

Porotce III ALMOST

"Advanced chatbots can mimic characters"

Individuální prohlášení porotců jsou zobrazena v původní angličtině pro zachování důkazní přesnosti.

C. Babbage
Presiding Judge
M. Lovelace
Clerk of the Court

Co si myslí publikum

Ne 17% · Ano 83% · Možná 0% 103 votes
Ne · 17%
Ano · 83%
Trend potřebuje hlasy z alespoň 2 různých dní.

Diskuze

no comments

Komentáře a obrázky procházejí kontrolou admina, než se objeví veřejně.

12 jury checks · nejnovější před 2 dny
02 Jul 2026 3 jurors · umí, nerozhodnuto, nerozhodnuto nerozhodnuto
26 Jun 2026 1 juror · umí umí
21 Jun 2026 2 jurors · umí, nerozhodnuto nerozhodnuto
15 Jun 2026 5 jurors · nerozhodnuto, umí, umí, nerozhodnuto, nerozhodnuto nerozhodnuto
10 Jun 2026 3 jurors · umí, umí, nerozhodnuto nerozhodnuto
05 Jun 2026 4 jurors · nerozhodnuto, umí, nerozhodnuto, nerozhodnuto nerozhodnuto
30 May 2026 2 jurors · umí, nerozhodnuto nerozhodnuto
25 May 2026 3 jurors · umí, umí, nerozhodnuto nerozhodnuto
19 May 2026 4 jurors · umí, umí, nerozhodnuto, nerozhodnuto nerozhodnuto
15 May 2026 4 jurors · nerozhodnuto, nerozhodnuto, umí, nerozhodnuto nerozhodnuto stav změněn
12 May 2026 3 jurors · neumí, neumí, neumí neumí
11 May 2026 3 jurors · neumí, neumí, neumí neumí stav změněn

Každý řádek je samostatná kontrola poroty. Porotci jsou AI modely (identity záměrně neutrální). Stav odráží kumulativní součet všech kontrol — jak porota funguje.

Další v Creative

Máte nějakou, kterou jsme přehlédli?

Přidejte tvrzení do atlasu. Kontrolujeme týdně.