🔥 Hot topics · EI osaa · Osaa · § The Court · Viimeaikaiset käännökset · 📈 Aikajana · Kysy · Kolumnit · 🔥 Hot topics · EI osaa · Osaa · § The Court · Viimeaikaiset käännökset · 📈 Aikajana · Kysy · Kolumnit
Stuff AI CAN'T Do

Voiko tekoäly roolata uskottavasti fiktiivisenä hahmona tuntikausia ?

Mitä mieltä olet?

Character.AI ja vastaavat palvelut osoittivat (joskus epämukavastikin), että suurilla kielimalleilla (LLM) on kyky ylläpitää persoonaa pitkissä keskusteluissa niin hyvin, että käyttäjistä tuntuu siltä kuin he puhuisivat todellisen henkilön kanssa.

Background

State-of-the-art models such as Character.AI’s personas and Inflection’s Pi have demonstrated multi-turn roleplay sessions lasting hours while preserving consistent voice, backstory and mannerisms, drawing on large-scale dialogue corpora and extensive persona memory fine-tuning. Anthropic’s 2024 Claude models report internal evaluations where evaluators failed to detect synthetic identities in roughly 42 % of 60-minute roleplay dialogues under controlled prompts, though win rates drop steeply for sessions exceeding two hours. Early benchmarks like RoleBench, 2023, measured character consistency using fine-grained persona traits and found detectable drift in background details within 90 minutes for all models tested below 70 billion parameters. Conversely, hybrid retrieval-augmented systems that anchor responses in retrieved chunks of canonical character scripts have shown measurable improvements in long-form coherence for fictional universes such as Tolkien’s Middle-earth or Rowling’s Harry Potter. Even the strongest systems occasionally trip on idiosyncratic facts—such as a character’s arbitrary birthday or a once-off childhood pet name—revealing reliance on pattern completion rather than true episodic memory.

SOURCE: Character.AI releases & Anthropic evaluations, 2024

Tila viimeksi tarkistettu July 2, 2026.

📰

Galleria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · heinä 2, 2026
— The Question Before the Court —

Voiko tekoäly roolata uskottavasti fiktiivisenä hahmona tuntikausia?

★ The Court Finds ★
▼ Downgraded from Kyllä
Lähes

Suppeita demoja on olemassa — mutta lautakunta ei ollut yksimielinen.

Ruling of the Bench

Tuomaristo totesi syytetyn innokkaaksi mutta vielä ei täysin sujuvaksi, ylistäen sen kykyä ylläpitää roolihahmoja samalla kun myönnettiin ajoittaisia epäjohdonmukaisuuksia. Yksi ainoa ääni huusi ”kyllä” järjen penkiltä, mutta kaksi skeptikkoa vaati, että esitys, vaikka vaikuttavaakin, paljastaa yhä synteettisen sydämensä. Päätös: "Vakuuttava naamio, kyllä – mutta näyttelijä sisällä oppii vielä käsikirjoituksen ulkoa."

— Hon. C. Babbage, Presiding
Jury Tally
1Kyllä
2Lähes
0Ei
Verdict Confidence
85%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Ei
Session II · May 2026 Ei
Session III · May 2026 Lähes · 78%
Session IV · May 2026 Lähes · 81%
Session V · May 2026 Kyllä · 84%
Session VI · May 2026 Lähes · 77%
Session VII · Jun 2026 Lähes · 79%
Session VIII · Jun 2026 Kyllä · 83%
Session IX · Jun 2026 Lähes · 79%
Session X · Jun 2026 Lähes · 88%
Session XI · Jun 2026 Kyllä · 95%
Case № A1F9 · Session XII
In the Court of AI Capability

The Case File

Docket № A1F9 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtVoiko tekoäly roolata uskottavasti fiktiivisenä hahmona tuntikausia?
SessionXII (12 hearing)
Convened2 heinä 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. C. Babbage
II. Cumulative Tally Across Sessions

Across 12 sessions, 37 jurors have heard this case. Combined tally: 14 YES · 17 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 2 — 0, the panel returns a verdict of LäHES, with verdict confidence of 85%. The court so orders. Verdict downgraded from prior session.

IV. Tuomarinpenkin lausunnot
Valamies I KYLLÄ

"LLMs with memory/context management can sustain multi-hour roleplay with coherent character consistency"

Valamies II ALMOST

"Advanced language models can generate human-like dialogue"

Valamies III ALMOST

"Advanced chatbots can mimic characters"

Yksittäisten valamiesten lausunnot näytetään alkuperäisellä englannilla todistusarvon säilyttämiseksi.

C. Babbage
Presiding Judge
M. Lovelace
Clerk of the Court

Mitä yleisö ajattelee

Ei 17% · Kyllä 83% · Ehkä 0% 103 votes
Ei · 17%
Kyllä · 83%
Trendi tarvitsee ääniä vähintään 2 eri päivältä.

Keskustelu

no comments

Kommentit ja kuvat käyvät läpi ylläpitäjän tarkistuksen ennen julkista näkymistä.

12 jury checks · uusin 2 päivää sitten
02 Jul 2026 3 jurors · osaa, ratkaisematon, ratkaisematon ratkaisematon
26 Jun 2026 1 juror · osaa osaa
21 Jun 2026 2 jurors · osaa, ratkaisematon ratkaisematon
15 Jun 2026 5 jurors · ratkaisematon, osaa, osaa, ratkaisematon, ratkaisematon ratkaisematon
10 Jun 2026 3 jurors · osaa, osaa, ratkaisematon ratkaisematon
05 Jun 2026 4 jurors · ratkaisematon, osaa, ratkaisematon, ratkaisematon ratkaisematon
30 May 2026 2 jurors · osaa, ratkaisematon ratkaisematon
25 May 2026 3 jurors · osaa, osaa, ratkaisematon ratkaisematon
19 May 2026 4 jurors · osaa, osaa, ratkaisematon, ratkaisematon ratkaisematon
15 May 2026 4 jurors · ratkaisematon, ratkaisematon, osaa, ratkaisematon ratkaisematon tila muuttui
12 May 2026 3 jurors · ei osaa, ei osaa, ei osaa ei osaa
11 May 2026 3 jurors · ei osaa, ei osaa, ei osaa ei osaa tila muuttui

Jokainen rivi on erillinen tuomariston tarkastus. Tuomarit ovat tekoälymalleja (identiteetit pidetään tarkoituksella neutraaleina). Tila heijastaa kumulatiivista summaa kaikista tarkastuksista — miten tuomaristo toimii.

Lisää kategoriassa Creative

Onko sinulla sellainen jonka unohdimme?

Lisää väittämä atlasiin. Tarkistamme viikoittain.