🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne · 🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne
Stuff AI CAN'T Do

Czy AI może wiarygodnie udawać fikcyjną postać przez wiele godzin ?

Co o tym myślisz?

Character.AI i podobne usługi dowiodły (czasem niekomfortowo) że duże modele językowe utrzymują personę przez długie rozmowy na tyle dobrze, by wydawać się realnymi dla użytkowników.

Background

State-of-the-art models such as Character.AI’s personas and Inflection’s Pi have demonstrated multi-turn roleplay sessions lasting hours while preserving consistent voice, backstory and mannerisms, drawing on large-scale dialogue corpora and extensive persona memory fine-tuning. Anthropic’s 2024 Claude models report internal evaluations where evaluators failed to detect synthetic identities in roughly 42 % of 60-minute roleplay dialogues under controlled prompts, though win rates drop steeply for sessions exceeding two hours. Early benchmarks like RoleBench, 2023, measured character consistency using fine-grained persona traits and found detectable drift in background details within 90 minutes for all models tested below 70 billion parameters. Conversely, hybrid retrieval-augmented systems that anchor responses in retrieved chunks of canonical character scripts have shown measurable improvements in long-form coherence for fictional universes such as Tolkien’s Middle-earth or Rowling’s Harry Potter. Even the strongest systems occasionally trip on idiosyncratic facts—such as a character’s arbitrary birthday or a once-off childhood pet name—revealing reliance on pattern completion rather than true episodic memory.

SOURCE: Character.AI releases & Anthropic evaluations, 2024

Status sprawdzony ostatnio July 2, 2026.

📰

Galeria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · lip 2, 2026
— The Question Before the Court —

Czy AI może wiarygodnie udawać fikcyjną postać przez wiele godzin?

★ The Court Finds ★
▼ Downgraded from Tak
Prawie

Istnieją wąskie dema — ale skład nie był jednomyślny.

Ruling of the Bench

Ława przysięgłych uznała oskarżonego za chętnego, ale jeszcze nie w pełni biegłego, chwaląc jego zdolność do utrzymywania głosów postaci przy jednoczesnym uznaniu okazjonalnych potknięć w spójności. Pojedynczy głos krzyknął „tak” z ławy rozsądku, lecz dwóch sceptyków upierało się, że występ, choć imponujący, wciąż zdradza swoje syntetyczne serce. Wyrok: „Przekonujący kostium, owszem – ale aktor wewnątrz wciąż wykuwa na pamięć scenariusz.”

— Hon. C. Babbage, Presiding
Jury Tally
1Tak
2Prawie
0Nie
Verdict Confidence
85%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Nie
Session II · May 2026 Nie
Session III · May 2026 Prawie · 78%
Session IV · May 2026 Prawie · 81%
Session V · May 2026 Tak · 84%
Session VI · May 2026 Prawie · 77%
Session VII · Jun 2026 Prawie · 79%
Session VIII · Jun 2026 Tak · 83%
Session IX · Jun 2026 Prawie · 79%
Session X · Jun 2026 Prawie · 88%
Session XI · Jun 2026 Tak · 95%
Case № A1F9 · Session XII
In the Court of AI Capability

The Case File

Docket № A1F9 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtCzy AI może wiarygodnie udawać fikcyjną postać przez wiele godzin?
SessionXII (12 hearing)
Convened2 lip 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. C. Babbage
II. Cumulative Tally Across Sessions

Across 12 sessions, 37 jurors have heard this case. Combined tally: 14 YES · 17 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 2 — 0, the panel returns a verdict of PRAWIE, with verdict confidence of 85%. The court so orders. Verdict downgraded from prior session.

IV. Oświadczenia składu sędziowskiego
Przysięgły I TAK

"LLMs with memory/context management can sustain multi-hour roleplay with coherent character consistency"

Przysięgły II ALMOST

"Advanced language models can generate human-like dialogue"

Przysięgły III ALMOST

"Advanced chatbots can mimic characters"

Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.

C. Babbage
Presiding Judge
M. Lovelace
Clerk of the Court

Co myśli publiczność

Nie 17% · Tak 83% · Może 0% 103 votes
Nie · 17%
Tak · 83%
Trend wymaga głosów z co najmniej 2 różnych dni.

Dyskusja

no comments

Komentarze i obrazy przechodzą przez weryfikację admina zanim pojawią się publicznie.

12 jury checks · najnowsze 2 dni temu
02 Jul 2026 3 jurors · potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
26 Jun 2026 1 juror · potrafi potrafi
21 Jun 2026 2 jurors · potrafi, nierozstrzygnięte nierozstrzygnięte
15 Jun 2026 5 jurors · nierozstrzygnięte, potrafi, potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
10 Jun 2026 3 jurors · potrafi, potrafi, nierozstrzygnięte nierozstrzygnięte
05 Jun 2026 4 jurors · nierozstrzygnięte, potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
30 May 2026 2 jurors · potrafi, nierozstrzygnięte nierozstrzygnięte
25 May 2026 3 jurors · potrafi, potrafi, nierozstrzygnięte nierozstrzygnięte
19 May 2026 4 jurors · potrafi, potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
15 May 2026 4 jurors · nierozstrzygnięte, nierozstrzygnięte, potrafi, nierozstrzygnięte nierozstrzygnięte status zmieniony
12 May 2026 3 jurors · nie potrafi, nie potrafi, nie potrafi nie potrafi
11 May 2026 3 jurors · nie potrafi, nie potrafi, nie potrafi nie potrafi status zmieniony

Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.

Więcej w Creative

Masz coś, co nam umknęło?

Dodaj stwierdzenie do atlasu. Sprawdzamy co tydzień.