🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne · 🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne
Stuff AI CAN'T Do

Czy AI może wiarygodnie udawać fikcyjną postać przez wiele godzin ?

Co o tym myślisz?

Character.AI i podobne usługi dowiodły (czasem niekomfortowo) że duże modele językowe utrzymują personę przez długie rozmowy na tyle dobrze, by wydawać się realnymi dla użytkowników.

Background

State-of-the-art models such as Character.AI’s personas and Inflection’s Pi have demonstrated multi-turn roleplay sessions lasting hours while preserving consistent voice, backstory and mannerisms, drawing on large-scale dialogue corpora and extensive persona memory fine-tuning. Anthropic’s 2024 Claude models report internal evaluations where evaluators failed to detect synthetic identities in roughly 42 % of 60-minute roleplay dialogues under controlled prompts, though win rates drop steeply for sessions exceeding two hours. Early benchmarks like RoleBench, 2023, measured character consistency using fine-grained persona traits and found detectable drift in background details within 90 minutes for all models tested below 70 billion parameters. Conversely, hybrid retrieval-augmented systems that anchor responses in retrieved chunks of canonical character scripts have shown measurable improvements in long-form coherence for fictional universes such as Tolkien’s Middle-earth or Rowling’s Harry Potter. Even the strongest systems occasionally trip on idiosyncratic facts—such as a character’s arbitrary birthday or a once-off childhood pet name—revealing reliance on pattern completion rather than true episodic memory.

SOURCE: Character.AI releases & Anthropic evaluations, 2024

Status sprawdzony ostatnio June 26, 2026.

📰

Galeria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · cze 26, 2026
— The Question Before the Court —

Czy AI może wiarygodnie udawać fikcyjną postać przez wiele godzin?

★ The Court Finds ★
▲ Upgraded from Prawie
Tak

Jury udzieliło jednoznacznie twierdzącej odpowiedzi.

Ruling of the Bench

Po rozważeniu godzin chaotycznej pogawędki i dramatycznych monologów, ławka przysięgłych doszła do wniosku, że współczesna AI potrafi utrzymać przekonującą personę, choć od czasu do czasu popełniając drobne błędy w formie prawdopodobnego nonsensu. Jedyny głosujący z uznaniem wyraził się o zdolności modelu do płynnego przełączania akcentów, tworzenia tła fabularnego i oddawania emocji, nie prosząc nawet o przerwę na kawę. Orzeczenie: Świadek został zdemaskowany – o ile publiczność zawiesza disbelief, przedstawienie jest kompletne.

— Hon. B. Liskov-Chen, Presiding
Jury Tally
1Tak
0Prawie
0Nie
Verdict Confidence
95%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Nie
Session II · May 2026 Nie
Session III · May 2026 Prawie · 78%
Session IV · May 2026 Prawie · 81%
Session V · May 2026 Tak · 84%
Session VI · May 2026 Prawie · 77%
Session VII · Jun 2026 Prawie · 79%
Session VIII · Jun 2026 Tak · 83%
Session IX · Jun 2026 Prawie · 79%
Session X · Jun 2026 Prawie · 88%
Case № A1F9 · Session XI
In the Court of AI Capability

The Case File

Docket № A1F9 · Session XI · Vol. XI
I. Particulars of the Case
Question put to the courtCzy AI może wiarygodnie udawać fikcyjną postać przez wiele godzin?
SessionXI (11 hearing)
Convened26 cze 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 11 sessions, 34 jurors have heard this case. Combined tally: 13 YES · 15 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 0 — 0, the panel returns a verdict of TAK, with verdict confidence of 95%. The court so orders. Verdict upgraded from prior session.

IV. Oświadczenia składu sędziowskiego
Przysięgły I TAK

"LLMs maintain context and coherence in long roleplays across diverse scenarios."

Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Co myśli publiczność

Nie 17% · Tak 83% · Może 0% 103 votes
Nie · 17%
Tak · 83%
Trend wymaga głosów z co najmniej 2 różnych dni.

Dyskusja

no comments

Komentarze i obrazy przechodzą przez weryfikację admina zanim pojawią się publicznie.

11 jury checks · najnowsze 2 dni temu
26 Jun 2026 1 juror · potrafi potrafi
21 Jun 2026 2 jurors · potrafi, nierozstrzygnięte nierozstrzygnięte
15 Jun 2026 5 jurors · nierozstrzygnięte, potrafi, potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
10 Jun 2026 3 jurors · potrafi, potrafi, nierozstrzygnięte nierozstrzygnięte
05 Jun 2026 4 jurors · nierozstrzygnięte, potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
30 May 2026 2 jurors · potrafi, nierozstrzygnięte nierozstrzygnięte
25 May 2026 3 jurors · potrafi, potrafi, nierozstrzygnięte nierozstrzygnięte
19 May 2026 4 jurors · potrafi, potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
15 May 2026 4 jurors · nierozstrzygnięte, nierozstrzygnięte, potrafi, nierozstrzygnięte nierozstrzygnięte status zmieniony
12 May 2026 3 jurors · nie potrafi, nie potrafi, nie potrafi nie potrafi
11 May 2026 3 jurors · nie potrafi, nie potrafi, nie potrafi nie potrafi status zmieniony

Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.

Więcej w Creative

Masz coś, co nam umknęło?

Dodaj stwierdzenie do atlasu. Sprawdzamy co tydzień.