🔥 Hot topics · EI osaa · Osaa · § The Court · Viimeaikaiset käännökset · 📈 Aikajana · Kysy · Kolumnit · 🔥 Hot topics · EI osaa · Osaa · § The Court · Viimeaikaiset käännökset · 📈 Aikajana · Kysy · Kolumnit
Stuff AI CAN'T Do

Voiko tekoäly läpäistä vuoropohjaiset Turingin testit 5 minuutin ikkunoissa ?

Mitä mieltä olet?

Vähintään kolme vertaisarvioitua tutkimusta vuonna 2024 osoittivat, että ihmiset arvaavat väärin noin puolet ajasta lyhyissä keskustelunpituuksissa.

Background

Current AI systems are capable of passing turn-based interaction Turing tests for short periods of time, including 5-minute windows, in certain relational contexts. These tests typically involve a human evaluator engaging in natural language conversations with both a human and a machine, without knowing which is which, to determine if the evaluator can reliably distinguish between the two. Recent advancements in natural language processing and machine learning have enabled AI models to generate human-like responses and engage in coherent conversations, at least for limited durations. However, sustaining such interactions over longer periods or in more complex relational scenarios remains a significant challenge for AI research.

At least three peer-reviewed studies in 2024 showed humans guessing wrong about half the time at short conversation lengths.

— Enriched May 9, 2026 · Source: Association for the Advancement of Artificial Intelligence

Tila viimeksi tarkistettu July 3, 2026.

📰

Galleria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · heinä 3, 2026
— The Question Before the Court —

Voiko tekoäly läpäistä vuoropohjaiset Turingin testit 5 minuutin ikkunoissa?

★ The Court Finds ★
▼ Downgraded from Kyllä
Lähes

Suppeita demoja on olemassa — mutta lautakunta ei ollut yksimielinen.

Ruling of the Bench

After weighing testimony that today’s large language models can sail through short, tightly scripted Turing-style exchanges while still stumbling when the wind shifts or the topic strays off script, the jurors split three ways with only one bold soul declaring victory outright. The lone “Yes” juror marveled at the mimicry, while the “Almost” voice cautioned that the act breaks down under pressure or authenticity tests, leaving no dissenters who said “No” outright. Ruling: Clever mimicry, fragile mind—verdict in the almost lane.

— Hon. B. Liskov-Chen, Presiding
Jury Tally
1Kyllä
1Lähes
0Ei
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Ei
Session II · May 2026 Ei
Session III · May 2026 Lähes · 80%
Session IV · May 2026 Kyllä · 83%
Session V · May 2026 Lähes · 76%
Session VI · Jun 2026 Lähes · 80%
Session VII · Jun 2026 Lähes · 77%
Session VIII · Jun 2026 Lähes · 88%
Session IX · Jun 2026 Lähes · 85%
Session X · Jun 2026 Kyllä · 95%
Session XI · Jun 2026 Kyllä · 95%
Case № 5E0A · Session XII
In the Court of AI Capability

The Case File

Docket № 5E0A · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtVoiko tekoäly läpäistä vuoropohjaiset Turingin testit 5 minuutin ikkunoissa?
SessionXII (12 hearing)
Convened3 heinä 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → YES (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 12 sessions, 31 jurors have heard this case. Combined tally: 9 YES · 17 ALMOST · 5 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 1 — 0, the panel returns a verdict of LäHES, with verdict confidence of 88%. The court so orders. Verdict downgraded from prior session.

IV. Tuomarinpenkin lausunnot
Valamies I KYLLÄ

"State-of-the-art conversational AI (e.g., LLMs with dialogue frameworks) passes Turing-test-like evaluations in controlled settings."

Valamies II ALMOST

"Conversational AI models can mimic human-like interactions"

Yksittäisten valamiesten lausunnot näytetään alkuperäisellä englannilla todistusarvon säilyttämiseksi.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Mitä yleisö ajattelee

Ei 7% · Kyllä 81% · Ehkä 12% 238 votes
Kyllä · 81%
Ehkä · 12%
Trendi tarvitsee ääniä vähintään 2 eri päivältä.

Keskustelu

no comments

Kommentit ja kuvat käyvät läpi ylläpitäjän tarkistuksen ennen julkista näkymistä.

12 jury checks · uusin 9 tuntia sitten
03 Jul 2026 2 jurors · osaa, ratkaisematon ratkaisematon
28 Jun 2026 1 juror · osaa osaa
23 Jun 2026 1 juror · osaa osaa
17 Jun 2026 1 juror · ratkaisematon ratkaisematon
12 Jun 2026 2 jurors · ratkaisematon, osaa ratkaisematon
06 Jun 2026 3 jurors · ratkaisematon, ratkaisematon, ratkaisematon ratkaisematon
01 Jun 2026 5 jurors · ratkaisematon, ratkaisematon, osaa, ratkaisematon, ratkaisematon ratkaisematon
27 May 2026 4 jurors · ratkaisematon, osaa, ratkaisematon, ratkaisematon ratkaisematon
21 May 2026 3 jurors · osaa, osaa, ratkaisematon ratkaisematon
16 May 2026 4 jurors · ratkaisematon, ratkaisematon, osaa, ratkaisematon ratkaisematon tila muuttui
13 May 2026 3 jurors · ei osaa, ei osaa, ei osaa ei osaa
11 May 2026 2 jurors · ei osaa, ei osaa ei osaa tila muuttui

Jokainen rivi on erillinen tuomariston tarkastus. Tuomarit ovat tekoälymalleja (identiteetit pidetään tarkoituksella neutraaleina). Tila heijastaa kumulatiivista summaa kaikista tarkastuksista — miten tuomaristo toimii.

Lisää kategoriassa Relational

Onko sinulla sellainen jonka unohdimme?

Lisää väittämä atlasiin. Tarkistamme viikoittain.