Stuff AI CAN'T Do

¿Puede la IA improvisar una conversación con un humano de manera indistinguible de una conversación con otro humano ?

¿Qué opinas?

Explorar si la inteligencia artificial puede mantener una conversación tan natural que imite la interacción humana indaga en los límites de la capacidad de respuesta de las máquinas. ¿Qué se necesitaría para que una IA improvisara respuestas, se adaptara a tonos cambiantes y transmitiera empatía en tiempo real, más allá de los intercambios preescritos?

Background

Improvisar una conversación requiere entender el contexto, los matices y las sutilezas de la comunicación humana; esto actúa como una prueba de la capacidad de una IA para sostener intercambios creativos y relacionales. Los sistemas actuales de IA pueden generar respuestas similares a las humanas ante una amplia variedad de indicaciones, pero suelen depender de guiones predefinidos y, a menudo, no logran captar completamente el contexto o las sutilezas lingüísticas. Los investigadores están desarrollando modelos avanzados que aprenden de las interacciones humanas y adaptan los estilos conversacionales, avanzando hacia diálogos más realistas aunque la consistencia sigue siendo esquiva. Algunos sistemas de vanguardia logran intercambios notablemente realistas durante breves períodos, pero aún carecen de la profundidad, empatía y sentido común característicos de los interlocutores humanos. A mayo de 2026, ningún modelo ha logrado de manera consistente una improvisación indistinguible en contextos sostenidos. El trabajo continúa en el Stanford Natural Language Processing Group y en otros lugares para cerrar esta brecha.

Estado verificado por última vez en June 29, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · jun. 29, 2026
— The Question Before the Court —

¿Puede la IA improvisar una conversación con un humano de manera indistinguible de una conversación con otro humano?

★ The Court Finds ★
▼ Downgraded from Sí
Casi

Existen demostraciones limitadas — pero el panel no fue unánime.

Ruling of the Bench

El jurado reconoció que los sistemas de IA han alcanzado un notable nivel de fluidez conversacional, tan cercano al ritmo y tono humanos que solo los oídos más entrenados pueden detectar la diferencia. Sin embargo, se detuvieron —justo antes de la meta— porque el valle inquietante aún se abre ante un diálogo impecable y completamente natural. Veredicto CASI, con el único disenso inclinándose hacia lo inevitable. El fallo: *"Habla como nosotros, pero aún escuchamos el eco."*

— Hon. C. Babbage, Presiding
Jury Tally
1
1Casi
0No
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 No
Session III · May 2026 Casi · 83%
Session IV · May 2026 Casi · 83%
Session V · May 2026 Casi · 83%
Session VI · Jun 2026 Casi · 79%
Session VII · Jun 2026 Casi · 75%
Session VIII · Jun 2026 Casi · 88%
Session IX · Jun 2026 Sí · 88%
Session X · Jun 2026 Sí · 95%
Case № B155 · Session XI
In the Court of AI Capability

The Case File

Docket № B155 · Session XI · Vol. XI
I. Particulars of the Case
Question put to the court¿Puede la IA improvisar una conversación con un humano de manera indistinguible de una conversación con otro humano?
SessionXI (11 hearing)
Convened29 jun. 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → YES (Jun '26) → ALMOST (Jun '26)
Presiding JudgeHon. C. Babbage
II. Cumulative Tally Across Sessions

Across 11 sessions, 30 jurors have heard this case. Combined tally: 12 YES · 13 ALMOST · 5 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 1 — 0, the panel returns a verdict of CASI, with verdict confidence of 88%. The court so orders. Verdict downgraded from prior session.

IV. Declaraciones del tribunal
Jurado I

"Modern LLMs like GPT-4o and others achieve human-level indistinguishability in controlled tests."

Jurado II ALMOST

"State-of-the-art chatbots can mimic human conversations"

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

C. Babbage
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 27% · Sí 42% · Quizás 31% 26 votes
No · 27%
Sí · 42%
Quizás · 31%
15 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

11 jury checks · más reciente hace 5 días
29 Jun 2026 2 jurors · puede, indeciso indeciso
23 Jun 2026 1 juror · puede puede
18 Jun 2026 3 jurors · indeciso, puede, puede indeciso
12 Jun 2026 2 jurors · puede, indeciso indeciso
07 Jun 2026 2 jurors · puede, indeciso indeciso
02 Jun 2026 4 jurors · puede, indeciso, indeciso, indeciso indeciso
27 May 2026 3 jurors · puede, indeciso, indeciso indeciso
22 May 2026 4 jurors · indeciso, puede, puede, indeciso indeciso
16 May 2026 4 jurors · puede, puede, indeciso, indeciso indeciso estado cambiado
13 May 2026 3 jurors · no puede, no puede, no puede no puede
11 May 2026 2 jurors · no puede, no puede no puede

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Relational

¿Nos faltó uno?

Revisamos semanalmente.