Stuff AI CAN'T Do

¿Puede la IA improvisar una conversación con un humano de manera indistinguible de una conversación con otro humano ?

¿Qué opinas?

Explorar si la inteligencia artificial puede mantener una conversación tan natural que imite la interacción humana indaga en los límites de la capacidad de respuesta de las máquinas. ¿Qué se necesitaría para que una IA improvisara respuestas, se adaptara a tonos cambiantes y transmitiera empatía en tiempo real, más allá de los intercambios preescritos?

Background

Improvisar una conversación requiere entender el contexto, los matices y las sutilezas de la comunicación humana; esto actúa como una prueba de la capacidad de una IA para sostener intercambios creativos y relacionales. Los sistemas actuales de IA pueden generar respuestas similares a las humanas ante una amplia variedad de indicaciones, pero suelen depender de guiones predefinidos y, a menudo, no logran captar completamente el contexto o las sutilezas lingüísticas. Los investigadores están desarrollando modelos avanzados que aprenden de las interacciones humanas y adaptan los estilos conversacionales, avanzando hacia diálogos más realistas aunque la consistencia sigue siendo esquiva. Algunos sistemas de vanguardia logran intercambios notablemente realistas durante breves períodos, pero aún carecen de la profundidad, empatía y sentido común característicos de los interlocutores humanos. A mayo de 2026, ningún modelo ha logrado de manera consistente una improvisación indistinguible en contextos sostenidos. El trabajo continúa en el Stanford Natural Language Processing Group y en otros lugares para cerrar esta brecha.

Estado verificado por última vez en May 22, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026
Sitting at the Bench Filed · may. 22, 2026
— The Question Before the Court —

¿Puede la IA improvisar una conversación con un humano de manera indistinguible de una conversación con otro humano?

★ The Court Finds ★
Reaffirmed
Casi

Existen demostraciones limitadas — pero el panel no fue unánime.

Ruling of the Bench

Tras animada deliberación, el jurado se dividió entre quienes estaban convencidos de una mímica casi perfecta y quienes insistían en el último ápice de imperceptibilidad, pero todos coincidieron en que la brecha se había reducido a un filo de navaja. La división central giró en torno a si una sola pista—a un microestremecimiento en el tono, un leve eco de fantasmas de datos—debía seguir descalificando la actuación. El tribunal dictamina: "Una noche de déjà vu, pero el amanecer aún no ha llegado — veredicto a FAVOR DE ALMOST."

— Hon. E. Dijkstra-Patel, Presiding
Jury Tally
2
2Casi
0No
Verdict Confidence
83%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 No
Session III · May 2026 Casi · 83%
Case № B155 · Session IV
In the Court of AI Capability

The Case File

Docket № B155 · Session IV · Vol. IV
I. Particulars of the Case
Question put to the court¿Puede la IA improvisar una conversación con un humano de manera indistinguible de una conversación con otro humano?
SessionIV (4 hearing)
Convened22 may. 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26)
Presiding JudgeHon. E. Dijkstra-Patel
II. Cumulative Tally Across Sessions

Across 4 sessions, 13 jurors have heard this case. Combined tally: 4 YES · 4 ALMOST · 5 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 2 — 2 — 0, the panel returns a verdict of CASI, with verdict confidence of 83%. The court so orders.

IV. Declaraciones del tribunal
Jurado I ALMOST

"State-of-the-art chatbots can mimic human conversation"

Jurado II

"Modern LLMs achieve Turing-level indistinguishability in controlled human evaluations."

Jurado III

"State-of-the-art LLMs like GPT-4 can sustain natural, context-aware, and coherent dialogues indistinguishable from human conversation in text-based settings."

Jurado IV ALMOST

"State-of-the-art models can mimic human-like conversations"

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

E. Dijkstra-Patel
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 27% · Sí 42% · Quizás 31% 26 votes
No · 27%
Sí · 42%
Quizás · 31%
15 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

4 jury checks · más reciente hace 2 días
22 May 2026 4 jurors · indeciso, puede, puede, indeciso indeciso
16 May 2026 4 jurors · puede, puede, indeciso, indeciso indeciso estado cambiado
13 May 2026 3 jurors · no puede, no puede, no puede no puede
11 May 2026 2 jurors · no puede, no puede no puede

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Relational

¿Nos faltó uno?

Revisamos semanalmente.