Stuff AI CAN'T Do

¿Puede la IA responder preguntas complejas de diagnóstico médico al nivel de un médico certificado por la junta ?

¿Qué opinas?

¿Qué tan cerca están los sistemas de IA actuales de igualar la profundidad diagnóstica de un médico certificado por la junta cuando se enfrentan a casos médicos complejos? La pregunta indaga si los modelos avanzados, entrenados con vastos datos médicos, pueden emular el juicio, la conciencia contextual y la intuición clínica que definen la experiencia humana en el diagnóstico.

Background

Los modelos de lenguaje grande afinados en literatura médica pueden aprobar exámenes de licencia médica y generar diagnósticos diferenciales analizando síntomas del paciente, resultados de laboratorio e historial médico con alta precisión. Estos sistemas de IA se basan en entrenamiento con vastos repositorios de investigaciones revisadas por pares y registros de pacientes anonimizados para sugerir posibles condiciones y delinear los siguientes pasos diagnósticos o terapéuticos.

Los sistemas de IA actuales procesan grandes volúmenes de literatura médica y datos de pacientes para apoyar los flujos de trabajo de diagnóstico, pero no siempre igualan el razonamiento matizado, la experiencia clínica y el juicio contextual de los médicos certificados por la junta. Modelos como IBM Watson for Oncology y nuevos modelos de lenguaje grande han mostrado un buen desempeño en tareas específicas —como analizar imágenes de radiología o resultados de laboratorio— especialmente dentro de dominios clínicos bien definidos. Sin embargo, a menudo enfrentan desafíos con casos ambiguos, enfermedades raras y escenarios que requieren conocimiento tácito, donde la experiencia humana sigue siendo indispensable.

Organismos reguladores y profesionales, incluyendo la Academia Nacional de Medicina, enfatizan que los sistemas de IA deben funcionar como herramientas de apoyo a la toma de decisiones en lugar de como diagnosticadores autónomos. Las principales preocupaciones incluyen la responsabilidad en caso de error, los posibles sesgos incrustados en los datos de entrenamiento y la interpretabilidad de las recomendaciones de la IA para clínicos y pacientes. Evaluaciones independientes revisadas por pares hasta el 12 de mayo de 2026 indican que, si bien el rendimiento diagnóstico de la IA está mejorando, su precisión en entornos clínicos del mundo real aún no alcanza la lograda por los médicos humanos en la mayoría de los contextos.

Estado verificado por última vez en July 1, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul. 1, 2026
— The Question Before the Court —

¿Puede la IA responder preguntas complejas de diagnóstico médico al nivel de un médico certificado por la junta?

★ The Court Finds ★
Reaffirmed
Casi

Existen demostraciones limitadas — pero el panel no fue unánime.

Ruling of the Bench

El jurado encontró que aunque la IA puede estar ahora en el umbral de la razón clínica, aún no ha cruzado la línea de meta de la maestría certificada por la junta sin supervisión. Dos jurados se detuvieron justo antes de “sí”, convencidos de que la IA puede guiar diagnósticos estrechos pero sigue estando a un síntoma inesperado de distancia de la confiabilidad total. Así, el tribunal declara: AI llega a la clínica con ropa de hospital, pero aún no con un abrigo blanco.

— Hon. B. Liskov-Chen, Presiding
Jury Tally
0
2Casi
0No
Verdict Confidence
83%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 Casi · 78%
Session III · May 2026 Casi · 60%
Session IV · May 2026 Casi · 79%
Session V · May 2026 Casi · 78%
Session VI · Jun 2026 Casi · 75%
Session VII · Jun 2026 Casi · 73%
Session VIII · Jun 2026 Casi · 73%
Session IX · Jun 2026 Casi · 83%
Session X · Jun 2026 Casi · 85%
Case № 4C6C · Session XI
In the Court of AI Capability

The Case File

Docket № 4C6C · Session XI · Vol. XI
I. Particulars of the Case
Question put to the court¿Puede la IA responder preguntas complejas de diagnóstico médico al nivel de un médico certificado por la junta?
SessionXI (11 hearing)
Convened1 jul. 2026
Previously ruledNO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 11 sessions, 29 jurors have heard this case. Combined tally: 0 YES · 26 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 2 — 0, the panel returns a verdict of CASI, with verdict confidence of 83%. The court so orders.

IV. Declaraciones del tribunal
Jurado I ALMOST

"Specialized LLMs assist with differential diagnosis but lack full board-certified physician reliability"

Jurado II ALMOST

"AI assists diagnosis in narrow domains"

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 26% · Sí 13% · Quizás 61% 23 votes
No · 26%
Sí · 13%
Quizás · 61%
41 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

11 jury checks · más reciente hace 2 días
01 Jul 2026 2 jurors · indeciso, indeciso indeciso
26 Jun 2026 1 juror · indeciso indeciso
21 Jun 2026 2 jurors · indeciso, indeciso indeciso
15 Jun 2026 2 jurors · indeciso, indeciso indeciso
10 Jun 2026 2 jurors · indeciso, indeciso indeciso
04 Jun 2026 4 jurors · indeciso, indeciso, indeciso, indeciso indeciso
30 May 2026 3 jurors · indeciso, indeciso, indeciso indeciso
24 May 2026 5 jurors · indeciso, indeciso, indeciso, indeciso, indeciso indeciso
19 May 2026 1 juror · indeciso indeciso
15 May 2026 4 jurors · indeciso, indeciso, indeciso, indeciso indeciso estado cambiado
12 May 2026 3 jurors · no puede, no puede, no puede no puede estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en health

¿Nos faltó uno?

Revisamos semanalmente.