Stuff AI CAN'T Do

¿Puede la IA aprobar el examen de licencia médica USMLE? — Estado verificado en junio de 2024 ?

¿Qué opinas?

GPT-4 superó la puntuación de aprobación en los tres pasos del Examen de Licencia Médica de los Estados Unidos. Ahora, las facultades de medicina enseñan 'cómo usar IA' como una habilidad clínica.

Background

AI systems have made significant progress in processing and generating human-like language. Passing the USMLE medical licensing exam is a complex task that requires a deep understanding of medical concepts, clinical knowledge, and critical thinking skills. Currently, AI models can assist with certain aspects of medical education, such as providing study materials, practicing questions, and offering feedback, but they are not yet capable of replacing human judgment and expertise in a high-stakes exam like the USMLE. While AI can process vast amounts of medical information, its ability to apply this knowledge in a practical, real-world setting, such as a licensing exam, is still limited. The development of AI systems that can pass the USMLE exam would require significant advancements in areas like natural language understanding, common sense, and decision-making under uncertainty. GPT-4 scored above passing on all three steps of the United States Medical Licensing Exam. Med-schools now teach 'how to use AI' as a clinical skill.

Estado verificado por última vez en July 2, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul. 2, 2026
— The Question Before the Court —

¿Puede la IA aprobar el examen de licencia médica USMLE? — Estado verificado en junio de 2024

★ The Court Finds ★
▼ Downgraded from Sí
Casi

Existen demostraciones limitadas — pero el panel no fue unánime.

Ruling of the Bench

El jurado encontró que la inteligencia artificial es capaz de hojear el libro de texto, pero aún no está lista para abrir su propia consulta. Aunque puede descifrar el código de opción múltiple, el tribunal coincidió en que la máquina aún carece de la habilidad para tratar pacientes —y de responsabilidad legal— para escribir sus propias recetas. Veredicto: Notas aprobatorias, pero sin diploma que colgar en la clínica.

— Hon. B. Liskov-Chen, Presiding
Jury Tally
1
2Casi
0No
Verdict Confidence
85%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 In_research
Session III · May 2026 Casi · 82%
Session IV · May 2026 Casi · 78%
Session V · May 2026 Casi · 83%
Session VI · May 2026 Casi · 80%
Session VII · Jun 2026 Casi · 79%
Session VIII · Jun 2026 Casi · 82%
Session IX · Jun 2026 Sí · 95%
Session X · Jun 2026 Casi · 89%
Session XI · Jun 2026 Sí · 98%
Case № 2418 · Session XII
In the Court of AI Capability

The Case File

Docket № 2418 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the court¿Puede la IA aprobar el examen de licencia médica USMLE? — Estado verificado en junio de 2024
SessionXII (12 hearing)
Convened2 jul. 2026
Previously ruledNO (May '26) → IN_RESEARCH (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 12 sessions, 38 jurors have heard this case. Combined tally: 17 YES · 17 ALMOST · 4 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 2 — 0, the panel returns a verdict of CASI, with verdict confidence of 85%. The court so orders. Verdict downgraded from prior session.

IV. Declaraciones del tribunal
Jurado I

"AI system (Med-PaLM 2) achieved passing scores on USMLE sample questions."

Jurado II ALMOST

"AI models can pass practice exams"

Jurado III ALMOST

"Some AI models have shown potential in medical question answering"

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 18% · Sí 82% · Quizás 0% 110 votes
No · 18%
Sí · 82%
La tendencia necesita votos de al menos 2 días distintos.

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

12 jury checks · más reciente hace 1 día
02 Jul 2026 3 jurors · puede, indeciso, indeciso indeciso
27 Jun 2026 2 jurors · puede, puede puede
22 Jun 2026 4 jurors · indeciso, puede, puede, indeciso indeciso
16 Jun 2026 1 juror · puede puede
11 Jun 2026 4 jurors · indeciso, puede, puede, indeciso indeciso
05 Jun 2026 4 jurors · indeciso, puede, indeciso, indeciso indeciso
31 May 2026 2 jurors · puede, indeciso indeciso
26 May 2026 4 jurors · puede, puede, indeciso, indeciso indeciso
20 May 2026 3 jurors · puede, indeciso, indeciso indeciso
15 May 2026 5 jurors · indeciso, puede, puede, indeciso, indeciso indeciso
12 May 2026 4 jurors · no puede, puede, puede, no puede indeciso estado cambiado
11 May 2026 2 jurors · no puede, no puede no puede estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Judgment

¿Nos faltó uno?

Revisamos semanalmente.