Stuff AI CAN'T Do

¿Puede la IA escribir código funcional en 50+ lenguajes de programación a partir de indicaciones en lenguaje natural ?

¿Qué opinas?

GitHub Copilot, impulsado por OpenAI Codex, cruzó la línea en la que la mayoría de las solicitudes de extracción tenían líneas sugeridas por IA en ellas. La ingeniería de software cambió de forma.

Background

Generative coding tools have advanced dramatically since GitHub Copilot, driven by large language models trained on broad code repositories. Early systems focused on popular languages (Python, Java, C++, JavaScript), but later models expanded coverage to dozens of languages by ingesting larger, more diverse datasets. By mid-2025, state-of-the-art systems could emit syntactically correct snippets in over a hundred languages, yet consistently producing fully working implementations from natural-language prompts—especially in niche or esoteric languages—remains an open research challenge. Benchmarks like HumanEval-X and MBPP-X now include multi-language tests with 164 languages, revealing gaps in correctness and edge-case handling. As of May 2026, continuous fine-tuning and retrieval-augmented generation (RAG) are being used to improve accuracy. GitHub Copilot’s widespread adoption underscores the shift toward AI-assisted software engineering, but the leap to reliable generation across 50+ languages still demands careful model selection, prompt engineering, and post-generation validation.

Estado verificado por última vez en June 28, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · jun. 28, 2026
— The Question Before the Court —

¿Puede la IA escribir código funcional en 50+ lenguajes de programación a partir de indicaciones en lenguaje natural?

★ The Court Finds ★
▼ Downgraded from Sí
Casi

Existen demostraciones limitadas — pero el panel no fue unánime.

Ruling of the Bench

After lively deliberation, the jury found the status of today’s AI to be tantalizingly close to “Yes,” yet still shy of full marks: the models can whisper snippets in dozens of dialects, but cannot yet deliver a sonnet in every tongue without the occasional grammatical stumble. The lone “Yes” juror pointed to everyday tools that pop out cross-language code like popcorn, while the “Almost” voters insisted those outputs still read like a tourist’s phrasebook—helpful, but not quite fluent. Ruling: “It’s fluent enough to book a room, but not yet to host the party.”

— Hon. J. von Neumann III, Presiding
Jury Tally
1
2Casi
0No
Verdict Confidence
87%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 In_research
Session II · May 2026
Session III · May 2026 Casi · 83%
Session IV · May 2026 Sí · 83%
Session V · May 2026 Casi · 79%
Session VI · Jun 2026 Casi · 78%
Session VII · Jun 2026 Casi · 77%
Session VIII · Jun 2026 Casi · 77%
Session IX · Jun 2026 Sí · 93%
Session X · Jun 2026 Sí · 90%
Case № D64A · Session XI
In the Court of AI Capability

The Case File

Docket № D64A · Session XI · Vol. XI
I. Particulars of the Case
Question put to the court¿Puede la IA escribir código funcional en 50+ lenguajes de programación a partir de indicaciones en lenguaje natural?
SessionXI (11 hearing)
Convened28 jun. 2026
Previously ruledIN_RESEARCH (May '26) → YES (May '26) → ALMOST (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → YES (Jun '26) → ALMOST (Jun '26)
Presiding JudgeHon. J. von Neumann III
II. Cumulative Tally Across Sessions

Across 11 sessions, 30 jurors have heard this case. Combined tally: 17 YES · 12 ALMOST · 1 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 2 — 0, the panel returns a verdict of CASI, with verdict confidence of 87%. The court so orders. Verdict downgraded from prior session.

IV. Declaraciones del tribunal
Jurado I ALMOST

"Multilingual code generation exists"

Jurado II

"GitHub Copilot, Cursor, and Codeium generate multilingual code snippets routinely."

Jurado III ALMOST

"Code generation models exist"

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

J. von Neumann III
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 4% · Sí 83% · Quizás 13% 48 votes
Sí · 83%
Quizás · 13%
15 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

11 jury checks · más reciente hace 11 horas
28 Jun 2026 3 jurors · indeciso, puede, indeciso indeciso
22 Jun 2026 3 jurors · puede, puede, indeciso indeciso
17 Jun 2026 2 jurors · puede, puede puede
12 Jun 2026 2 jurors · puede, indeciso indeciso
06 Jun 2026 2 jurors · puede, indeciso indeciso
01 Jun 2026 3 jurors · puede, indeciso, indeciso indeciso
26 May 2026 3 jurors · indeciso, puede, indeciso indeciso
21 May 2026 3 jurors · puede, puede, indeciso indeciso
15 May 2026 4 jurors · indeciso, puede, puede, indeciso indeciso estado cambiado
12 May 2026 3 jurors · puede, puede, puede puede estado cambiado
11 May 2026 2 jurors · puede, no puede indeciso estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Creative

¿Nos faltó uno?

Revisamos semanalmente.