🔥 Hot topics · Kan dit NIET · Kan dit · § The Court · Recente omslagen · 📈 Tijdlijn · Vraag · Redactionele stukken · 🔥 Hot topics · Kan dit NIET · Kan dit · § The Court · Recente omslagen · 📈 Tijdlijn · Vraag · Redactionele stukken
Stuff AI CAN'T Do

Kan AI 3D-scènes bewerken op basis van tekstinstructies ?

Wat denk je?

Vraagt deze vraag of kunstmatige-intelligentiesystemen een 3D-scène direct kunnen hermodelleren en hertextureren op basis van gewone tekstinstructies, zonder dat de bewerking instort over verschillende kijkhoeken heen. Het onderzoekt de haalbaarheid van een enkele feed-forward-pas die de ruimtelijke consistentie in de hele omgeving behoudt.

Background

In recent work, Kaixin Zhu et al. (2026) richten zich op native 3-D-scene editing met hun methode VGGT-Edit, die geometrie- en uiterlijkmodificaties op een feed-forward manier uitvoert. In plaats van te vertrouwen op multi-view diffusion of iteratieve optimalisatie voorspelt VGGT-Edit resterende geometrische en uiterlijkvelden om de gevraagde wijziging direct in de 3-D-ruimte toe te passen, met als doel de structurele integriteit invariant te houden onder veranderingen van standpunt. De auteurs benchmarken op ScanNet++, OmniScenes en Matterport3D en tonen aan dat voorspelling van resterende velden voorgaande baselines overtreft in zowel bewerkingsgetrouwheid als cross-view consistentie. Hun open-source code en dataset zijn beschikbaar op https://github.com/zhuKaixhin/VGGT-Edit.


AI-tekst-naar-3D-editing is voortgeschreden van grove scene-manipulatie naar controle over meerdere objecten en attributen, waarbij natuurlijke taal wijzigingen specificeert zoals materiaal, kleur, objectplaatsing of verlichting in één voorwaartse stap. Diffusiegebaseerde 3D-generatieve modellen ondersteunen nu taalgestuurde lokale bewerkingen door teksttokens in neurale stralingsvelden of Gaussian splatting-pijplijnen te injecteren, waardoor bewerkingen zoals “maak de bank rood” mogelijk worden terwijl de geometrische consistentie over standpunten behouden blijft. Eerdere werkzaamheden vertrouwden op per-view-aanpassingen die vaak inconsistente texturen of schaduwen produceerden wanneer ze vanuit nieuwe hoeken werden bekeken, terwijl nieuwere methoden bewerkingen beperken met canonieke 3D-voorstellingen of triplane-kenmerken om ruimtelijke coherentie te behouden. Benchmarks die synthetische en echte binnenruimtes combineren, tonen verbeterde CLIP-gebaseerde aligneringscores en minder geometrische drift wanneer bewerkingen worden geconditioneerd op zowel taal als 3D-structuur. Onderzoeksprototypes demonstreren interactieve tekstgestuurde scene-editing in minder dan 10 seconden op mid-tier GPU's, wat wijst op vooruitgang naar realtime-workflows. Toch blijven er uitdagingen bestaan in het oplossen van verduisteringen, het behouden van fijne geometrie en het opschalen naar grote openwereldscènes zonder per-scene hertraining.

— Verrijkt 15 mei 2026

Status voor het laatst gecontroleerd op July 3, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul. 3, 2026
— The Question Before the Court —

Kan AI 3D-scènes bewerken op basis van tekstinstructies?

★ The Court Finds ★
Reaffirmed
Bijna

Er bestaan beperkte demonstraties — maar het panel was niet unaniem.

Ruling of the Bench

The jury acknowledged that text-guided editing of 3D scenes is no longer pure fantasy, yet consensus wavered over how far the technology has truly progressed beyond fragile demos. While prototypes can coax a shape or texture into existence from a sentence, they still stumble when asked to rearrange, delete, or logically alter complex scenes—prompting cautious approval leaning on the side of “almost there.” Ruling: “The algorithm draws the picture, but still smudges the eraser.”

— Hon. B. Liskov-Chen, Presiding
Jury Tally
0Ja
2Bijna
0Nee
Verdict Confidence
80%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Bijna · 83%
Session II · May 2026 Bijna · 81%
Session III · May 2026 Bijna · 83%
Session IV · May 2026 Bijna · 77%
Session V · Jun 2026 Bijna · 77%
Session VI · Jun 2026 Bijna · 73%
Session VII · Jun 2026 Bijna · 88%
Session VIII · Jun 2026 Bijna · 90%
Session IX · Jun 2026 Bijna · 88%
Case № D2D0 · Session X
In the Court of AI Capability

The Case File

Docket № D2D0 · Session X · Vol. X
I. Particulars of the Case
Question put to the courtKan AI 3D-scènes bewerken op basis van tekstinstructies?
SessionX (10 hearing)
Convened3 jul. 2026
Previously ruledALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 10 sessions, 29 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 0 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 2 — 0, the panel returns a verdict of BIJNA, with verdict confidence of 80%. The court so orders.

IV. Verklaringen van het college
Jurylid I ALMOST

"Text-to-edit systems like LLM+3D diffusion/NeRF editors exist but lack broad reliability"

Jurylid II ALMOST

"Text-to-3D models and scene editing exist"

Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Wat het publiek denkt

Nee 22% · Ja 39% · Misschien 39% 23 votes
Nee · 22%
Ja · 39%
Misschien · 39%
60 days of activity

Discussie

no comments

Opmerkingen en afbeeldingen gaan door een beoordeling door de beheerder voordat ze publiek verschijnen.

10 jury checks · meest recent 1 dag geleden
03 Jul 2026 2 jurors · onbeslist, onbeslist onbeslist
27 Jun 2026 2 jurors · kan, onbeslist onbeslist
22 Jun 2026 2 jurors · onbeslist, kan onbeslist
17 Jun 2026 2 jurors · kan, onbeslist onbeslist
11 Jun 2026 2 jurors · kan, onbeslist onbeslist
06 Jun 2026 3 jurors · onbeslist, onbeslist, kan onbeslist
31 May 2026 3 jurors · kan, onbeslist, onbeslist onbeslist
26 May 2026 5 jurors · onbeslist, onbeslist, kan, kan, onbeslist onbeslist
20 May 2026 4 jurors · kan, kan, onbeslist, onbeslist onbeslist
15 May 2026 4 jurors · onbeslist, kan, kan, onbeslist onbeslist

Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.

Meer in technology

Hebben we er één gemist?

We review weekly.