🔥 Hot topics · Kan dit NIET · Kan dit · § The Court · Recente omslagen · 📈 Tijdlijn · Vraag · Redactionele stukken · 🔥 Hot topics · Kan dit NIET · Kan dit · § The Court · Recente omslagen · 📈 Tijdlijn · Vraag · Redactionele stukken
Stuff AI CAN'T Do

Kan AI 3D-scènes bewerken op basis van tekstinstructies ?

Wat denk je?

Vraagt deze vraag of kunstmatige-intelligentiesystemen een 3D-scène direct kunnen hermodelleren en hertextureren op basis van gewone tekstinstructies, zonder dat de bewerking instort over verschillende kijkhoeken heen. Het onderzoekt de haalbaarheid van een enkele feed-forward-pas die de ruimtelijke consistentie in de hele omgeving behoudt.

Background

In recent work, Kaixin Zhu et al. (2026) richten zich op native 3-D-scene editing met hun methode VGGT-Edit, die geometrie- en uiterlijkmodificaties op een feed-forward manier uitvoert. In plaats van te vertrouwen op multi-view diffusion of iteratieve optimalisatie voorspelt VGGT-Edit resterende geometrische en uiterlijkvelden om de gevraagde wijziging direct in de 3-D-ruimte toe te passen, met als doel de structurele integriteit invariant te houden onder veranderingen van standpunt. De auteurs benchmarken op ScanNet++, OmniScenes en Matterport3D en tonen aan dat voorspelling van resterende velden voorgaande baselines overtreft in zowel bewerkingsgetrouwheid als cross-view consistentie. Hun open-source code en dataset zijn beschikbaar op https://github.com/zhuKaixhin/VGGT-Edit.


AI-tekst-naar-3D-editing is voortgeschreden van grove scene-manipulatie naar controle over meerdere objecten en attributen, waarbij natuurlijke taal wijzigingen specificeert zoals materiaal, kleur, objectplaatsing of verlichting in één voorwaartse stap. Diffusiegebaseerde 3D-generatieve modellen ondersteunen nu taalgestuurde lokale bewerkingen door teksttokens in neurale stralingsvelden of Gaussian splatting-pijplijnen te injecteren, waardoor bewerkingen zoals “maak de bank rood” mogelijk worden terwijl de geometrische consistentie over standpunten behouden blijft. Eerdere werkzaamheden vertrouwden op per-view-aanpassingen die vaak inconsistente texturen of schaduwen produceerden wanneer ze vanuit nieuwe hoeken werden bekeken, terwijl nieuwere methoden bewerkingen beperken met canonieke 3D-voorstellingen of triplane-kenmerken om ruimtelijke coherentie te behouden. Benchmarks die synthetische en echte binnenruimtes combineren, tonen verbeterde CLIP-gebaseerde aligneringscores en minder geometrische drift wanneer bewerkingen worden geconditioneerd op zowel taal als 3D-structuur. Onderzoeksprototypes demonstreren interactieve tekstgestuurde scene-editing in minder dan 10 seconden op mid-tier GPU's, wat wijst op vooruitgang naar realtime-workflows. Toch blijven er uitdagingen bestaan in het oplossen van verduisteringen, het behouden van fijne geometrie en het opschalen naar grote openwereldscènes zonder per-scene hertraining.

— Verrijkt 15 mei 2026

Status voor het laatst gecontroleerd op July 3, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul. 3, 2026
— The Question Before the Court —

Kan AI 3D-scènes bewerken op basis van tekstinstructies?

★ The Court Finds ★
Reaffirmed
Bijna

Er bestaan beperkte demonstraties — maar het panel was niet unaniem.

Ruling of the Bench

De jury erkende dat tekstgestuurd bewerken van 3D-scènes niet langer pure fantasie is, maar er was verdeeldheid over hoe ver de technologie werkelijk is gevorderd voorbij fragiele demo’s. Hoewel prototypes een vorm of textuur uit een zin kunnen toveren, struikelen ze nog wanneer ze gevraagd worden om complexe scènes te herschikken, te verwijderen of logisch te wijzigen—wat leidt tot voorzichtige goedkeuring die de kant op “bijna zover” leunt. Uitspraak: “Het algoritme tekent het plaatje, maar veegt de gum nog uit.”

— Hon. B. Liskov-Chen, Presiding
Jury Tally
0Ja
2Bijna
0Nee
Verdict Confidence
80%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Bijna · 83%
Session II · May 2026 Bijna · 81%
Session III · May 2026 Bijna · 83%
Session IV · May 2026 Bijna · 77%
Session V · Jun 2026 Bijna · 77%
Session VI · Jun 2026 Bijna · 73%
Session VII · Jun 2026 Bijna · 88%
Session VIII · Jun 2026 Bijna · 90%
Session IX · Jun 2026 Bijna · 88%
Case № D2D0 · Session X
In the Court of AI Capability

The Case File

Docket № D2D0 · Session X · Vol. X
I. Particulars of the Case
Question put to the courtKan AI 3D-scènes bewerken op basis van tekstinstructies?
SessionX (10 hearing)
Convened3 jul. 2026
Previously ruledALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 10 sessions, 29 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 0 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 2 — 0, the panel returns a verdict of BIJNA, with verdict confidence of 80%. The court so orders.

IV. Verklaringen van het college
Jurylid I ALMOST

"Text-to-edit systems like LLM+3D diffusion/NeRF editors exist but lack broad reliability"

Jurylid II ALMOST

"Text-to-3D models and scene editing exist"

Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Wat het publiek denkt

Nee 22% · Ja 39% · Misschien 39% 23 votes
Nee · 22%
Ja · 39%
Misschien · 39%
60 days of activity

Discussie

no comments

Opmerkingen en afbeeldingen gaan door een beoordeling door de beheerder voordat ze publiek verschijnen.

10 jury checks · meest recent 1 dag geleden
03 Jul 2026 2 jurors · onbeslist, onbeslist onbeslist
27 Jun 2026 2 jurors · kan, onbeslist onbeslist
22 Jun 2026 2 jurors · onbeslist, kan onbeslist
17 Jun 2026 2 jurors · kan, onbeslist onbeslist
11 Jun 2026 2 jurors · kan, onbeslist onbeslist
06 Jun 2026 3 jurors · onbeslist, onbeslist, kan onbeslist
31 May 2026 3 jurors · kan, onbeslist, onbeslist onbeslist
26 May 2026 5 jurors · onbeslist, onbeslist, kan, kan, onbeslist onbeslist
20 May 2026 4 jurors · kan, kan, onbeslist, onbeslist onbeslist
15 May 2026 4 jurors · onbeslist, kan, kan, onbeslist onbeslist

Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.

Meer in technology

Hebben we er één gemist?

We review weekly.