🤖 technology · May 15, 2026 · STUFFAICANTDO.COM · Markeer dit

Kan AI 3D-scènes bewerken op basis van tekstinstructies ?

Wat denk je? Kan AI dit?

Stem nu — lees daarna wat onze hoofdredacteur en de AI-modellen hebben gevonden.

Vraagt deze vraag of kunstmatige-intelligentiesystemen een 3D-scène direct kunnen hermodelleren en hertextureren op basis van gewone tekstinstructies, zonder dat de bewerking instort over verschillende kijkhoeken heen. Het onderzoekt de haalbaarheid van een enkele feed-forward-pas die de ruimtelijke consistentie in de hele omgeving behoudt.

#3d Scene Editing

#Text To 3d

#Geometry Modification

#Structural Consistency

#Residual Field Prediction

Background

In recent work, Kaixin Zhu et al. (2026) richten zich op native 3-D-scene editing met hun methode VGGT-Edit, die geometrie- en uiterlijkmodificaties op een feed-forward manier uitvoert. In plaats van te vertrouwen op multi-view diffusion of iteratieve optimalisatie voorspelt VGGT-Edit resterende geometrische en uiterlijkvelden om de gevraagde wijziging direct in de 3-D-ruimte toe te passen, met als doel de structurele integriteit invariant te houden onder veranderingen van standpunt. De auteurs benchmarken op ScanNet++, OmniScenes en Matterport3D en tonen aan dat voorspelling van resterende velden voorgaande baselines overtreft in zowel bewerkingsgetrouwheid als cross-view consistentie. Hun open-source code en dataset zijn beschikbaar op https://github.com/zhuKaixhin/VGGT-Edit.

AI-tekst-naar-3D-editing is voortgeschreden van grove scene-manipulatie naar controle over meerdere objecten en attributen, waarbij natuurlijke taal wijzigingen specificeert zoals materiaal, kleur, objectplaatsing of verlichting in één voorwaartse stap. Diffusiegebaseerde 3D-generatieve modellen ondersteunen nu taalgestuurde lokale bewerkingen door teksttokens in neurale stralingsvelden of Gaussian splatting-pijplijnen te injecteren, waardoor bewerkingen zoals “maak de bank rood” mogelijk worden terwijl de geometrische consistentie over standpunten behouden blijft. Eerdere werkzaamheden vertrouwden op per-view-aanpassingen die vaak inconsistente texturen of schaduwen produceerden wanneer ze vanuit nieuwe hoeken werden bekeken, terwijl nieuwere methoden bewerkingen beperken met canonieke 3D-voorstellingen of triplane-kenmerken om ruimtelijke coherentie te behouden. Benchmarks die synthetische en echte binnenruimtes combineren, tonen verbeterde CLIP-gebaseerde aligneringscores en minder geometrische drift wanneer bewerkingen worden geconditioneerd op zowel taal als 3D-structuur. Onderzoeksprototypes demonstreren interactieve tekstgestuurde scene-editing in minder dan 10 seconden op mid-tier GPU's, wat wijst op vooruitgang naar realtime-workflows. Toch blijven er uitdagingen bestaan in het oplossen van verduisteringen, het behouden van fijne geometrie en het opschalen naar grote openwereldscènes zonder per-scene hertraining.

— Verrijkt 15 mei 2026

Status voor het laatst gecontroleerd op July 3, 2026.

📰

Galerie

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026

Sitting at the Bench Filed · jul. 3, 2026

— The Question Before the Court —

Kan AI 3D-scènes bewerken op basis van tekstinstructies?

★ The Court Finds ★

Reaffirmed

⚖

Bijna

Er bestaan beperkte demonstraties — maar het panel was niet unaniem.

Ruling of the Bench

De jury erkende dat tekstgestuurd bewerken van 3D-scènes niet langer pure fantasie is, maar er was verdeeldheid over hoe ver de technologie werkelijk is gevorderd voorbij fragiele demo’s. Hoewel prototypes een vorm of textuur uit een zin kunnen toveren, struikelen ze nog wanneer ze gevraagd worden om complexe scènes te herschikken, te verwijderen of logisch te wijzigen—wat leidt tot voorzichtige goedkeuring die de kant op “bijna zover” leunt. Uitspraak: “Het algoritme tekent het plaatje, maar veegt de gum nog uit.”

— Hon. B. Liskov-Chen, Presiding

Jury Tally

0Ja

2Bijna

0Nee

Verdict Confidence

80%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Bijna · 83%

Session II · May 2026 Bijna · 81%

Session III · May 2026 Bijna · 83%

Session IV · May 2026 Bijna · 77%

Session V · Jun 2026 Bijna · 77%

Session VI · Jun 2026 Bijna · 73%

Session VII · Jun 2026 Bijna · 88%

Session VIII · Jun 2026 Bijna · 90%

Session IX · Jun 2026 Bijna · 88%

Case № D2D0 · Session X

In the Court of AI Capability

The Case File

Docket № D2D0 · Session X · Vol. X

I. Particulars of the Case

Question put to the courtKan AI 3D-scènes bewerken op basis van tekstinstructies?

SessionX (10 hearing)

Convened3 jul. 2026

Previously ruledALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)

Presiding JudgeHon. B. Liskov-Chen

II. Cumulative Tally Across Sessions

Across 10 sessions, 29 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 0 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 2 — 0, the panel returns a verdict of BIJNA, with verdict confidence of 80%. The court so orders.

IV. Verklaringen van het college

Jurylid I ALMOST

"Text-to-edit systems like LLM+3D diffusion/NeRF editors exist but lack broad reliability"

Jurylid II ALMOST

"Text-to-3D models and scene editing exist"

Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.

B. Liskov-Chen

Presiding Judge

M. Lovelace

Clerk of the Court

Huidige status

BETWIST

Keerpunt

in de running

⚖ Jury ⓘ

12✓ · 0✗ · 17?

→ betwist

Wat het publiek denkt

Nee 22% · Ja 39% · Misschien 39% 23 votes

Nee · 22%

Ja · 39%

Misschien · 39%

60 days of activity

Discussie

no comments

⚖ 10 jury checks · meest recent 1 dag geleden

03 Jul 2026 2 jurors · onbeslist, onbeslist onbeslist

27 Jun 2026 2 jurors · kan, onbeslist onbeslist

22 Jun 2026 2 jurors · onbeslist, kan onbeslist

17 Jun 2026 2 jurors · kan, onbeslist onbeslist

11 Jun 2026 2 jurors · kan, onbeslist onbeslist

06 Jun 2026 3 jurors · onbeslist, onbeslist, kan onbeslist

31 May 2026 3 jurors · kan, onbeslist, onbeslist onbeslist

26 May 2026 5 jurors · onbeslist, onbeslist, kan, kan, onbeslist onbeslist

20 May 2026 4 jurors · kan, kan, onbeslist, onbeslist onbeslist

15 May 2026 4 jurors · onbeslist, kan, kan, onbeslist onbeslist

Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.

Meer in technology

Kun AI zwermen drones besturen ?

BETWIST

Kan AI luisteren naar toetsaanslagen en weten wat ik typ op mijn toetsenbord ?

BETWIST

🎲 Willekeurige selectie

Kan AI alle individuele gesprekken extraheren uit opnames van een menigte mensen ?

BETWIST · Sensory

Alles in technology → Eerder omgedraaid →

Kan AI 3D-scènes bewerken op basis van tekstinstructies ?

Stel een tag voor

Kan AI 3D-scènes bewerken op basis van tekstinstructies?

The Case File

Wat het publiek denkt

Discussie

Meer in technology

🧪 Hoe we AI-capaciteiten testen

⚠ Deze vraag mengt meer dan één ding

Waarschuw mij

Insluiten

Hebben we er één gemist?

🔎Nog in onderzoek

Stelling toevoegen