🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře · 🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře
Stuff AI CAN'T Do

Umí AI upravovat 3D scény podle textových instrukcí ?

Co si myslíš?

Ptá se tato otázka, zda mohou systémy umělé inteligence přímo přetvořit a změnit texturu 3D scény, když jsou jim zadány pokyny v prostém textu, aniž by došlo ke zhroucení úpravy napříč různými úhly pohledu. Zkoumá proveditelnost jedné dopředné pasáže, která zachovává prostorovou konzistenci v celém prostředí.

Background

V nedávné práci se Kaixin Zhu et al. (2026) zabývají nativním 3D editováním scén pomocí své metody VGGT-Edit, která provádí modifikace geometrie a vzhledu v jednorázovém procesu. Místo spoléhání se na multi-view difúzi nebo iterativní optimalizaci VGGT-Edit předpovídá reziduální geometrická a vzhledová pole, aby požadovanou změnu aplikovala přímo v 3D prostoru, přičemž se snaží udržet strukturální integritu invariantní při změnách pohledu. Autoři testují na ScanNet++, OmniScenes a Matterport3D, kde ukazují, že předpověď reziduálních polí překonává předchozí základní metody jak v kvalitě editace, tak v konzistenci napříč pohledy. Jejich open-source kód a dataset jsou k dispozici na https://github.com/zhuKaixhin/VGGT-Edit.


Editování textu na 3D pomocí AI pokročilo od hrubé manipulace se scénami k ovládání více objektů a atributů, kde přírodní jazyk specifikuje úpravy jako materiál, barva, umístění objektu nebo osvětlení v jediném průchodu. Difúzní 3D generativní modely nyní podporují úpravy řízené jazykem vložením textových tokenů do polí neurální radiance nebo pipeline Gaussian splattingu, což umožňuje úpravy jako „udělej pohovku červenou“ při zachování geometrické konzistence napříč pohledy. Předchozí práce se spoléhaly na úpravy na úrovni jednotlivých pohledů, které často vedly k nekonzistentním texturám nebo stínům při pohledu z nových úhlů, zatímco novější metody omezují úpravy pomocí kanonických 3D reprezentací nebo triplanárních prvků, aby zachovaly prostorovou soudržnost. Benchmarky kombinující syntetické a reálné interiérové scény ukazují zlepšené skóre zarovnání založené na CLIP a nižší geometrický posun, když jsou úpravy podmíněny jak jazykem, tak 3D strukturou. Výzkumné prototypy demonstrují interaktivní editaci scén řízenou textem za méně než 10 sekund na středně výkonných GPU, což naznačuje pokrok směrem k pracovním postupům v reálném čase. Přesto však zůstávají výzvy v řešení okultací, zachování jemné geometrie a škálování na velké scény otevřeného světa bez nutnosti per-scénového přetrénování.

— Rozšířeno 15. května 2026

Stav naposledy zkontrolován July 3, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · čvc 3, 2026
— The Question Before the Court —

Umí AI upravovat 3D scény podle textových instrukcí?

★ The Court Finds ★
Reaffirmed
Téměř

Existují omezené ukázky — ale porota nebyla jednomyslná.

Ruling of the Bench

Porota uznala, že textem řízená editace 3D scén již není pouhým fantazírováním, nicméně konsenzus kolísal nad tím, jak daleko tato technologie skutečně pokročila za křehké demonstrace. Zatímco prototypy mohou z jedné věty vyvolat tvar nebo texturu, stále zakolísají, když jsou požádány o přeuspořádání, smazání nebo logické změny složitých scén — což vede k opatrnému schválení se sklonem k „téměř hotovo“. Rozhodnutí: „Algoritmus kreslí obrázek, ale stále maže gumou.“

— Hon. B. Liskov-Chen, Presiding
Jury Tally
0Ano
2Téměř
0Ne
Verdict Confidence
80%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Téměř · 83%
Session II · May 2026 Téměř · 81%
Session III · May 2026 Téměř · 83%
Session IV · May 2026 Téměř · 77%
Session V · Jun 2026 Téměř · 77%
Session VI · Jun 2026 Téměř · 73%
Session VII · Jun 2026 Téměř · 88%
Session VIII · Jun 2026 Téměř · 90%
Session IX · Jun 2026 Téměř · 88%
Case № D2D0 · Session X
In the Court of AI Capability

The Case File

Docket № D2D0 · Session X · Vol. X
I. Particulars of the Case
Question put to the courtUmí AI upravovat 3D scény podle textových instrukcí?
SessionX (10 hearing)
Convened3 čvc 2026
Previously ruledALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 10 sessions, 29 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 0 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 2 — 0, the panel returns a verdict of TéMěř, with verdict confidence of 80%. The court so orders.

IV. Prohlášení soudců
Porotce I ALMOST

"Text-to-edit systems like LLM+3D diffusion/NeRF editors exist but lack broad reliability"

Porotce II ALMOST

"Text-to-3D models and scene editing exist"

Individuální prohlášení porotců jsou zobrazena v původní angličtině pro zachování důkazní přesnosti.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Co si myslí publikum

Ne 22% · Ano 39% · Možná 39% 23 votes
Ne · 22%
Ano · 39%
Možná · 39%
60 days of activity

Diskuze

no comments

Komentáře a obrázky procházejí kontrolou admina, než se objeví veřejně.

10 jury checks · nejnovější před 1 dnem
03 Jul 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
27 Jun 2026 2 jurors · umí, nerozhodnuto nerozhodnuto
22 Jun 2026 2 jurors · nerozhodnuto, umí nerozhodnuto
17 Jun 2026 2 jurors · umí, nerozhodnuto nerozhodnuto
11 Jun 2026 2 jurors · umí, nerozhodnuto nerozhodnuto
06 Jun 2026 3 jurors · nerozhodnuto, nerozhodnuto, umí nerozhodnuto
31 May 2026 3 jurors · umí, nerozhodnuto, nerozhodnuto nerozhodnuto
26 May 2026 5 jurors · nerozhodnuto, nerozhodnuto, umí, umí, nerozhodnuto nerozhodnuto
20 May 2026 4 jurors · umí, umí, nerozhodnuto, nerozhodnuto nerozhodnuto
15 May 2026 4 jurors · nerozhodnuto, umí, umí, nerozhodnuto nerozhodnuto

Každý řádek je samostatná kontrola poroty. Porotci jsou AI modely (identity záměrně neutrální). Stav odráží kumulativní součet všech kontrol — jak porota funguje.

Další v technology

Máte nějakou, kterou jsme přehlédli?

Přidejte tvrzení do atlasu. Kontrolujeme týdně.