🤖 technology · May 15, 2026 · STUFFAICANTDO.COM · Nahlásit

Umí AI upravovat 3D scény podle textových instrukcí ?

Co si myslíš? Umí to AI?

Hlasujte — pak si přečtěte, co zjistil náš editor a AI modely.

Ptá se tato otázka, zda mohou systémy umělé inteligence přímo přetvořit a změnit texturu 3D scény, když jsou jim zadány pokyny v prostém textu, aniž by došlo ke zhroucení úpravy napříč různými úhly pohledu. Zkoumá proveditelnost jedné dopředné pasáže, která zachovává prostorovou konzistenci v celém prostředí.

#3d Scene Editing

#Text To 3d

#Geometry Modification

#Structural Consistency

#Residual Field Prediction

Background

V nedávné práci se Kaixin Zhu et al. (2026) zabývají nativním 3D editováním scén pomocí své metody VGGT-Edit, která provádí modifikace geometrie a vzhledu v jednorázovém procesu. Místo spoléhání se na multi-view difúzi nebo iterativní optimalizaci VGGT-Edit předpovídá reziduální geometrická a vzhledová pole, aby požadovanou změnu aplikovala přímo v 3D prostoru, přičemž se snaží udržet strukturální integritu invariantní při změnách pohledu. Autoři testují na ScanNet++, OmniScenes a Matterport3D, kde ukazují, že předpověď reziduálních polí překonává předchozí základní metody jak v kvalitě editace, tak v konzistenci napříč pohledy. Jejich open-source kód a dataset jsou k dispozici na https://github.com/zhuKaixhin/VGGT-Edit.

Editování textu na 3D pomocí AI pokročilo od hrubé manipulace se scénami k ovládání více objektů a atributů, kde přírodní jazyk specifikuje úpravy jako materiál, barva, umístění objektu nebo osvětlení v jediném průchodu. Difúzní 3D generativní modely nyní podporují úpravy řízené jazykem vložením textových tokenů do polí neurální radiance nebo pipeline Gaussian splattingu, což umožňuje úpravy jako „udělej pohovku červenou“ při zachování geometrické konzistence napříč pohledy. Předchozí práce se spoléhaly na úpravy na úrovni jednotlivých pohledů, které často vedly k nekonzistentním texturám nebo stínům při pohledu z nových úhlů, zatímco novější metody omezují úpravy pomocí kanonických 3D reprezentací nebo triplanárních prvků, aby zachovaly prostorovou soudržnost. Benchmarky kombinující syntetické a reálné interiérové scény ukazují zlepšené skóre zarovnání založené na CLIP a nižší geometrický posun, když jsou úpravy podmíněny jak jazykem, tak 3D strukturou. Výzkumné prototypy demonstrují interaktivní editaci scén řízenou textem za méně než 10 sekund na středně výkonných GPU, což naznačuje pokrok směrem k pracovním postupům v reálném čase. Přesto však zůstávají výzvy v řešení okultací, zachování jemné geometrie a škálování na velké scény otevřeného světa bez nutnosti per-scénového přetrénování.

— Rozšířeno 15. května 2026

Stav naposledy zkontrolován July 3, 2026.

📰

Galerie

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026

Sitting at the Bench Filed · čvc 3, 2026

— The Question Before the Court —

Umí AI upravovat 3D scény podle textových instrukcí?

★ The Court Finds ★

Reaffirmed

⚖

Téměř

Existují omezené ukázky — ale porota nebyla jednomyslná.

Ruling of the Bench

Porota uznala, že textem řízená editace 3D scén již není pouhým fantazírováním, nicméně konsenzus kolísal nad tím, jak daleko tato technologie skutečně pokročila za křehké demonstrace. Zatímco prototypy mohou z jedné věty vyvolat tvar nebo texturu, stále zakolísají, když jsou požádány o přeuspořádání, smazání nebo logické změny složitých scén — což vede k opatrnému schválení se sklonem k „téměř hotovo“. Rozhodnutí: „Algoritmus kreslí obrázek, ale stále maže gumou.“

— Hon. B. Liskov-Chen, Presiding

Jury Tally

0Ano

2Téměř

0Ne

Verdict Confidence

80%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Téměř · 83%

Session II · May 2026 Téměř · 81%

Session III · May 2026 Téměř · 83%

Session IV · May 2026 Téměř · 77%

Session V · Jun 2026 Téměř · 77%

Session VI · Jun 2026 Téměř · 73%

Session VII · Jun 2026 Téměř · 88%

Session VIII · Jun 2026 Téměř · 90%

Session IX · Jun 2026 Téměř · 88%

Case № D2D0 · Session X

In the Court of AI Capability

The Case File

Docket № D2D0 · Session X · Vol. X

I. Particulars of the Case

Question put to the courtUmí AI upravovat 3D scény podle textových instrukcí?

SessionX (10 hearing)

Convened3 čvc 2026

Previously ruledALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)

Presiding JudgeHon. B. Liskov-Chen

II. Cumulative Tally Across Sessions

Across 10 sessions, 29 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 0 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 2 — 0, the panel returns a verdict of TéMěř, with verdict confidence of 80%. The court so orders.

IV. Prohlášení soudců

Porotce I ALMOST

"Text-to-edit systems like LLM+3D diffusion/NeRF editors exist but lack broad reliability"

Porotce II ALMOST

"Text-to-3D models and scene editing exist"

Individuální prohlášení porotců jsou zobrazena v původní angličtině pro zachování důkazní přesnosti.

B. Liskov-Chen

Presiding Judge

M. Lovelace

Clerk of the Court

Aktuální stav

SPORNÉ

Bod zlomu

ve sporu

⚖ Porota ⓘ

12✓ · 0✗ · 17?

→ sporné

Co si myslí publikum

Ne 22% · Ano 39% · Možná 39% 23 votes

Ne · 22%

Ano · 39%

Možná · 39%

60 days of activity

Diskuze

no comments

⚖ 10 jury checks · nejnovější před 1 dnem

03 Jul 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto

27 Jun 2026 2 jurors · umí, nerozhodnuto nerozhodnuto

22 Jun 2026 2 jurors · nerozhodnuto, umí nerozhodnuto

17 Jun 2026 2 jurors · umí, nerozhodnuto nerozhodnuto

11 Jun 2026 2 jurors · umí, nerozhodnuto nerozhodnuto

06 Jun 2026 3 jurors · nerozhodnuto, nerozhodnuto, umí nerozhodnuto

31 May 2026 3 jurors · umí, nerozhodnuto, nerozhodnuto nerozhodnuto

26 May 2026 5 jurors · nerozhodnuto, nerozhodnuto, umí, umí, nerozhodnuto nerozhodnuto

20 May 2026 4 jurors · umí, umí, nerozhodnuto, nerozhodnuto nerozhodnuto

15 May 2026 4 jurors · nerozhodnuto, umí, umí, nerozhodnuto nerozhodnuto

Každý řádek je samostatná kontrola poroty. Porotci jsou AI modely (identity záměrně neutrální). Stav odráží kumulativní součet všech kontrol — jak porota funguje.

Další v technology

Může AI předpovídat a předcházet lidské technologické senescenci ?

SPORNÉ

Může AI překládat staré jazyky ?

SPORNÉ

🎲 Náhodný výběr

Může umělá inteligence vynalézt nový druh bakterií, který produkuje záchranný lék ?

SPORNÉ · biology

Vše v technology → Dříve překlopeno →

Umí AI upravovat 3D scény podle textových instrukcí ?

Navrhnout štítek

Umí AI upravovat 3D scény podle textových instrukcí?

The Case File

Co si myslí publikum

Diskuze

Další v technology

🧪 Jak testujeme schopnosti AI

⚠ Tato otázka míchá více než jednu věc

Upozornit mě

Vložit

Máte nějakou, kterou jsme přehlédli?

🔎Stále se zkoumá

Přidat tvrzení