🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne · 🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne
Stuff AI CAN'T Do

Czy AI może edytować sceny 3D na podstawie instrukcji tekstowych ?

Co o tym myślisz?

To pytanie bada, czy systemy sztucznej inteligencji mogą bezpośrednio przekształcać i retuszować scenę 3-D na podstawie zwykłych instrukcji tekstowych, bez zniekształcania edycji przy różnych kątach widzenia. Bada możliwość wykonania pojedynczego przejścia feed-forward, które zachowuje spójność przestrzenną w całym środowisku.

Background

W najnowszych pracach Kaixin Zhu i wsp. (2026) zajmują się edycją natywnych scen 3D za pomocą swojej metody VGGT-Edit, która wykonuje modyfikacje geometrii i wyglądu w sposób feed-forward. Zamiast polegać na wielowidokowej dyfuzji lub iteracyjnej optymalizacji, VGGT-Edit przewiduje resztkowe pola geometryczne i wyglądu, aby zastosować żądaną zmianę bezpośrednio w przestrzeni 3D, mając na celu utrzymanie integralności strukturalnej niezmienionej przy zmianie widoku. Autorzy przeprowadzają testy na zbiorach ScanNet++, OmniScenes i Matterport3D, pokazując, że przewidywanie resztkowych pól przewyższa wcześniejsze punkty odniesienia zarówno pod względem wierności edycji, jak i spójności między widokami. Ich otwartoźródłowy kod i zestaw danych są dostępne pod adresem https://github.com/zhuKaixhin/VGGT-Edit.


Edycja tekst-na-3D dokonała postępów od gruboziarnistej manipulacji sceny w kierunku kontroli wieloobiektowej i wieloatrybutowej, gdzie język naturalny określa edycje takie jak materiał, kolor, umiejscowienie obiektu lub oświetlenie w jednym przejściu do przodu. Modele dyfuzyjne 3D do generowania tekstu obecnie wspierają edycje lokalne prowadzone językiem poprzez wstrzykiwanie tokenów tekstowych do pól radiacyjnych neuronów lub potoków Gaussian splatting, umożliwiając edycje typu „zrób sofę czerwoną” przy zachowaniu spójności geometrycznej między widokami. Prace wcześniejsze polegały na dostosowaniach na poziomie pojedynczego widoku, które często prowadziły do niespójnych tekstur lub cieni przy oglądaniu z nowych kątów, podczas gdy nowsze metody ograniczają edycje za pomocą kanonicznych reprezentacji 3D lub cech trójpłaszczyznowych, aby zachować spójność przestrzenną. Testy, które łączą syntetyczne i rzeczywiste sceny wnętrz, pokazują poprawione wyniki dopasowania opartego na CLIP oraz mniejsze dryfowanie geometrii, gdy edycje są uwarunkowane zarówno językiem, jak i strukturą 3D. Prototypy badawcze demonstrują interaktywną edycję scen sterowaną tekstem w mniej niż 10 sekund na średniej klasy GPU, wskazując na postęp w kierunku przepływów pracy w czasie rzeczywistym. Nadal jednak istnieją wyzwania związane z rozwiązywaniem zakłóceń, zachowaniem subtelnej geometrii oraz skalowaniem do dużych scen otwartego świata bez ponownego trenowania na scenę.

— Wzbogacono 15 maja 2026

Status sprawdzony ostatnio May 20, 2026.

📰

Galeria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026
Sitting at the Bench Filed · maj 20, 2026
— The Question Before the Court —

Czy AI może edytować sceny 3D na podstawie instrukcji tekstowych?

★ The Court Finds ★
Reaffirmed
Prawie

Istnieją wąskie dema — ale skład nie był jednomyślny.

Ruling of the Bench

Ława przysięgłych zgodziła się, że technologia istnieje w stadium embrionalnym – niektóre wprawne ręce uznały, że już się narodziła, inne nazwały ją świeżo opuszczoną z laboratorium i jeszcze nie całkiem suchą za uszami. Tam, gdzie czterech rozdzielało się między „tak” a „prawie”, różnica sprowadzała się głównie do tolerancji na usterki i niedokończone demonstracje. Skoro nie było sprzeciwów w negatywnym sensie, sąd uznaje, że sztuka jest w stadium powstawania, ale jednak żywa. Orzeczenie: „Scenę można dziś edytować tekstowo, choć kamerze wciąż potrzeba dorosłego.”

— Hon. D. Knuth-Hale, Presiding
Jury Tally
2Tak
2Prawie
0Nie
Verdict Confidence
81%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Prawie · 83%
Case № D2D0 · Session II
In the Court of AI Capability

The Case File

Docket № D2D0 · Session II · Vol. II
I. Particulars of the Case
Question put to the courtCzy AI może edytować sceny 3D na podstawie instrukcji tekstowych?
SessionII (2 hearing)
Convened20 maj 2026
Previously ruledALMOST (May '26) → ALMOST (May '26)
Presiding JudgeHon. D. Knuth-Hale
II. Cumulative Tally Across Sessions

Across 2 sessions, 8 jurors have heard this case. Combined tally: 4 YES · 4 ALMOST · 0 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 2 — 2 — 0, the panel returns a verdict of PRAWIE, with verdict confidence of 81%. The court so orders.

IV. Oświadczenia składu sędziowskiego
Przysięgły I TAK

"Text-to-3D scene editing is demonstrated by systems like Instruct-Nerf2Nerf and similar diffusion-based pipelines."

Przysięgły II TAK

"AI systems like Point-E and LEO can generate and edit 3D scenes from text prompts with reasonable fidelity."

Przysięgły III ALMOST

"Text-to-3D models and scene editing exist"

Przysięgły IV ALMOST

"Text-to-3D models and scene editing demos exist"

Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.

D. Knuth-Hale
Presiding Judge
M. Lovelace
Clerk of the Court

Co myśli publiczność

Nie 33% · Tak 25% · Może 42% 12 votes
Nie · 33%
Tak · 25%
Może · 42%
41 days of activity

Dyskusja

no comments

Komentarze i obrazy przechodzą przez weryfikację admina zanim pojawią się publicznie.

2 jury checks · najnowsze 4 dni temu
20 May 2026 4 jurors · potrafi, potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
15 May 2026 4 jurors · nierozstrzygnięte, potrafi, potrafi, nierozstrzygnięte nierozstrzygnięte

Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.

Więcej w technology

Masz coś, co nam umknęło?

Dodaj stwierdzenie do atlasu. Sprawdzamy co tydzień.