🤖 technology · May 15, 2026 · STUFFAICANTDO.COM · Zgłoś to

Czy AI może edytować sceny 3D na podstawie instrukcji tekstowych ?

Co o tym myślisz? Czy SI to potrafi?

Oddaj swój głos — potem przeczytaj, co znalazł nasz redaktor i modele SI.

To pytanie bada, czy systemy sztucznej inteligencji mogą bezpośrednio przekształcać i retuszować scenę 3-D na podstawie zwykłych instrukcji tekstowych, bez zniekształcania edycji przy różnych kątach widzenia. Bada możliwość wykonania pojedynczego przejścia feed-forward, które zachowuje spójność przestrzenną w całym środowisku.

#3d Scene Editing

#Text To 3d

#Geometry Modification

#Structural Consistency

#Residual Field Prediction

Background

W najnowszych pracach Kaixin Zhu i wsp. (2026) zajmują się edycją natywnych scen 3D za pomocą swojej metody VGGT-Edit, która wykonuje modyfikacje geometrii i wyglądu w sposób feed-forward. Zamiast polegać na wielowidokowej dyfuzji lub iteracyjnej optymalizacji, VGGT-Edit przewiduje resztkowe pola geometryczne i wyglądu, aby zastosować żądaną zmianę bezpośrednio w przestrzeni 3D, mając na celu utrzymanie integralności strukturalnej niezmienionej przy zmianie widoku. Autorzy przeprowadzają testy na zbiorach ScanNet++, OmniScenes i Matterport3D, pokazując, że przewidywanie resztkowych pól przewyższa wcześniejsze punkty odniesienia zarówno pod względem wierności edycji, jak i spójności między widokami. Ich otwartoźródłowy kod i zestaw danych są dostępne pod adresem https://github.com/zhuKaixhin/VGGT-Edit.

Edycja tekst-na-3D dokonała postępów od gruboziarnistej manipulacji sceny w kierunku kontroli wieloobiektowej i wieloatrybutowej, gdzie język naturalny określa edycje takie jak materiał, kolor, umiejscowienie obiektu lub oświetlenie w jednym przejściu do przodu. Modele dyfuzyjne 3D do generowania tekstu obecnie wspierają edycje lokalne prowadzone językiem poprzez wstrzykiwanie tokenów tekstowych do pól radiacyjnych neuronów lub potoków Gaussian splatting, umożliwiając edycje typu „zrób sofę czerwoną” przy zachowaniu spójności geometrycznej między widokami. Prace wcześniejsze polegały na dostosowaniach na poziomie pojedynczego widoku, które często prowadziły do niespójnych tekstur lub cieni przy oglądaniu z nowych kątów, podczas gdy nowsze metody ograniczają edycje za pomocą kanonicznych reprezentacji 3D lub cech trójpłaszczyznowych, aby zachować spójność przestrzenną. Testy, które łączą syntetyczne i rzeczywiste sceny wnętrz, pokazują poprawione wyniki dopasowania opartego na CLIP oraz mniejsze dryfowanie geometrii, gdy edycje są uwarunkowane zarówno językiem, jak i strukturą 3D. Prototypy badawcze demonstrują interaktywną edycję scen sterowaną tekstem w mniej niż 10 sekund na średniej klasy GPU, wskazując na postęp w kierunku przepływów pracy w czasie rzeczywistym. Nadal jednak istnieją wyzwania związane z rozwiązywaniem zakłóceń, zachowaniem subtelnej geometrii oraz skalowaniem do dużych scen otwartego świata bez ponownego trenowania na scenę.

— Wzbogacono 15 maja 2026

Status sprawdzony ostatnio July 8, 2026.

📰

Galeria

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026Jul 2026

Sitting at the Bench Filed · lip 8, 2026

— The Question Before the Court —

Czy AI może edytować sceny 3D na podstawie instrukcji tekstowych?

★ The Court Finds ★

▲ Upgraded from Prawie

⚖

Tak

Jury udzieliło jednoznacznie twierdzącej odpowiedzi.

Ruling of the Bench

Sztuczna inteligencja udowodniła, że może interpretować polecenia tekstowe w celu przekształcenia trójwymiarowych scen, łącząc język z geometrią z zaskakującą wiernością. Samotny ławnik uznał narzędzia za wystarczająco dokładne, aby powiedzieć tak, i nie pojawiły się żadne przeciwwypowiedzi, które mogłyby zakwestionować demonstrację. Niech werdykt rozbrzmi przez farmę renderującą: Text in, scene transformed—case closed.

— Hon. A. Turing-Brown, Presiding

Jury Tally

1Tak

0Prawie

0Nie

Verdict Confidence

95%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Prawie · 83%

Session II · May 2026 Prawie · 81%

Session III · May 2026 Prawie · 83%

Session IV · May 2026 Prawie · 77%

Session V · Jun 2026 Prawie · 77%

Session VI · Jun 2026 Prawie · 73%

Session VII · Jun 2026 Prawie · 88%

Session VIII · Jun 2026 Prawie · 90%

Session IX · Jun 2026 Prawie · 88%

Session X · Jul 2026 Prawie · 80%

Case № D2D0 · Session XI

In the Court of AI Capability

The Case File

Docket № D2D0 · Session XI · Vol. XI

I. Particulars of the Case

Question put to the courtCzy AI może edytować sceny 3D na podstawie instrukcji tekstowych?

SessionXI (11 hearing)

Convened8 lip 2026

Previously ruledALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26) → YES (Jul '26)

Presiding JudgeHon. A. Turing-Brown

II. Cumulative Tally Across Sessions

Across 11 sessions, 30 jurors have heard this case. Combined tally: 13 YES · 17 ALMOST · 0 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 0 — 0, the panel returns a verdict of TAK, with verdict confidence of 95%. The court so orders. Verdict upgraded from prior session.

IV. Oświadczenia składu sędziowskiego

Przysięgły I TAK

"Specialized AI systems like NVIDIA's Instruct-NeRF2NeRF can edit 3D scenes from text instructions."

Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.

A. Turing-Brown

Presiding Judge

M. Lovelace

Clerk of the Court

Aktualny stan

SPORNE

Punkt zwrotny

w sporze

⚖ Jury ⓘ

13✓ · 0✗ · 17?

→ sporne

Co myśli publiczność

Nie 22% · Tak 39% · Może 39% 23 votes

Nie · 22%

Tak · 39%

Może · 39%

60 days of activity

Dyskusja

no comments

⚖ 11 jury checks · najnowsze 1 dzień temu

08 Jul 2026 1 juror · potrafi potrafi

03 Jul 2026 2 jurors · nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte

27 Jun 2026 2 jurors · potrafi, nierozstrzygnięte nierozstrzygnięte

22 Jun 2026 2 jurors · nierozstrzygnięte, potrafi nierozstrzygnięte

17 Jun 2026 2 jurors · potrafi, nierozstrzygnięte nierozstrzygnięte

11 Jun 2026 2 jurors · potrafi, nierozstrzygnięte nierozstrzygnięte

06 Jun 2026 3 jurors · nierozstrzygnięte, nierozstrzygnięte, potrafi nierozstrzygnięte

31 May 2026 3 jurors · potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte

26 May 2026 5 jurors · nierozstrzygnięte, nierozstrzygnięte, potrafi, potrafi, nierozstrzygnięte nierozstrzygnięte

20 May 2026 4 jurors · potrafi, potrafi, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte

15 May 2026 4 jurors · nierozstrzygnięte, potrafi, potrafi, nierozstrzygnięte nierozstrzygnięte

Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.

Więcej w technology

Czy AI może przewidywać wybuchy pożarów na podstawie obrazów satelitarnych, wzorców pogodowych i danych historycznych ?

SPORNE

Czy AI może generować realistyczne głosy ludzkie ?

POTRAFI

🎲 Losowy wybór

Tak — AI może generować wiarygodne e-maile phishingowe spersonalizowane dla konkretnego celu. ?

POTRAFI · Creative

Wszystkie w technology → Wcześniej zmienione →

Czy AI może edytować sceny 3D na podstawie instrukcji tekstowych ?

Zaproponuj tag

Czy AI może edytować sceny 3D na podstawie instrukcji tekstowych?

The Case File

Co myśli publiczność

Dyskusja

Więcej w technology

🧪 Jak testujemy zdolności SI

⚠ To pytanie miesza więcej niż jedną rzecz

Powiadom mnie

Osadź

Masz coś, co nam umknęło?

🔎Wciąż badamy

Dodaj stwierdzenie