Badania AI
Badania AI · 4 min czytania · 13 listopada 2025

Marble od World Labs – generuj światy 3D z tekstu i obrazów

Grafika ilustrująca: Marble od World Labs – generuj światy 3D z tekstu i obrazów

Źródło: Link

Darmowy webinar — AI od zera

90 minut praktyki na żywo. Pokazuję krok po kroku, jak zacząć z AI bez kodowania.

Zapisz się →

Powiązane tematy

World Labs właśnie udostępniło publicznie Marble – model AI, który generuje kompletne światy 3D na podstawie tekstu, obrazów, wideo lub prostych szkiców przestrzennych. Żadnych kolejek oczekujących. Żadnych zamkniętych beta testów. Po prostu wchodzisz i tworzysz.

Za projektem stoi Fei-Fei Li – badaczka, która przez lata kształtowała rozwój computer vision w Stanford. World Labs założyła w 2024 roku, a teraz jej zespół pokazuje, że generatywne AI to nie tylko płaskie obrazy czy filmy. To pełnoprawne trójwymiarowe środowiska, które możesz eksplorować.

Marble reprezentuje nowe podejście do generowania treści przestrzennych. Podczas gdy dotychczasowe narzędzia AI koncentrowały się głównie na tworzeniu statycznych obrazów 2D lub krótkich sekwencji wideo, ten model buduje kompletne, nawigowalne przestrzenie z zachowaniem fizycznych relacji między obiektami. To różnica między oglądaniem zdjęcia pokoju a możliwością wirtualnego przejścia się po nim.

Jak stworzyć świat 3D? Masz cztery opcje

Marble przyjmuje cztery różne typy danych wejściowych. Możesz wpisać opis tekstowy – model wygeneruje odpowiadające mu środowisko przestrzenne. Wystarczy zdanie w stylu "przytulna kawiarnia z ceglanymi ścianami i dużymi oknami" i system zbuduje trójwymiarową scenę z odpowiednią architekturą, oświetleniem i rozmieszczeniem elementów.

Możesz też wrzucić zdjęcie. System zinterpretuje perspektywę, głębię i zbuduje na tej podstawie trójwymiarową scenę. To szczególnie przydatne, gdy masz konkretną referencję wizualną – na przykład fotografię wnętrza, które chcesz odtworzyć w 3D, ale z możliwością modyfikacji i eksploracji z różnych kątów.

Trzecia opcja to wideo. Marble analizuje ruch kamery i obiekty w kadrze, by stworzyć spójny świat 3D z zachowaniem proporcji i relacji przestrzennych. Model śledzi, jak zmienia się perspektywa podczas ruchu kamery i na tej podstawie rekonstruuje pełną geometrię sceny – nie tylko to, co widać w kadrze, ale także logiczne rozszerzenia przestrzeni.

Czwarta możliwość? Praca na podstawie surowych layoutów 3D – prostych szkiców geometrycznych, które model wypełnia szczegółami i teksturami. To opcja dla osób, które mają jasną wizję przestrzenną, ale nie chcą spędzać godzin na ręcznym modelowaniu każdego elementu.

Dlaczego multimodalność ma znaczenie

Większość modeli generatywnych 3D działa na jednym typie danych – albo tekst, albo obraz. Marble łączy wszystkie cztery źródła w jednym systemie, co znacznie zwiększa elastyczność. Możesz zacząć od tekstu, dodać zdjęcie referencyjne, a potem doprecyzować layout przestrzenny – wszystko w ramach jednego workflow.

Ta elastyczność przekłada się na praktyczne korzyści. Zamiast być ograniczonym do jednej metody pracy, możesz dostosować proces do konkretnego projektu. Czasem najszybciej jest opisać scenę słowami. Innym razem masz już gotowe zdjęcie, które chcesz przekształcić w przestrzeń 3D. Marble pozwala łączyć te podejścia w sposób płynny.

Model wytrenowano na rozległych zbiorach danych wizualnych i przestrzennych. World Labs nie ujawniło dokładnej architektury, ale podkreśla kluczową rzecz: Marble rozumie fizyczne relacje między obiektami. Nie tylko generuje tekstury – zachowuje też spójność geometryczną sceny. Oznacza to, że stoły mają odpowiednią wysokość względem krzeseł, drzwi mieszczą się w framugach, a perspektywa pozostaje spójna niezależnie od punktu widzenia.

System radzi sobie również z oświetleniem i cieniami w sposób fizycznie wiarygodny. Światło odbija się od powierzchni zgodnie z ich właściwościami materiałowymi, a cienie padają we właściwych kierunkach. To detale, które sprawiają, że wygenerowane środowiska wyglądają przekonująco, a nie jak sztuczne kompozycje.

Dostęp bez barier wejściowych

Marble jest dostępne przez interfejs webowy World Labs bez konieczności dołączania do listy oczekujących. To istotna różnica wobec większości narzędzi 3D AI, które działają w zamkniętych beta testach lub wymagają zaproszeń. Decyzja o publicznym uruchomieniu od razu pokazuje pewność zespołu co do stabilności systemu.

Interfejs zaprojektowano z myślą o prostocie. Nie musisz znać się na technicznej stronie modelowania 3D, żeby zacząć tworzyć. Wpisujesz prompt lub wrzucasz plik, a system zajmuje się resztą. Wygenerowane środowiska możesz następnie eksplorować w czasie rzeczywistym, zmieniając kąt kamery i sprawdzając scenę z różnych perspektyw.

Praktyczne zastosowania? Projektanci gier mogą szybko prototypować lokacje. Zamiast spędzać tygodnie na modelowaniu każdego pomieszczenia, tworzą bazowe wersje w minuty, a potem dopracowują szczegóły. Architekci wizualizują koncepcje przestrzenne z minimalnym nakładem pracy – klient może zobaczyć projekt w 3D jeszcze przed rozpoczęciem szczegółowego projektowania.

Twórcy treści VR zyskują narzędzie do budowania immersyjnych środowisk bez specjalistycznej wiedzy z zakresu modelowania 3D. Edukatorzy mogą tworzyć interaktywne przestrzenie do nauki – od rekonstrukcji historycznych miejsc po wizualizacje koncepcji naukowych. Możliwości są szerokie, a bariera wejścia niska.

World Labs nie podało jeszcze szczegółów dotyczących komercyjnego wykorzystania generowanych modeli ani planów monetyzacji platformy. Na razie stawiają na otwarty dostęp i zbieranie feedbacku od użytkowników. To strategia, która pozwala szybko identyfikować problemy i rozumieć, jak ludzie faktycznie używają narzędzia w praktyce.

Źródła

Informacje o artykule

Podoba Ci się ten artykuł?

Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!

Ten temat omawiam szerzej na webinarze

90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.

Zapisz sie na webinar
Udostępnij:
Jan Gajos

Ekspert AI & Founder, AI Evolution

Pasjonat sztucznej inteligencji, który od ponad 15 lat działa z sukcesem biznesowo i szkoleniowo. Wprowadzam AI do swoich firm oraz codziennego życia. Fascynują mnie nowe technologie, gry wideo i składanie klocków Lego – tam też widzę logikę i kreatywność, które AI potrafi wzmacniać. Wierzę, że dobrze użyta sztuczna inteligencja to nie ogłupiające ułatwienie, lecz prawdziwy przełom w sposobie, w jaki myślimy, tworzymy i pracujemy.