Naudodama „WorldGen“ sistemą „Meta“ perkelia generatyvaus AI naudojimą 3D pasauliams nuo statinių vaizdų kūrimo prie visiškai interaktyvių išteklių.
Pagrindinė kliūtis kuriant įtraukiančių erdvinio skaičiavimo patirtį – tiek vartotojų žaidimams, tiek pramoniniams skaitmeniniams dvyniams, tiek darbuotojų mokymo modeliavimui – jau seniai buvo daug darbo reikalaujantis 3D modeliavimas. Norint sukurti interaktyvią aplinką, paprastai reikia specializuotų menininkų komandų, dirbančių kelias savaites.
Remiantis nauja technine „Meta’s Reality Labs“ ataskaita, „WorldGen“ gali sukurti perkeliamus ir interaktyvius 3D pasaulius iš vieno teksto raginimo maždaug per penkias minutes.
Nors technologija šiuo metu yra mokslinio tyrimo lygio, WorldGen architektūra sprendžia konkrečius skausmo taškus, dėl kurių generatyvinis AI nebuvo naudingas profesionaliose darbo eigose: funkcinis interaktyvumas, variklio suderinamumas ir redakcinė kontrolė.
Generatyvios AI aplinkos tampa tikrai interaktyviais 3D pasauliais
Pagrindinis daugelio esamų teksto į 3D modelių trūkumas yra tas, kad jie teikia pirmenybę vaizdiniam tikslumui, o ne funkcijai. Taikant tokius metodus kaip Gauso taškymas sukuria fotorealistines scenas, kurios vaizdo įraše atrodo įspūdingai, tačiau dažnai neturi pagrindinės fizinės struktūros, reikalingos vartotojui sąveikauti su aplinka. Ištekliai, kuriems trūksta susidūrimo duomenų arba rampos fizikos, turi mažai arba visai nenaudingi modeliavimui ar žaidimams.
„WorldGen“ nukrypsta nuo šio kelio, pirmenybę teikdama „pereinamumui“. Sistema kartu su vizualine geometrija generuoja navigacinį tinklelį (navmesh) – supaprastintą daugiakampį tinklelį, kuris apibrėžia vaikščiojamus paviršius. Taip užtikrinama, kad toks greitas kaip „viduramžių kaimas“ sukurtų ne tik namų kolekciją, bet ir erdviškai nuoseklų išdėstymą, kai gatvėse nėra kliūčių ir pasiekiamos atviros erdvės.
Įmonėms šis skirtumas yra gyvybiškai svarbus. Skaitmeniniam gamyklos aukšto dvyniui arba pavojingos aplinkos saugos mokymo modeliavimui reikalingi galiojantys fizikos ir navigacijos duomenys.
„Meta“ metodas užtikrina, kad išvestis būtų „paruošta žaidimo varikliui“, o tai reiškia, kad išteklius galima eksportuoti tiesiai į standartines platformas, tokias kaip „Unity“ arba „Unreal Engine“. Šis suderinamumas leidžia techninėms komandoms integruoti generuojamąsias darbo eigas į esamus vamzdynus, nereikalaujant specializuotos atvaizdavimo įrangos, kurios dažnai reikia kitiems metodams, pvz., spinduliavimo laukams.
„WorldGen“ keturių pakopų gamybos linija
„Meta“ mokslininkai sukūrė „WorldGen“ kaip modulinį AI dujotiekį, atspindintį tradicines kūrimo darbo eigas kuriant 3D pasaulius.
Procesas prasideda nuo scenos planavimo. LLM veikia kaip konstrukcijų inžinierius, analizuojantis vartotojo teksto raginimą, kad sukurtų loginį išdėstymą. Jis nustato pagrindinių struktūrų ir reljefo ypatybių išdėstymą, sukuriant „blokavimą“ – grubų 3D eskizą, kuris garantuoja, kad scena yra fiziškai prasminga.
Vėlesnė „scenos rekonstrukcijos“ fazė sukuria pradinę geometriją. Sistema nustato generavimą ant naviko tinklelio, užtikrindama, kad dirbtinis intelektas „haliucinuotų“ detales, netyčia neįstatytų riedulio į durų angą arba neužblokuotų gaisro išėjimo kelio.
„Scenos išskaidymas“, trečiasis etapas, bene labiausiai susijęs su veikimo lankstumu. Sistema naudoja metodą, vadinamą AutoPartGen, kad identifikuotų ir atskirtų atskirus objektus scenoje – atskirtų medį nuo žemės arba dėžę nuo sandėlio grindų.
Daugelyje „vieno kadro“ generatyvinių modelių scena yra vienas sujungtas geometrijos gabalas. Atskirdama komponentus, „WorldGen“ leidžia redaktoriams perkelti, ištrinti arba modifikuoti tam tikrus išteklius po generavimo nepažeidžiant viso pasaulio.
Paskutiniame etape „scenos tobulinimas“ nušlifuoja išteklius. Sistema sukuria didelės raiškos tekstūras ir patobulina atskirų objektų geometriją, kad būtų užtikrinta, jog vaizdo kokybė išliks arti.
Operacinis realizmas naudojant generatyvųjį AI kuriant 3D pasaulius
Norint įdiegti tokią technologiją, reikia įvertinti esamą infrastruktūrą. „WorldGen“ išėjimai yra standartiniai tekstūruoti tinkleliai. Šis pasirinkimas leidžia išvengti pardavėjo užrakinimo, susijusio su patentuotais atvaizdavimo būdais. Tai reiškia, kad logistikos įmonė, kurianti VR mokymo modulį, teoriškai galėtų naudoti šį įrankį, kad greitai sukurtų maketų prototipus, o paskui perduotų juos tobulinti žmonėms kūrėjams.
Visiškai tekstūruotos, navigacinės scenos sukūrimas užtrunka maždaug penkias minutes naudojant pakankamai aparatūros. Studijoms ar skyriams, įpratusiems prie kelių dienų pagrindinio aplinkos blokavimo darbo laiko, šis efektyvumo padidėjimas tiesiogine prasme keičia pasaulį.
Tačiau technologija turi apribojimų. Dabartinė iteracija priklauso nuo vieno nuorodos rodinio generavimo, o tai riboja pasaulių, kuriuos ji gali sukurti, mastą. Jis dar negali sukurti didžiulių atvirų pasaulių, besidriekiančių kilometrus, nesujungdamas kelių regionų, o tai gali sukelti vizualinių neatitikimų.
Be to, sistema šiuo metu vaizduoja kiekvieną objektą atskirai, nenaudojant pakartotinio naudojimo, o tai gali sukelti atminties neveiksmingumą labai didelėse scenose, palyginti su rankomis optimizuotu turtu, kai vienas kėdės modelis kartojamas penkiasdešimt kartų. Būsimomis iteracijomis siekiama spręsti didesnius pasaulio dydžius ir mažesnę delsą.
„WorldGen“ palyginimas su kitomis naujomis technologijomis
Įvertinus šį metodą, palyginti su kitomis naujomis DI technologijomis kuriant 3D pasaulius, gaunamas aiškumas. „World Labs“, konkurentas šioje erdvėje, naudoja sistemą, vadinamą „Marble“, kuri naudoja Gauso žymes, kad pasiektų aukštą fotorealizmą. Nors vizualiai įspūdingos, šių dėmių pagrindu sukurtų scenų kokybė dažnai pablogėja, kai fotoaparatas nutolsta nuo centro, o tikslumas gali sumažėti vos 3–5 metrus nuo žiūrėjimo taško.
„Meta“ pasirinkimas išvesti tinklelio geometriją suteikia „WorldGen“ kaip funkcinių programų kūrimo įrankį, o ne tik vaizdinio turinio kūrimą. Jis palaiko fiziką, susidūrimus ir navigaciją iš esmės – funkcijas, dėl kurių negalima kalbėti apie interaktyvią programinę įrangą. Todėl „WorldGen“ gali sukurti 50 × 50 metrų scenas, kurios išlaiko geometrinį vientisumą.
Technologijų ir kūrybinių sektorių lyderiams tokios sistemos kaip WorldGen atneša naujų įdomių galimybių. Organizacijos turėtų patikrinti savo dabartines 3D darbo eigas, kad nustatytų, kur „blokavimas“ ir prototipų kūrimas sunaudoja daugiausiai išteklių. Čia geriausia naudoti generavimo įrankius, kad būtų paspartintas iteracija, o ne bandant nedelsiant pakeisti galutinės kokybės produkciją.
Tuo pačiu metu techniniai menininkai ir lygių dizaineriai turės pereiti nuo kiekvienos viršūnės įdėjimo rankiniu būdu prie AI išvesties raginimo ir kuravimo. Mokymo programos turėtų sutelkti dėmesį į „sparčią erdvinio išdėstymo inžineriją“ ir DI sukurtų išteklių redagavimą 3D pasauliams. Galiausiai, nors išvestis yra standartinė, generavimo procesui reikia daug skaičiavimų. Norint priimti, reikės įvertinti vietines ir debesies atvaizdavimo galimybes.
Generatyvusis 3D geriausiai veikia kaip jėgos daugiklis struktūriniam išdėstymui ir išteklių populiacijai, o ne kaip visiškas žmogaus kūrybiškumo pakaitalas. Automatizuodami pagrindinius pasaulio kūrimo darbus, įmonių komandos gali sutelkti savo biudžetus į sąveiką ir logiką, kuri skatina verslo vertę.
Taip pat žiūrėkite: Kaip Karališkasis laivynas naudoja dirbtinį intelektą, kad sumažintų įdarbinimo darbo krūvį

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais, įskaitant „Cyber Security Expo“. Norėdami gauti daugiau informacijos, spustelėkite čia.
AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.