Fizinio AI kūrimas naudojant virtualius modeliavimo duomenis


Virtualūs modeliavimo duomenys skatina fizinio AI plėtojimą įvairiose įmonėse, vadovaujant tokioms iniciatyvoms kaip Ai2 MolmoBot.

Nurodymas aparatinei įrangai sąveikauti su realiu pasauliu istoriškai priklausė nuo labai brangių ir rankiniu būdu surinktų demonstracijų. Technologijų tiekėjai, kuriantys bendruosius manipuliavimo agentus, paprastai rengia platų realaus pasaulio mokymą kaip šių sistemų pagrindą.

Tam tikromis aplinkybėmis tokie projektai kaip DROID apima 76 000 nuotoliniu būdu valdomų trajektorijų, surinktų 13 institucijų, o tai reiškia maždaug 350 valandų žmogaus pastangų. „Google DeepMind“ RT-1 prireikė 130 000 epizodų, kuriuos per 17 mėnesių surinko žmonės. Ši priklausomybė nuo patentuotų, rankiniu būdu renkamų duomenų padidina mokslinių tyrimų biudžetus ir sutelkia pajėgumus nedidelėje gerai išteklius turinčių pramonės laboratorijų grupėje.

„Mūsų misija yra sukurti dirbtinį intelektą, kuris skatintų mokslą ir išplėstų tai, ką žmonija gali atrasti“, – sakė „Ai2“ generalinis direktorius Ali Farhadi. „Robotika gali tapti pagrindine moksline priemone, padedančia tyrėjams judėti greičiau ir tyrinėti naujus klausimus. Kad tai pasiektume, mums reikia sistemų, kurios būtų apibendrinamos realiame pasaulyje, ir įrankių, kuriais pasaulinė mokslinių tyrimų bendruomenė galėtų kartu remtis. Perėjimo nuo modeliavimo prie tikrovės demonstravimas yra prasmingas žingsnis ta kryptimi.”

Tyrėjai iš Alleno AI instituto (Ai2) siūlo kitokį ekonominį modelį su MolmoBot – atviru robotų manipuliavimo modelių rinkiniu, parengtu tik remiantis sintetine informacija. Sukurdama trajektorijas procedūromis sistemoje, vadinamoje MolmoSpaces, komanda apeina žmogaus teleoperacijos poreikį.

Pridedamame duomenų rinkinyje MolmoBot-Data yra 1,8 milijono ekspertų manipuliavimo trajektorijų. Ši kolekcija buvo sukurta derinant MuJoCo fizikos variklį su agresyviu domenų atsitiktinių imčių paskirstymu, įvairiais objektais, požiūriais, apšvietimu ir dinamika.

„Daugeliu metodų bandoma užpildyti sim-to-real atotrūkį pridedant daugiau realaus pasaulio duomenų“, – sakė Ai2 PRIOR komandos direktorius Ranjay Krishna. „Mes pasirinkome priešingą statymą: atotrūkis sumažės, kai dramatiškai išplečiate modeliuojamų aplinkų, objektų ir fotoaparato sąlygų įvairovę. Mūsų naujausia pažanga perkelia apribojimus robotikoje nuo rankinių demonstracijų rinkimo prie geresnių virtualių pasaulių kūrimo, ir tai yra problema, kurią galime išspręsti.”

Virtualių modeliavimo duomenų generavimas fiziniam AI

Naudojant 100 Nvidia A100 GPU, vamzdynas sukūrė maždaug 1 024 epizodus per GPU valandą, o tai prilygsta daugiau nei 130 valandų roboto darbo kiekvienai sieninio laikrodžio valandos.

Palyginti su realaus pasaulio duomenų rinkimu, tai beveik keturis kartus viršija duomenų pralaidumą, o tai tiesiogiai veikia projekto investicijų grąžą, nes pagreitėja diegimo ciklai.

„MolmoBot“ rinkinį sudaro trys skirtingos politikos klasės, įvertintos dviejose platformose: „Rainbow Robotics RB-Y1“ mobilusis manipuliatorius ir „Franka FR3“ stalinė rankena. Pirminis modelis, sukurtas naudojant Molmo2 vizijos kalbos pagrindą, apdoroja kelis RGB stebėjimų ir kalbos nurodymų laiko žingsnius, kad diktuotų veiksmus.

Aparatinės įrangos lankstumas naudojant Ai2 MolmoBot

Kraštinėms skaičiavimo aplinkoms, kuriose ištekliai yra riboti, mokslininkai pateikia MolmoBot-SPOC, lengvą transformatoriaus politiką su mažiau parametrų. „MolmoBot-Pi0“ naudoja „PaliGemma“ pagrindą, kad atitiktų fizinio intelekto π0 modelio architektūrą ir leidžia tiesiogiai palyginti našumą.

Atliekant fizinį testavimą, šios strategijos parodė nulinį perkėlimą į realaus pasaulio užduotis, susijusias su nematomais objektais ir aplinka, be jokio tikslaus derinimo.

Atliekant įvertinimus ant stalo, pirminis MolmoBot modelis pasiekė 79,2 proc. sėkmės rodiklį. Tai pranoko π0,5, modelio, parengto remiantis plačiais realaus pasaulio demonstraciniais duomenimis, ir kurio sėkmės rodiklis buvo 39,2 proc. Kalbant apie manipuliavimą mobiliuoju telefonu, politika sėkmingai įvykdė tokias užduotis kaip priėjimas, sugriebimas ir durų traukimas per visą judesių diapazoną.

Pateikiant šias įvairias architektūras, organizacijos gali integruoti tinkamas fizines AI sistemas, neprisijungdamos prie vienos patentuotos tiekėjo ekosistemos ar plačios duomenų rinkimo infrastruktūros.

Atviras viso „MolmoBot“ krūvos, įskaitant mokymo duomenis, generavimo vamzdynus ir modelių architektūras, leidimas leidžia atlikti vidinį auditą ir pritaikymą. Kiekvienas, tyrinėjantis fizinį dirbtinį intelektą, gali panaudoti šiuos atvirus įrankius, kad galėtų modeliuoti ir kurti tinkamas sistemas, tuo pačiu kontroliuodamas išlaidas.

„Kad dirbtinis intelektas tikrai pažangų mokslą, pažanga negali priklausyti nuo uždarų duomenų ar izoliuotų sistemų“, – tęsia „Ai2“ generalinis direktorius Ali Farhadi. „Tai reikalauja bendros infrastruktūros, kurią tyrinėtojai visur galėtų kurti, išbandyti ir kartu tobulinti. Taip tikime, kad fizinis AI judės į priekį.”

Taip pat žiūrėkite: Nauja partnerystė, siūlanti išmaniuosius robotus pavojingoms aplinkoms

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais, įskaitant „Cyber ​​Security & Cloud Expo“. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.



Source link

Draugai: - Marketingo agentūra - Teisinės konsultacijos - Skaidrių skenavimas - Klaipedos miesto naujienos - Miesto naujienos - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Teniso treniruotės - Pranešimai spaudai - Kauno naujienos - Regionų naujienos - Palangos naujienos