Milijardas dolerių pradinio finansavimo įmonei, kurioje dirba 12 žmonių, rodo, kad investuotojai vis dar tiki dirbtiniu intelektu. Tačiau aptariamo startuolio įkūrėjas – AMI Labs atstovas Yann LeCun – mano, kad technologijos, kurias šiuo metu vadiname AI (didelių kalbų modeliai), nėra būdas, kuriuo ji sukurs prasmingus ir ilgalaikius rezultatus.
Yann LeCun praėjusių metų pabaigoje paliko vyriausiojo dirbtinio intelekto mokslininko pareigas „Meta“ ir įkūrė „Advanced Machine Intelligence Labs“ (AMI Labs), kuri, anot jo, išliks mokslinių tyrimų organizacija, kuri nesitikima gaminti parduodamo produkto gal penkerius metus. „AMI Labs“ komanda koncentruojasi ne į didžiulius bendrosios paskirties kalbinius modelius, o į AI, susidedančius iš modulinių komponentų rinkinių, parengtų ir veikiančių konkrečiais naudojimo atvejais.
LeCun siūlomą dirbtinio intelekto sistemą sudarytų šių tipų elementai:
- pasaulio modelis, būdingas sričiai, kurioje veiktų AI. Tai gali būti konkrečios pramonės šakos, o gal labiau tikėtina, kad tai priklauso nuo vaidmens,
- aktorius, kuris siūlo tolesnius veiksmus, paremtus klasikiniu sustiprinimo mokymusi,
- kritikas, analizuojantis įvairias pasaulio modelio galimybes, pagrįstas trumpalaike atmintimi, ir įvertinantis siūlomus žingsnius pagal griežtai užkoduotas taisykles,
- suvokimo sistema, kuri būtų būdinga AI naudojimui: vaizdo ar garso duomenys, tekstas, vaizdai ir pan., naudojant, pavyzdžiui, gilaus mokymosi regėjimo atpažinimo algoritmus,
- trumpalaikė atmintis,
- konfigūratorius, kuris sureguliuotų informacijos judėjimą tarp visų aukščiau nurodytų dalykų.
Skirtingai nuo didelių kalbų modelių, kurie buvo mokomi tik naudojant vieną informacijos šaltinį (tekstą, paimtą iš interneto), kiekvienam LeCun AI egzemplioriui būtų pateikti nukreipti duomenys, susiję tik su jų aplinka ir tikslu. Kiekvienoje versijoje kiekvieno modulio svarba gali būti nustatyta skirtingai. Pavyzdžiui, kritiko modulis būtų išsamesnis srityse, kuriose naudojama jautri informacija, arba suvokimo modulis būtų svarbiausias sistemose, kurios turi greitai reaguoti į realaus pasaulio įvykius.
Kiekvienas modulis būtų apmokytas tokiais būdais, kurie yra svarbūs konkrečiai AI sričiai. Praeityje buvo keli sėkmingi to atvejai, pavyzdžiui, mašininio mokymosi sistemos, kurios gali išmokti žaisti vaizdo ar stalo žaidimą. Tai prieštarauja dideliems kalbų modeliams, kuriais grindžiama dauguma to, apie ką šiuo metu kalbame kalbėdami apie AI.
LLM yra apmokyti kaip apibendrintojai, sukuriantys geriausius atsakymus pagal tai, ką jie suvartojo, o vėliau gali būti koreguojami naudojant greitą inžineriją naudojant programinės įrangos paketus (šiuo metu labiausiai žinomas Claude Code), arba gilesniu lygmeniu, naudojant samprotavimo modelius (pagrindinių atsakymų „garsiai mąstanti“ dalis, kurią vartotojas pateikia prieš galutinius atsakymus).
Finansinės AI, sukurtos naudojant AMI Labs siūlomus metodus, pasekmės bus įdomios dabartinei AI pramonei – darant prielaidą, kad Yann LeCun idėjos duos vaisingų ir perspektyvių rezultatų. Dideli kalbų modeliai iš didelių technologijų tiekėjų (Anthropic, Meta, OpenAI, Google ir kt.) per pastaruosius penkerius metus sunaudojo daugiau išteklių kiekvienai iteracijai. Be ankstyvo modelio dydžio augimo, pasikartojantis raginimas pagerinti vėlesnių versijų rezultatus reiškia, kad mokymas ir didelių modelių valdymas tampa vis brangesni, ir tik didžiulės įmonės gali sau leisti juos eksploatuoti patiriant finansinių nuostolių.
Mažesni, tiksliniai moduliai, esantys AMI Labs pasiūlytame sprendime, galėtų būti paleisti naudojant dalį GPU galios, šiuo metu reikalingos milžiniškoms LLM, arba net įrenginyje. Pavyzdžiui, vietoj šimtų milijardų parametrų modelių, kuriuos naudoja ChatGPT, specializuotiems modeliams – kurie nebūtinai turi būti apibendrinti – turėtų užtekti tik kelių šimtų milijonų parametrų. Tai ir prielaida, kad skaičiavimo išlaidos paprastai sumažės, reiškia, kad vietinis, pigus ir iš esmės tikslesnis AI gali būti tik trumpas žingsnis.
Nauja idėja turintis startuolis, surinkęs milžinišką finansinę paramą, nėra jokia naujiena naujausioje technologijų istorijoje. Tačiau bent jau dalis LeCuno strategijos remiasi jo įsitikinimu, kad dabartiniai dideli kalbų modeliai negali pakankamai tobulėti, kad suvoktų jų kūrėjų keliamus siekius. Panašu, kad „AMI Labs“ siūlo investuotojams būdą, kurį AI galėtų sėkmingai atlikti tam tikru etapu netolimoje ateityje su valdomomis sąnaudomis, naudojant kitokią architektūrą nei dabartinė norma. Tai kitoks pasiūlymas, nei šiuo metu siūlo šiandieniniai AI behemotai, tačiau žinia apie ateities potencialą yra panaši.
(Vaizdo šaltinis: „Sidehike“ „Modulinės konstrukcijos perspektyva“ yra licencijuota pagal CC BY-NC-SA 2.0.)

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra TechEx dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais. Norėdami gauti daugiau informacijos, spustelėkite čia.
AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.