„Amazon Web Services“ iškovojo dar vieną didelę pergalę už savo pritaikytus „AWS Trainium“ greitintuvus po to, kai susitarė su AI vaizdo įrašų startuoliu „Decart“. Bendradarbiaujant Decart optimizuos savo pavyzdinį „Lucy“ modelį AWS Trainium3, kad palaikytų vaizdo įrašų generavimą realiuoju laiku, ir išryškins augantį AI spartintuvų populiarumą, palyginti su „Nvidia“ grafikos apdorojimo įrenginiais.
„Decart“ iš esmės eina į AWS, o kaip dalį sandorio bendrovė taip pat pateiks savo modelius per „Amazon Bedrock“ platformą. Kūrėjai gali integruoti Decart realaus laiko vaizdo įrašų generavimo galimybes į beveik bet kurią debesies programą, nesijaudindami dėl pagrindinės infrastruktūros.
Platinimas per „Bedrock“ padidina AWS „plug and play“ galimybes, parodydamas „Amazon“ pasitikėjimą augančia realaus laiko AI vaizdo paklausa. Tai taip pat leidžia „Decart“ išplėsti pasiekiamumą ir plėtoti kūrėjų bendruomenės naudojimą. AWS Trainium suteikia Lucy papildomą apdorojimo procesą, reikalingą norint sukurti aukštos kokybės vaizdo įrašą neprarandant kokybės ar delsos.
Pasirinktiniai AI greitintuvai, tokie kaip „Trainium“, yra alternatyva „Nvidia“ GPU, skirta dirbtinio intelekto apkrovoms. Nors „Nvidia“ vis dar dominuoja dirbtinio intelekto rinkoje, jos GPU apdoroja didžiąją dalį dirbtinio intelekto darbo krūvių, jai kyla didėjanti tinkintų procesorių grėsmė.
Kodėl toks triukšmas dėl AI greitintuvų?
AWS Trainium nėra vienintelė kūrėjų galimybė. „Google“ „Tensor Processing Unit“ (TPU) produktų linija ir „Meta“ mokymo ir išvadų greitintuvo (MTIA) lustai yra kiti pasirinktinio silicio pavyzdžiai, kurių kiekvienas turi panašų pranašumą, palyginti su „Nvidia“ GPU – jų ASIC architektūra (programoms būdinga integruota grandinė). Kaip rodo pavadinimas, ASIC aparatinė įranga yra sukurta specialiai apdoroti vienos rūšies programas ir tai padaryti efektyviau nei bendrosios paskirties procesoriai.
Nors centriniai procesoriai paprastai laikomi Šveicarijos armijos peiliu kompiuterijos pasaulyje dėl jų gebėjimo valdyti daugybę programų, grafikos procesoriai yra labiau panašūs į galingą elektrinį grąžtą. Jie yra daug galingesni nei centriniai procesoriai, skirti apdoroti daugybę pasikartojančių lygiagrečių skaičiavimų, todėl jie tinka dirbtinio intelekto programoms ir grafikos atvaizdavimo užduotims.
Jei GPU yra galios grąžtas, ASIC gali būti laikomas skalpeliu, skirtu itin tikslioms procedūroms. Kurdami ASIC, lustų gamintojai pašalina visus funkcinius vienetus, nesusijusius su užduotimi, siekdami didesnio efektyvumo – visos jų operacijos yra skirtos užduočiai.
Tai suteikia didžiulę našumo ir energijos vartojimo efektyvumo naudą, palyginti su GPU, ir gali paaiškinti jų augantį populiarumą. Pavyzdžiui, „Anthropic“, kuri bendradarbiauja su AWS projekte „Rainier“, didžiulę klasterį, sudarytą iš šimtų tūkstančių „Trainium2“ procesorių.
„Anthropic“ teigia, kad „Project Rainier“ suteiks jam šimtus eksaflopų skaičiavimo galios, kad galėtų paleisti pažangiausius AI modelius, įskaitant Claude Opus-4.5.
Dirbtinio intelekto kodavimo startuolis „Poolside“ taip pat naudoja AWS Trainium2 savo modeliams apmokyti ir ateityje planuoja naudoti savo infrastruktūrą išvadoms daryti. Tuo tarpu Anthropic apsidraudžia savo statymus, taip pat nori apmokyti būsimus Claude modelius iki vieno milijono Google TPU grupėje. Pranešama, kad „Meta Platforms“ bendradarbiauja su „Broadcom“, kad sukurtų pritaikytą AI procesorių, skirtą „Llama“ modeliams mokyti ir valdyti, o „OpenAI“ turi panašių planų.
Trainium pranašumas
Decart pasirinko AWS Trainium2 dėl savo našumo, kuris leido Decart pasiekti mažą delsą, reikalingą realaus laiko vaizdo modeliams. Lucy laikas iki pirmojo kadro yra 40 ms, o tai reiškia, kad ji pradeda generuoti vaizdo įrašą beveik iš karto po raginimo. Supaprastinusi vaizdo apdorojimą „Trainium“, Lucy taip pat gali prilygti daug lėtesnių, labiau nusistovėjusių vaizdo modelių, tokių kaip „OpenAI Sora 2“ ir „Google Veo-3“, kokybei, o „Decart“ generuoja išvestį iki 30 kadrų per sekundę greičiu.
Decartas mano, kad Liusė pagerės. Pagal susitarimą su AWS bendrovė gavo išankstinę prieigą prie naujai paskelbto Trainium3 procesoriaus, galinčio išvesti iki 100 kadrų per sekundę ir mažesnę delsą. „Naujos kartos „Trainium3“ architektūra užtikrina didesnį pralaidumą, mažesnę delsą ir didesnį atminties efektyvumą – tai leidžia mums pasiekti iki 4 kartų greitesnį kadrų generavimą perpus pigiau nei GPU“, – pranešime teigė „Decart“ įkūrėjas ir generalinis direktorius Deanas Leitersdorfas.
„Nvidia“ gali pernelyg nesijaudinti dėl pritaikytų AI procesorių. Pranešama, kad dirbtinio intelekto lustų milžinas kuria savo ASIC lustus, kad galėtų konkuruoti su debesų konkurentais. Be to, ASIC visiškai nepakeis GPU, nes kiekvienas lustas turi savo stipriąsias puses. GPU lankstumas reiškia, kad jie išlieka vienintele realia galimybe bendrosios paskirties modeliams, tokiems kaip GPT-5 ir Gemini 3, ir vis dar dominuoja AI mokymuose. Tačiau daugeliui AI taikomųjų programų taikomi stabilūs apdorojimo reikalavimai, o tai reiškia, kad jos ypač tinka naudoti ASIC.
Tikimasi, kad pritaikytų AI procesorių augimas turės didelį poveikį pramonei. Skatindami lusto dizainą labiau pritaikyti ir gerindami specializuotų programų našumą, jie sukuria pagrindą naujai AI naujovių bangai, o vaizdo įrašas realiuoju laiku yra priešakyje.
Nuotrauka mandagumo AWS re:invent