„Lightricks“ skatina greitą vaizdo įrašų kūrimą ir kartojimą naudodama naujausią dirbtinio intelekto modelį. Bendrovė teigia, kad jos naujai išleistas LTX-2 pamatinis modelis gali generuoti naują turinį greičiau nei atkūrimo greitis, be to, jis pakelia raiškos ir kokybės kartelę.
Atvirojo kodo LTX-2 gali sukurti stilizuotą, didelės raiškos, šešių sekundžių vaizdo įrašą vos per penkias sekundes be jokių kompromisų dėl kokybės, todėl kūrėjai gali išpumpuoti profesionalų turinį daug greičiau nei anksčiau.
Tai įspūdingas pasiekimas, tačiau tai ne vienintelis parametras, išskiriantis LTX-2 iš kitų. Jis sujungia vietinį garso ir vaizdo sintezę su atvirojo kodo skaidrumu, o jei vartotojai nori laukti tik kelias sekundes ilgiau, jie gali padidinti savo išvestį iki 4K raiškos iki 48 kadrų per sekundę greičiu, teigia bendrovė. Dar geriau, kad kūrėjai gali paleisti programinę įrangą vartotojams skirtuose GPU, taip smarkiai sumažindami skaičiavimo išlaidas.
Difuziniai modeliai sulaukia pilnametystės
LTX-2 yra tai, kas žinoma kaip difuzijos modelis, kuris veikia palaipsniui pridedant „triukšmo“ prie generuojamo turinio ir tada sumažinant tą triukšmą, kol išvestis bus panaši į vaizdo išteklius, kurių modelis buvo apmokytas.
Su LTX-2 „Lightricks“ paspartino sklaidos procesą, todėl kūrėjai gali kartoti savo idėjas, beveik akimirksniu pateikdami tiesiogines peržiūras. Modelis taip pat gali tuo pačiu metu generuoti lydintį garsą – ar tai būtų garso takelis, dialogas ar aplinkos garso efektai – tai labai pagreitina kūrybines darbo eigas.
Tai labai svarbu, nes kūrėjams būtų tekę sukurti bet kokį garsą atskirai nuo vaizdo įrašo, tada praleisti laiką jį sujungdami ir įsitikindami, kad yra tobulas sinchronizavimas. „Google“ „Veo“ modeliai buvo švenčiami dėl galingos sinchronizuoto garso generavimo integracijos, todėl šios naujos LTX galimybės sustiprina idėją, kad „Lightricks“ technologija yra lygiavertė nepaprastiems pranašumams.
Kalbant apie prieigos parinktis, „Lightricks“ kūrėjams vis dar siūlo daug lankstumo su LTX-2. Bendrovės flagmanas LTX Studio platforma yra skirta profesionalams, kurie tam tikrais atvejais yra pasirengę paaukoti šiek tiek greičio, kad sukurtų aukščiausios kokybės vaizdo įrašus. Dėl šiek tiek lėtesnių apdorojimo tempų jie galės išvesti vaizdo įrašus 4K raiška iki 48 kadrų per sekundę greičiu, kurdami pagal tą patį standartą, kurio tikimasi iš filmų, tvirtina Lightricks.
Platforma siūlo platų kūrybinių valdiklių pasirinkimą, turintį įtakos modelio pritaikomiems parametrams. Daugiau informacijos apie juos bus paskelbta netrukus, bet turėtų apimti pozos ir gylio valdiklius, vaizdo įrašų generavimą ir atvaizdavimo alternatyvas – stebėkite išleidimo datą vėliau šį rudenį.
„Lightricks“ įkūrėjas ir generalinis direktorius Zeevas Farbmanas mano, kad patobulintos LTX-2 galimybės iliustruoja, kokiu mastu difuzijos modeliai pagaliau sulaukia pilnametystės. Jis teigė, kad LTX-2 yra: „Išsamiausias ir išsamiausias kūrybinis dirbtinio intelekto variklis, kurį kada nors sukūrėme, derinantis sinchronizuotą garsą ir vaizdą, 4K tikslumą, lanksčias darbo eigas ir radikalų efektyvumą.
„Tai nėra garų programinė įranga ar tyrimų demonstracinė versija“, – sakė jis. „Tai tikras proveržis kuriant vaizdo įrašus.
Svarbus etapas
Naudodama LTX-2, „Lightricks“ demonstruoja, kad yra AI vaizdo įrašų kartos pažangiausia platforma, nes ši platforma buvo sukurta daugelio pramonės pirmųjų ankstesniuose LTXV modeliuose.
Liepos mėnesį bendrovės LTXV modelių šeima, įskaitant LTXV-2B ir LTXV-13B, pirmoji palaikė ilgų formų vaizdo įrašų generavimą, po kurio buvo atnaujintas išėjimas iki 60 sekundžių. Dėl to AI vaizdo įrašų gamyba tapo „tikrai nukreipta“, o vartotojai galėjo pradėti nuo pradinio raginimo ir pridėti papildomų raginimų realiuoju laiku, kai vaizdo įrašas buvo tiesiogiai transliuojamas.
LTXV-13B jau turėjo vieno iš galingiausių vaizdo įrašų kūrimo modelių reputaciją, net prieš tą vienos minutės atnaujinimą. Paleista gegužę, tai buvo pirmoji platforma pramonėje, palaikanti kelių mastelių atvaizdavimą, leidžiantį vartotojams laipsniškai tobulinti savo vaizdo įrašus, skatinant modelį žingsnis po žingsnio pridėti daugiau spalvų ir detalių, taip pat, kaip profesionalūs animatoriai „sluoksniuoja“ papildomos informacijos savo darbą tradiciniuose gamybos procesuose.
13B modelis buvo apmokytas pagal licencijuotus duomenis iš Getty ir Shutterstock. Įmonės partnerystė su šiais turinio behemotais svarbi ne tik dėl mokymo duomenų kokybės, bet ir dėl etinių priežasčių; modelių rezultatai yra daug mažiau problemiški autorių teisių požiūriu – problema, kuri kankina daugelį kitų AI modelių kūrinių.
„Lightricks“ taip pat išleido distiliuotą LTXV-13B versiją, kuri supaprastina ir pagreitina sklaidos procesą, o tai reiškia, kad turinį galima generuoti vos nuo keturių iki aštuonių žingsnių. Distiliuota versija taip pat palaiko LoRA, o tai reiškia, kad vartotojai gali ją tiksliai suderinti, kad sukurtų turinį, kuris labiau atitiktų estetinį projekto stilių.
Inovatyvūs atsiskaitymo modeliai
Kaip ir ankstesni modeliai, LTX-2 bus išleistas pagal atvirojo kodo licenciją, todėl tai bus perspektyvi alternatyva Alibaba Wan2 modelių serijai. „Lightricks“ pabrėžė, kad tai tikrai atvirojo kodo, o ne tik „atvirosios prieigos“, o tai reiškia, kad jo iš anksto paruošti svoriai, duomenų rinkiniai ir visi įrankiai bus pasiekiami „GitHub“ kartu su pačiu modeliu.
LTX-2 nuo šiol pasiekiamas vartotojams LTX Studio ir per jos API, o atvirojo kodo versija bus išleista lapkričio mėn.
Tiems, kurie nori naudoti mokamą versiją per API, „Lightricks“ siūlo lanksčią kainodarą, o versijos, kuri HD vaizdo įrašus sukuria vos per penkias sekundes, kainos prasideda tik nuo 0,04 USD už sekundę. „Pro“ versija subalansuoja greitį ir našumą, o čia kainos prasideda nuo 0,07 USD už sekundę. Ultra versija kainuoja 0,12 USD už sekundę už 4K raiškos vaizdo įrašų generavimą 48 kadrų per sekundę greičiu ir pilno tikslumo garsą. Kainos taip pat skiriasi priklausomai nuo skiriamosios gebos, o vartotojai gali rinktis iš 720p, 1080p, 2K ir 4K.
„Lightricks“ teigia, kad dėl modelio apdorojimo efektyvumo, dėl jo kainų LTX-2 yra iki 50% pigesnis nei konkuruojantys modeliai, todėl išplėstiniai projektai yra ekonomiškesni, tačiau jų kartojimas yra greitesnis ir kokybiškesnis nei ankstesnės kartos. Arba vartotojai galės naudoti modelį atsisiųsdami atvirojo kodo versiją ir paleisdami ją vartotojams skirtuose GPU, kai kitą mėnesį jis atsidurs „GitHub“.
Vaizdo šaltinis: Unsplash