Naujausio Alibaba Qwen modelio išleidimas meta iššūkį patentuoto dirbtinio intelekto modelio ekonomikai, o prekių techninės įrangos našumas yra panašus.
Nors JAV įsikūrusios laboratorijos istoriškai išlaikė našumo pranašumą, atvirojo kodo alternatyvos, tokios kaip Qwen 3.5 serija, mažina atotrūkį nuo pažangiausių modelių. Tai leidžia įmonėms sumažinti išvadų sąnaudas ir padidinti diegimo architektūros lankstumą.
Pagrindinis Qwen 3.5 leidimo pasakojimas yra šis techninis suderinimas su pagrindinėmis patentuotomis sistemomis. „Alibaba“ aiškiai orientuojasi į gaires, nustatytas didelio našumo JAV modeliuose, įskaitant GPT-5.2 ir Claude 4.5. Šis pozicionavimas rodo ketinimą tiesiogiai konkuruoti produkcijos kokybe, o ne tik kaina ar prieinamumu.
Technologijų ekspertas Antonas P. teigia, kad modelis „prekiauja su Claude Opus 4.5 ir GPT-5.2“. Jis priduria, kad modelis „nusilenkia naršymo, samprotavimo ir instrukcijų vykdymo modelius“.
„Alibaba Qwen“ našumo konvergencija su uždarais modeliais
Įmonėms šis našumo paritetas rodo, kad atvirojo svorio modeliai nebėra skirti tik mažos vertės ar eksperimentinio naudojimo atvejams. Jie tampa perspektyviais kandidatais į pagrindinę verslo logiką ir sudėtingas samprotavimo užduotis.
Pavyzdiniame „Alibaba Qwen“ modelyje yra 397 milijardai parametrų, tačiau naudojama efektyvesnė architektūra su tik 17 milijardų aktyvių parametrų. Šis negausus aktyvinimo metodas, dažnai siejamas su ekspertų mišinio (MoE) architektūra, leidžia pasiekti aukštą našumą be skaičiavimo bausmės, kai reikia aktyvuoti kiekvieną parametrą kiekvienam prieigos raktui.
Šis architektūrinis pasirinkimas pagerina greitį. „GlobalData“ socialinės žiniasklaidos analitikas Shreyasee Majumder pabrėžia „didžiulį dekodavimo greičio pagerėjimą, kuris yra net devyniolika kartų greitesnis nei ankstesnė pavyzdinė versija“.
Greitesnis dekodavimas galiausiai tiesiogiai reiškia mažesnę delsą vartotojui skirtose programose ir trumpesnį paketinio apdorojimo skaičiavimo laiką.
Leidimas veikia pagal Apache 2.0 licenciją. Šis licencijavimo modelis leidžia įmonėms paleisti modelį savo infrastruktūroje, sumažinant duomenų privatumo riziką, susijusią su jautrios informacijos siuntimu išorinėms API.
Qwen 3.5 techninės įrangos reikalavimai yra gana prieinami, palyginti su ankstesnių kartų didelių modelių. Veiksminga architektūra leidžia kūrėjams paleisti modelį asmeninėje aparatinėje įrangoje, pvz., „Mac Ultras“.
Davidas Hendricksonas, „GenerAIte Solutions“ generalinis direktorius, pastebi, kad „OpenRouter“ modelį galima įsigyti už „3,6 USD/1 mln. žetonų“, o kaina, kurią jis pabrėžia, yra „vagystė“.
„Alibaba“ „Qwen 3.5“ serijoje pristatomos vietinės daugiarūšės galimybės. Tai leidžia modeliui apdoroti ir vertinti skirtingus duomenų tipus, nepasikliaujant atskirais, varžtais pritvirtintais moduliais. Majumderis atkreipia dėmesį į „gebėjimą savarankiškai naršyti programas naudojant vizualines priemones“.
„Qwen 3.5“ taip pat palaiko vieno milijono žetonų kontekstinį langą savo priglobtoje versijoje. Dideli konteksto langai leidžia apdoroti didelius dokumentus, kodų bazes ar finansinius įrašus vienu raginimu.
Jei to nepakaktų, modelyje taip pat yra 201 kalbos palaikymas. Ši plati kalbų aprėptis padeda tarptautinėms įmonėms diegti nuoseklius AI sprendimus įvairiose regioninėse rinkose.
Įgyvendinimo svarstymai
Nors techninės specifikacijos yra daug žadančios, integracija reikalauja deramo kruopštumo. TP Huangas pažymi, kad praeityje „nurodė, kad didesni Qwen modeliai nėra tokie puikūs“, nors naujasis „Alibaba“ leidimas atrodo „pagrįstai geriau“.
Antonas P. pateikia būtiną atsargumo priemonių taikymą įmonėms: „Etalonai yra etalonai. Tikrasis išbandymas yra gamyba“.
Lyderiai taip pat turi atsižvelgti į geopolitinę technologijos kilmę. Kadangi modelis gaunamas iš „Alibaba“, valdymo komandos turės įvertinti programinės įrangos tiekimo grandinių atitikties reikalavimus. Tačiau atviras leidimo pobūdis leidžia patikrinti kodą ir vietinį prieglobą, o tai sumažina kai kurias duomenų suvereniteto problemas, palyginti su uždaromis API.
Alibaba išleidusi Qwen 3.5 priverčia apsispręsti. Antonas P. tvirtina, kad atviro svorio modeliai „iš „pasvijo“ į „pirmauja“ greičiau, nei kas nors prognozavo“.
Įmonė turi nuspręsti, ar toliau mokėti įmokas už patentuotus JAV priglobtus modelius, ar investuoti į inžinerinius išteklius, reikalingus pažangioms, tačiau pigesnėms atvirojo kodo alternatyvoms panaudoti.
Taip pat žiūrėkite: „Alibaba“ dalyvauja fizinėse AI lenktynėse su atvirojo kodo roboto modeliu „RynnBrain“.
Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais, įskaitant „Cyber Security & Cloud Expo“. Norėdami gauti daugiau informacijos, spustelėkite čia.
AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.