Kinijos AI startuolis „Moonshot“ sujaukė lūkesčius dirbtinio intelekto vystymo srityje, po to, kai „Kimi K2 Thinking“ modelis pranoko OpenAI GPT-5 ir Anthropic Claude Sonnet 4.5 pagal daugelį našumo etalonų, sukeldamas naujas diskusijas apie tai, ar Amerikos AI dominavimui neprieštarauja ekonomiškai efektyvios Kinijos naujovės.
Pekine įkurtas 3,3 milijardo JAV dolerių vertės „Moonshot AI“, remiamas technologijų gigantų „Alibaba Group Holding“ ir „Tencent Holdings“, lapkričio 6 d. išleido atvirojo kodo „Kimi K2 Thinking“ modelį, pasiekdamas tai, ką pramonės stebėtojai vadina dar vienu „DeepSeek momentu“ – nuoroda į Hangdžou paleisties DI ankstesnių sąnaudų sutrikimus.
Našumo metrika meta iššūkį JAV modeliams
Remiantis bendrovės „GitHub“ tinklaraščio įrašu, „Kimi K2 Thinking“ surinko 44,9 % paskutinio žmonijos egzamino – didelio kalbos modelio etalono, kurį sudaro 2 500 klausimų iš įvairių dalykų ir viršija GPT-5 41,7 %.
Modelis taip pat pasiekė 60,2 % pagal BrowseComp etaloną, kuris įvertina didelių kalbos modelių agentų žiniatinklio naršymo įgūdžius ir informacijos ieškojimo atkaklumą, ir surinko 56,3 %, pirmaujantis pagal Seal-0 etaloną, skirtą mesti iššūkį paieška papildytiems modeliams pagal realių tyrimų užklausas.
VentureBeat pranešė, kad visiškai atviro svorio išleidimo susitikimas arba GPT-5 balų viršijimas žymi lūžio tašką, kai atotrūkis tarp uždarų sienų sistemų ir viešai prieinamų modelių iš esmės sumažėjo dėl aukščiausios klasės samprotavimų ir kodavimo.
Kainų efektyvumas kelia klausimų
Modelio populiarumas išaugo po to, kai CNBC pranešė, kad jo mokymo kaina siekė tik 4,6 mln. JAV dolerių, nors „Moonshot AI“ nekomentavo išlaidų. Remiantis skaičiavimais, „South China Morning Post“.Kimi K2 Thinking taikomųjų programų programavimo sąsajos kaina buvo nuo šešių iki 10 kartų pigesnė nei OpenAI ir Anthropic modelių.
Modelis naudoja Mixture-of-Experts architektūrą su vienu trilijonu iš viso parametrų, iš kurių 32 milijardai suaktyvinami vienai išvadai, ir buvo apmokytas naudojant INT4 kvantavimą, kad būtų pasiektas maždaug du kartus didesnis kartos greitis, išlaikant naujausią našumą.
Thomas Wolf, Hugging Face įkūrėjas, pakomentavo X, kad Kimi K2 Thinking buvo dar vienas atvirojo kodo modelio atvejis, kai praeina uždarojo kodo modelis, ir paklausė: „Ar tai dar vienas „DeepSeek“ momentas? Ar dabar turėtume tikėtis (vieno) kas porą mėnesių?
Techninės galimybės ir apribojimai
Moonshot AI tyrėjai teigė, kad Kimi K2 Thinking nustatė „naujų etalonų rekordus, įvertinančius samprotavimo, kodavimo ir agento galimybes“. Modelis gali atlikti iki 200–300 nuoseklių įrankių iškvietimų be žmogaus įsikišimo, nuosekliai samprotaujant šimtuose žingsnių, kad išspręstų sudėtingas problemas.
Konsultacinės bendrovės „Artificial Analysis“ atliktas nepriklausomas testavimas padėjo „Kimi K2“ viršyti savo „Tau-2 Bench Telecom“ agentų etaloną 93 % tikslumu, o tai buvo apibūdinta kaip aukščiausias nepriklausomai išmatuotas balas.
Tačiau Nathanas Lambertas, Alleno dirbtinio intelekto instituto tyrėjas, teigė, kad tarp geriausių uždarų ir atvirų modelių vis dar yra maždaug keturių–šešių mėnesių laiko tarpas, nors jis pripažino, kad Kinijos laboratorijos artėja prie pagrindinių etalonų ir veikia labai stipriai.
Rinkos pasekmės ir konkurencinis spaudimas
Pekine dirbantis informacinių technologijų sistemų architektas Zhangas Ruiwangas teigė, kad Kinijos įmonės mažino sąnaudas ir paaiškino: „Bendras Kinijos modelių našumas vis dar atsilieka nuo geriausių JAV modelių, todėl jie turi konkuruoti ekonomiškumo sferoje, kad rastų išeitį.
Zhang Yi, vyriausiasis konsultacinės bendrovės iiMedia analitikas, teigė, kad Kinijos dirbtinio intelekto modelių mokymo sąnaudos sumažėjo dėl modelių architektūros ir mokymo technikos naujovių ir kokybiškų mokymo duomenų įvedimo, o tai rodo perėjimą nuo kompiuterinių išteklių kaupimo ankstyvosiomis dienomis.
Modelis buvo išleistas pagal modifikuotą MIT licenciją, suteikiančią visas komercines ir išvestines teises su vienu apribojimu: diegėjai, aptarnaujantys daugiau nei 100 milijonų aktyvių naudotojų per mėnesį arba gaunantys daugiau nei 20 milijonų JAV dolerių per mėnesį pajamų, produkto vartotojo sąsajoje turi aiškiai parodyti „Kimi K2“.
Pramonės reakcija ir ateities perspektyvos
Deedy Das, ankstyvosios stadijos rizikos kapitalo įmonės „Menlo Ventures“ partneris, įraše X parašė, kad „Šiandien yra lūžio taškas dirbtinio intelekto srityje. Kinijos atvirojo kodo modelis yra #1. Pagrindinis momentas AI“.
Nathanas Lambertas „Substack“ straipsnyje rašė, kad Kinijos atvirojo kodo AI kūrėjų, įskaitant „Moonshot AI“ ir „DeepSeek“, sėkmė parodė, kaip jie „privertė uždaras laboratorijas prakaituoti“, pridūrė: „Yra rimtas kainų spaudimas ir lūkesčiai, kuriuos (JAV kūrėjai) turi valdyti“.
Išleidimas „Moonshot AI“ pozicionuoja kartu su kitomis Kinijos AI įmonėmis, tokiomis kaip „DeepSeek“, „Qwen“ ir „Baichuan“, kurios vis labiau meta iššūkį Amerikos AI viršenybės pasakojimui dėl ekonomiškai efektyvių inovacijų ir atvirojo kodo plėtros strategijų.
Nesvarbu, ar tai yra tvarus konkurencinis pranašumas, ar laikinas pajėgumų konvergencija, dar reikia išsiaiškinti, nes tiek JAV, tiek Kinijos įmonės toliau tobulina savo modelius.
viešas pareiškimų pobūdis ir rinkos reakcija rodo, kad netrukus gali prasidėti esminės diskusijos.
AI lusto kraštovaizdis įžengia į svyravimo laikotarpį. Organizacijos turėtų išlaikyti lankstumą savo infrastruktūros strategijoje ir stebėti, kaip tokios partnerystės kaip „Tesla-Intel“ gali pakeisti AI techninės įrangos gamybos konkurencinę dinamiką.
Šiandien priimti sprendimai dėl lustų gamybos partnerysčių gali nustatyti, kurios organizacijos ateinančiais metais turės prieigą prie ekonomiškai efektyvios, našios AI infrastruktūros.
Moonshot AI nuotrauka)
Taip pat žiūrėkite: „DeepSeek“ sutrikimas: Kinijos AI naujovės sumažina pasaulinę technologijų atskirtį
Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Šis išsamus renginys yra TechEx dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais. Norėdami gauti daugiau informacijos, spustelėkite čia.
AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.