Kaip „Moonshot AI“ įveikė GPT-5 ir Claude už nedidelę kainą

Kinijos AI startuolis „Moonshot“ sujaukė lūkesčius dirbtinio intelekto vystymo srityje, po to, kai „Kimi K2 Thinking“ modelis pranoko OpenAI GPT-5 ir Anthropic Claude Sonnet 4.5 pagal daugelį našumo etalonų, sukeldamas naujas diskusijas apie tai, ar Amerikos AI dominavimui neprieštarauja ekonomiškai efektyvios Kinijos naujovės.

Pekine įkurtas 3,3 milijardo JAV dolerių vertės „Moonshot AI“, remiamas technologijų gigantų „Alibaba Group Holding“ ir „Tencent Holdings“, lapkričio 6 d. išleido atvirojo kodo „Kimi K2 Thinking“ modelį, pasiekdamas tai, ką pramonės stebėtojai vadina dar vienu „DeepSeek momentu“ – nuoroda į Hangdžou paleisties DI ankstesnių sąnaudų sutrikimus.

🚀 Sveiki, Kimi K2 Thinking!
Atvirojo kodo mąstymo agento modelis yra čia.

🔹 SOTA HLE (44,9 %) ir BrowseComp (60,2 %)
🔹 Vykdo iki 200–300 nuoseklių įrankių skambučių be žmogaus įsikišimo
🔹 Puikūs samprotavimai, agentinė paieška ir kodavimas
🔹 256K kontekstinis langas

Pastatytas… pic.twitter.com/lZCNBIgbV2

– Kimi.ai (@Kimi_Moonshot) 2025 m. lapkričio 6 d

Turinys:

Našumo metrika meta iššūkį JAV modeliams

Remiantis bendrovės „GitHub“ tinklaraščio įrašu, „Kimi K2 Thinking“ surinko 44,9 % paskutinio žmonijos egzamino – didelio kalbos modelio etalono, kurį sudaro 2 500 klausimų iš įvairių dalykų ir viršija GPT-5 41,7 %.

Modelis taip pat pasiekė 60,2 % pagal BrowseComp etaloną, kuris įvertina didelių kalbos modelių agentų žiniatinklio naršymo įgūdžius ir informacijos ieškojimo atkaklumą, ir surinko 56,3 %, pirmaujantis pagal Seal-0 etaloną, skirtą mesti iššūkį paieška papildytiems modeliams pagal realių tyrimų užklausas.

VentureBeat pranešė, kad visiškai atviro svorio išleidimo susitikimas arba GPT-5 balų viršijimas žymi lūžio tašką, kai atotrūkis tarp uždarų sienų sistemų ir viešai prieinamų modelių iš esmės sumažėjo dėl aukščiausios klasės samprotavimų ir kodavimo.

Kimi K2 Thinking yra naujas pirmaujantis atvirų svorių modelis: jis demonstruoja ypatingą jėgą agentų kontekste, tačiau yra labai vaizdingas, generuodamas daugiausiai žetonų iš bet kurio modelio užbaigiant mūsų intelekto indekso įvertinimus.@Kimi_MoonshotKimi K2 Thinking pasiekė 67… pic.twitter.com/m6SvpW7iif

— Dirbtinė analizė (@ArtificialAnlys) 2025 m. lapkričio 7 d

Kainų efektyvumas kelia klausimų

Modelio populiarumas išaugo po to, kai CNBC pranešė, kad jo mokymo kaina siekė tik 4,6 mln. JAV dolerių, nors „Moonshot AI“ nekomentavo išlaidų. Remiantis skaičiavimais, „South China Morning Post“.Kimi K2 Thinking taikomųjų programų programavimo sąsajos kaina buvo nuo šešių iki 10 kartų pigesnė nei OpenAI ir Anthropic modelių.

Modelis naudoja Mixture-of-Experts architektūrą su vienu trilijonu iš viso parametrų, iš kurių 32 milijardai suaktyvinami vienai išvadai, ir buvo apmokytas naudojant INT4 kvantavimą, kad būtų pasiektas maždaug du kartus didesnis kartos greitis, išlaikant naujausią našumą.

Thomas Wolf, Hugging Face įkūrėjas, pakomentavo X, kad Kimi K2 Thinking buvo dar vienas atvirojo kodo modelio atvejis, kai praeina uždarojo kodo modelis, ir paklausė: „Ar tai dar vienas „DeepSeek“ momentas? Ar dabar turėtume tikėtis (vieno) kas porą mėnesių?

Techninės galimybės ir apribojimai

Moonshot AI tyrėjai teigė, kad Kimi K2 Thinking nustatė „naujų etalonų rekordus, įvertinančius samprotavimo, kodavimo ir agento galimybes“. Modelis gali atlikti iki 200–300 nuoseklių įrankių iškvietimų be žmogaus įsikišimo, nuosekliai samprotaujant šimtuose žingsnių, kad išspręstų sudėtingas problemas.

Konsultacinės bendrovės „Artificial Analysis“ atliktas nepriklausomas testavimas padėjo „Kimi K2“ viršyti savo „Tau-2 Bench Telecom“ agentų etaloną 93 % tikslumu, o tai buvo apibūdinta kaip aukščiausias nepriklausomai išmatuotas balas.

Tačiau Nathanas Lambertas, Alleno dirbtinio intelekto instituto tyrėjas, teigė, kad tarp geriausių uždarų ir atvirų modelių vis dar yra maždaug keturių–šešių mėnesių laiko tarpas, nors jis pripažino, kad Kinijos laboratorijos artėja prie pagrindinių etalonų ir veikia labai stipriai.

Rinkos pasekmės ir konkurencinis spaudimas

Pekine dirbantis informacinių technologijų sistemų architektas Zhangas Ruiwangas teigė, kad Kinijos įmonės mažino sąnaudas ir paaiškino: „Bendras Kinijos modelių našumas vis dar atsilieka nuo geriausių JAV modelių, todėl jie turi konkuruoti ekonomiškumo sferoje, kad rastų išeitį.

Zhang Yi, vyriausiasis konsultacinės bendrovės iiMedia analitikas, teigė, kad Kinijos dirbtinio intelekto modelių mokymo sąnaudos sumažėjo dėl modelių architektūros ir mokymo technikos naujovių ir kokybiškų mokymo duomenų įvedimo, o tai rodo perėjimą nuo kompiuterinių išteklių kaupimo ankstyvosiomis dienomis.

Modelis buvo išleistas pagal modifikuotą MIT licenciją, suteikiančią visas komercines ir išvestines teises su vienu apribojimu: diegėjai, aptarnaujantys daugiau nei 100 milijonų aktyvių naudotojų per mėnesį arba gaunantys daugiau nei 20 milijonų JAV dolerių per mėnesį pajamų, produkto vartotojo sąsajoje turi aiškiai parodyti „Kimi K2“.

Pramonės reakcija ir ateities perspektyvos

Deedy Das, ankstyvosios stadijos rizikos kapitalo įmonės „Menlo Ventures“ partneris, įraše X parašė, kad „Šiandien yra lūžio taškas dirbtinio intelekto srityje. Kinijos atvirojo kodo modelis yra #1. Pagrindinis momentas AI“.

🚨 Šiandien yra posūkio taškas dirbtinio intelekto srityje. Kinijos atvirojo kodo modelis yra #1.

Kimi K2 Thinking per paskutinį žmonijos egzaminą surinko 51 %, tai yra daugiau nei GPT-5 ir visi kiti modeliai. 0,6 USD/M, išėjimas 2,5 USD/M.

Geriausiai rašo ir daro 15 tps dviem „Mac M3 Ultra“!

Pagrindinis AI momentas.

Išbandykite… pic.twitter.com/fmxlxpCGbE

— Deedy (@deedydas) 2025 m. lapkričio 7 d

Nathanas Lambertas „Substack“ straipsnyje rašė, kad Kinijos atvirojo kodo AI kūrėjų, įskaitant „Moonshot AI“ ir „DeepSeek“, sėkmė parodė, kaip jie „privertė uždaras laboratorijas prakaituoti“, pridūrė: „Yra rimtas kainų spaudimas ir lūkesčiai, kuriuos (JAV kūrėjai) turi valdyti“.

Išleidimas „Moonshot AI“ pozicionuoja kartu su kitomis Kinijos AI įmonėmis, tokiomis kaip „DeepSeek“, „Qwen“ ir „Baichuan“, kurios vis labiau meta iššūkį Amerikos AI viršenybės pasakojimui dėl ekonomiškai efektyvių inovacijų ir atvirojo kodo plėtros strategijų.

Nesvarbu, ar tai yra tvarus konkurencinis pranašumas, ar laikinas pajėgumų konvergencija, dar reikia išsiaiškinti, nes tiek JAV, tiek Kinijos įmonės toliau tobulina savo modelius.

viešas pareiškimų pobūdis ir rinkos reakcija rodo, kad netrukus gali prasidėti esminės diskusijos.

AI lusto kraštovaizdis įžengia į svyravimo laikotarpį. Organizacijos turėtų išlaikyti lankstumą savo infrastruktūros strategijoje ir stebėti, kaip tokios partnerystės kaip „Tesla-Intel“ gali pakeisti AI techninės įrangos gamybos konkurencinę dinamiką.

Šiandien priimti sprendimai dėl lustų gamybos partnerysčių gali nustatyti, kurios organizacijos ateinančiais metais turės prieigą prie ekonomiškai efektyvios, našios AI infrastruktūros.

Moonshot AI nuotrauka)

Taip pat žiūrėkite: „DeepSeek“ sutrikimas: Kinijos AI naujovės sumažina pasaulinę technologijų atskirtį

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Šis išsamus renginys yra TechEx dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.

Source link

Našumo metrika meta iššūkį JAV modeliams

Kainų efektyvumas kelia klausimų

Techninės galimybės ir apribojimai

Rinkos pasekmės ir konkurencinis spaudimas

Pramonės reakcija ir ateities perspektyvos

Susiję įrašai

„NVIDIA GPUS“ „Oracle“ naujos kartos įmonės AI paslaugos „Power“

„Google“ siekia uždėti AI agentą ant kiekvieno stalo

„Resham Kotecha“, „Open Data Institute“: kaip ES gali vadovauti AI