DeepSeek V3.2 atitinka GPT-5 našumą su 90 % mažesnėmis treniruočių išlaidomis

Nors technologijų gigantai įdeda milijardus skaičiavimo galių, kad mokytų pažangius AI modelius, Kinijos „DeepSeek“ pasiekė panašių rezultatų dirbdama išmaniau, o ne sunkiau. DeepSeek V3.2 AI modelis atitinka OpenAI GPT-5 samprotavimo etalonuose, nepaisant to, kad naudojamas „mažiau viso mokymo FLOP“ – tai proveržis, galintis pakeisti pramonės mąstymą apie pažangaus dirbtinio intelekto kūrimą.

Įmonėms šis leidimas parodo, kad paribių AI galimybėms nebūtina reikalauti paribių skaičiavimo biudžetų. Atvirojo kodo DeepSeek V3.2 prieinamumas leidžia organizacijoms įvertinti pažangias samprotavimo ir agentų galimybes, kartu išlaikant diegimo architektūros kontrolę – tai praktinis aspektas, nes sąnaudų efektyvumas tampa vis svarbesniu DI diegimo strategijų klausimu.

Hangdžou įsikūrusi laboratorija pirmadienį išleido dvi versijas: bazinę „DeepSeek V3.2“ ir „DeepSeek-V3.2-Speciale“, o pastaroji 2025 m. tarptautinėje matematikos olimpiadoje ir tarptautinėje informatikos olimpiadoje laimėjo aukso medalius – etalonus anksčiau pasiekė tik neišleistos JAV AI vidiniai modeliai.

Šis pasiekimas yra ypač svarbus, atsižvelgiant į ribotą „DeepSeek“ prieigą prie pažangių puslaidininkinių lustų dėl eksporto apribojimų.

Turinys:

Išteklių efektyvumas kaip konkurencinis pranašumas

„DeepSeek“ pasiekimas prieštarauja vyraujančiai pramonės prielaidai, kad pažangiam AI našumui reikia labai keisti skaičiavimo išteklius. Bendrovė šį efektyvumą priskiria architektūrinėms naujovėms, ypač „DeepSeek Sparse Attention“ (DSA), kuri žymiai sumažina skaičiavimo sudėtingumą ir išsaugo modelio našumą.

Bazinis DeepSeek V3.2 AI modelis pasiekė 93,1 % tikslumą sprendžiant AIME 2025 matematikos uždavinius ir Codeforces įvertinimą 2386, todėl jis buvo vertinamas kartu su GPT-5 samprotavimo etalonuose.

Speciale variantas buvo dar sėkmingesnis: 2025 m. Amerikos kvietimo matematikos egzaminas (AIME) surinko 96,0 proc., 2025 m. vasario mėn. Harvardo-MIT matematikos turnyre (HMMT) – 99,2 proc., o 2025 m. tarptautinėje matematikos olimpinėje olimpinėje ir informatikos olimpinėje žaidynėse buvo aukso medalis.

Rezultatai yra ypač reikšmingi, atsižvelgiant į ribotą „DeepSeek“ prieigą prie muitų ir eksporto apribojimų, turinčių įtakos Kinijai. Techninėje ataskaitoje atskleidžiama, kad bendrovė skyrė skaičiavimo biudžetą po treniruotės, viršijantį 10% išankstinių mokymų išlaidų – tai didelė investicija, suteikusi galimybę įgyti pažangių gebėjimų per sustiprintą mokymosi optimizavimą, o ne taikant brutalią jėgą.

Techninių inovacijų vairavimo efektyvumas

DSA mechanizmas yra nukrypimas nuo tradicinių dėmesio architektūrų. Užuot apdoroję visus prieigos raktus vienodu skaičiavimo intensyvumu, DSA naudoja „žaibo indeksavimo priemonę“ ir smulkų žetonų atrankos mechanizmą, kuris identifikuoja ir apdoroja tik svarbiausią kiekvienos užklausos informaciją.

Šis metodas sumažina pagrindinio dėmesio sudėtingumą nuo O(L²) iki O(Lk), kur k reiškia pasirinktų žetonų skaičių – viso sekos ilgio L dalį. Tęsdama išankstinį mokymą iš DeepSeek-V3.1-Terminus kontrolinio taško, įmonė apmokė DSA naudoti 943,7 milijardo žetonų, naudodama 480 sekų po 128 K žetonų mokymo žingsnyje.

Architektūra taip pat pristato konteksto valdymą, pritaikytą įrankių iškvietimo scenarijams. Skirtingai nuo ankstesnių samprotavimų modelių, kuriuose mąstymo turinys buvo atmestas po kiekvieno vartotojo pranešimo, DeepSeek V3.2 AI modelis išsaugo samprotavimo pėdsakus, kai pridedami tik su įrankiu susiję pranešimai, o tai pagerina žetonų efektyvumą kelių posūkių agento darbo eigose, pašalindamas perteklinį pakartotinį samprotavimą.

Įmonės programos ir praktinis veikimas

Organizacijoms, vertinančioms AI įgyvendinimą, „DeepSeek“ metodas suteikia konkrečių pranašumų, viršijančių lyginamuosius balus. „Terminal Bench 2.0“, kuris įvertina kodavimo darbo eigos galimybes, „DeepSeek V3.2“ pasiekė 46,4 % tikslumą.

Modelis surinko 73,1 % SWE-Verified, programinės įrangos inžinerijos problemų sprendimo etalono, ir 70,2 % SWE Multilingual, demonstruodamas praktinį naudą kūrimo aplinkoje.

Atliekant agentines užduotis, kurioms reikia savarankiško įrankių naudojimo ir kelių žingsnių samprotavimo, modelis parodė reikšmingus patobulinimus, palyginti su ankstesnėmis atvirojo kodo sistemomis. Bendrovė sukūrė didelio masto agentų užduočių sintezės vamzdyną, kuris sugeneravo daugiau nei 1 800 skirtingų aplinkų ir 85 000 sudėtingų raginimų, leidžiančius modeliui apibendrinti samprotavimo strategijas nepažįstamiems įrankių naudojimo scenarijams.

„DeepSeek“ sukūrė atvirojo kodo bazinį V3.2 modelį „Hugging Face“, leisdama įmonėms jį įdiegti ir pritaikyti be priklausomybės nuo pardavėjo. „Speciale“ variantas išlieka pasiekiamas tik per API dėl didesnių prieigos raktų naudojimo reikalavimų – tai kompromisas tarp maksimalaus našumo ir diegimo efektyvumo.

Pramonės reikšmė ir pripažinimas

Šis leidimas sukėlė didelę diskusiją AI tyrimų bendruomenėje. Susan Zhang, pagrindinė „Google DeepMind“ tyrimų inžinierė, gyrė išsamią „DeepSeek“ techninę dokumentaciją, ypač pabrėždama įmonės darbą, stabilizuojantį modelius po mokymo ir didinant agentų galimybes.

Nervų informacijos apdorojimo sistemų konferencijos laikas padidino dėmesį. Florianas Brandas, Kinijos atvirojo kodo AI ekosistemos ekspertas, dalyvaujantis NeurIPS San Diege, pastebėjo tiesioginę reakciją: „Visi grupės pokalbiai šiandien buvo pilni po DeepSeek pranešimo.

Pripažinti apribojimai ir vystymosi kelias

„DeepSeek“ techninėje ataskaitoje nagrinėjami dabartiniai trūkumai, palyginti su pažangiais modeliais. Žetonų efektyvumas išlieka sudėtingas – DeepSeek V3.2 AI modeliui paprastai reikia ilgesnės kartos trajektorijos, kad atitiktų tokių sistemų kaip „Gemini 3 Pro“ išvesties kokybę. Bendrovė taip pat pripažįsta, kad pasaulinės žinios atsilieka nuo pirmaujančių patentuotų modelių dėl mažesnio bendro mokymo skaičiavimo.

Ateities plėtros prioritetai apima išankstinio mokymo skaičiavimo išteklių mastelį, siekiant išplėsti žinias apie pasaulį, motyvavimo grandinės efektyvumo optimizavimą, siekiant pagerinti žetonų naudojimą, ir sudėtingų problemų sprendimo užduočių pagrindų architektūros tobulinimą.

Taip pat žiūrėkite: AI verslo realybė – ką turi žinoti įmonių vadovai

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.

Source link

Išteklių efektyvumas kaip konkurencinis pranašumas

Techninių inovacijų vairavimo efektyvumas

Įmonės programos ir praktinis veikimas

Pramonės reikšmė ir pripažinimas

Pripažinti apribojimai ir vystymosi kelias

Susiję įrašai

Darbo jėgos nerimo mažinimas siekiant sėkmingai integruoti dirbtinį intelektą

Samdymas Spree atskleidžia AI pardavimo karą

„Žmogaus-kilpos“ darbas skatina AI maitinantį „Alibaba“ išmaniuosius akinius