„Deepseek“ planas išmokyti savo naują AI modelį „R2“ „Huawei“ „Ascend“ lustuose nepavyko ir privertė atsitraukti į NVIDIA, atidėdamas paleidimą.
Ištisus mėnesius Pekino pasakojimas buvo vienas iš nesustabdomų technologinės pažangos ir žygis į savarankiškumą. Tačiau realybė turi įprotį sukramtyti. Naujausios kinų AI Darling Deepseek bėdos yra vadovėlio pavyzdys, kur ambicijos atitinka kietą techninių apribojimų sieną.
Po sėkmingo sausio mėnesio savo R1 modelio pristatymo, „Deepseek“ patiria spaudimą iš Kinijos, kad būtų galima čempionas nacionalinei priežastims. Anot trijų žmonių, kalbančių su „Financial Times“, žinia buvo aiški: naudokite Huawei lustus, o ne „Nvidia“.
Kai reikėjo iš tikrųjų išmokyti savo naują R2 modelį, šaltiniai sako, kad „Deepseek“ susidūrė su „nuolatinėmis techninėmis problemomis“ su „Huawei“ AI mikroschemomis. Problemos buvo tokios esminės, kad projektas buvo sustabdytas. Asmuo, turintis žinių apie situaciją, teigė, kad tai buvo pagrindinė priežastis, dėl kurios planuojamas modelio paleidimas gegužės mėn. Buvo atiduotas į metalo laužą, o įmonė buvo pakelta ant užpakalinės kojos į rinką, kuri laukia niekuo.
Norėdami suprasti, kodėl tai yra toks didelis dalykas, turite žinoti skirtumą tarp AI mokymo ir išvadų. Mokymai yra sunki dalis, pavyzdžiui, studento siuntimas į universitetą ilgus metus intensyvaus mokymosi. Tam reikia didžiulio galios ir stabilumo. Išvada yra palyginti „lengva“ dalis, pavyzdžiui, užduoti absolventą klausimą.
Deepseekas sužinojo, kad nors Huawei žetonai gali būti pasirengę baigiamojo egzaminui, jie dar nebuvo iki varginančio universiteto kursų. Bendrovė neturėjo kito pasirinkimo, kaip tik pereiti prie galingų „NVIDIA“ sistemų mokymui. Šaltiniai teigia, kad „Deepseek“ komanda vis dar bando priversti R2 modelį dirbti su „Huawei Chips“, kad būtų mažiau reiklios išvados etapo.
Du žmonės patvirtino, kad „Huawei“ netgi išsiuntė savo inžinierių komandą į „Deepseek“ biurus, kad padėtų jiems sukurti R2 modelį ir paleisti ant žetonų. Bet net ir su kambario ekspertais jie negalėjo sėkmingai treniruotis.
Pasikalbėkite su bet kuo pramonės srityje ir jie jums pasakys, kad tai nėra didžiulė staigmena. „Huawei“ generalinis direktorius Renas Zhengfei net šių metų pradžioje teigė, kad JAV „perdėta„ Huawei “laimėjimai“ ir įmonė „dar nėra tokia puiki“, pažymint, kad geriausi jos lustai vis dar atsilieka.
Tačiau Pekinas vis dar aktyviai verčia savo technologijų milžinus, kad galėtų pirmenybę teikti vietos aparatinei įrangai, o „Financial Times“ praneša, kad įmonės dabar turi pateisinti NVIDIA eksporto reikalavimus atitinkančio H20 mikroschemą. Tai yra dalis strategijos, kaip sukurti vidaus čempioną, tačiau tai gali priversti įmones pasirinkti techniškai ir nepalankesnius sprendimus.
Be problemų, susijusių su „Huawei“ lustų naudojimu treniruotėms, „Deepseek“ įkūrėjas Liang Wenfeng pranešė, kad savo komandai sakė, kad jis nepatenkintas bendra pažanga link R2 modelio. Sakoma, kad jis verčia juos siekti aukštesnio lygio ir sukurti tai, kas gali išlaikyti kompaniją tarp AI pramonės lyderių.
Dėl visų direktyvų iš viršaus į apačią ir nacionalinį pasididžiavimą vis dar galioja inžinerijos įstatymai. „Deepseek“ istorija yra priminimas, kad pasaulinėse AI viršenybės lenktynėse nėra nuorodų. Kinija žaidžia ilgą žaidimą, tačiau kol kas spektaklio karūna išlieka tvirtai ant Nvidijos galvos.
Taip pat žiūrėkite: Renas Zhengfei: Kinijos AI ateitis ir ilgas Huawei žaidimas
Norite sužinoti daugiau apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite AI ir „Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra kartu su kitais pirmaujančiais renginiais, įskaitant intelektualią automatizavimo konferenciją, „BlockX“, „Skaitmeninės transformacijos savaitės“ ir „Cyber Security & Cloud Expo“.
Naršykite kitus būsimus „Enterprise Technology“ renginius ir internetinius seminarus, kuriuos maitina „TechForge“ čia.