Ar Kinija gali atitikti „Nvidia“ AI GPU?

Lustų sukrovimo strategija iškyla kaip naujoviškas Kinijos atsakas į JAV puslaidininkių apribojimus, tačiau ar šis metodas iš tikrųjų gali panaikinti pažangių Nvidia GPU našumo atotrūkį? Vašingtonui griežtinant pažangiausių lustų gamybos technologijų eksporto kontrolę, Kinijos mokslininkai siūlo drąsų sprendimą: sudėkite senesnius, šalyje gaminamus lustus, kad atitiktų lustų, kurių jie nebegali pasiekti, našumą.

Turinys:

Pagrindinė koncepcija: kurti aukštyn, o ne pirmyn

Lustų sukrovimo strategija grindžiama apgaulingai paprasta prielaida – jei negalite pagaminti pažangesnių lustų, kurkite išmanesnes sistemas su lustais, kuriuos galite pagaminti. Wei Shaojun, Kinijos puslaidininkių pramonės asociacijos viceprezidentas ir Tsinghua universiteto profesorius, neseniai South China Morning Post pristatė architektūrą, kuri sujungia 14 nanometrų loginius lustus su 18 nanometrų DRAM, naudojant trimatį hibridinį ryšį.

Tai svarbu, nes JAV eksporto kontrolė konkrečiai nukreipta į loginių lustų, kurių bangų dažnis yra 14 nm ir mažesnis, ir DRAM 18 nm ir mažesnio dažnio gamybai. Wei pasiūlymas veikia būtent ties šiomis technologinėmis ribomis, naudojant procesus, kurie išlieka prieinami Kinijos gamintojams.

Techninis požiūris apima tai, kas vadinama „programinės įrangos apibrėžtu beveik atminties skaičiavimu“. Vietoj to, kad duomenys būtų maišomi pirmyn ir atgal tarp procesorių ir atminties – pagrindinė AI darbo krūvio kliūtis – taikant lustų kaupimo strategiją jie yra labai arti per vertikalią kaupimą.

3D hibridinio sujungimo technika sukuria tiesiogines vario ir vario jungtis mažesniais nei 10 mikrometrų žingsniais, iš esmės pašalinant fizinį atstumą, kuris sulėtina įprastines lustų architektūras.

Veiklos reikalavimai ir tikrovės patikrinimas

Wei teigia, kad ši konfigūracija galėtų konkuruoti su Nvidia 4 nm GPU, tuo pačiu žymiai sumažindama išlaidas ir energijos sąnaudas. Jis nurodė 2 TFLOPS vienam vatui našumo rodiklius ir iš viso 120 TFLOPS. Yra tik viena problema: „Nvidia“ A100 GPU, kurį „Wei“ laiko palyginimo tašku, iš tikrųjų užtikrina iki 312 TFLOPS – daugiau nei 2,5 karto daugiau nei teigiama.

Šis neatitikimas išryškina klausimą dėl lustų sukrovimo strategijos pagrįstumo. Nors architektūrinės naujovės yra tikros, veiklos spragų išlieka didelių. Senesnių lustų sudėjimas stebuklingai nepanaikina pažangių proceso mazgų pranašumų, kurie užtikrina didesnį energijos vartojimo efektyvumą, didesnį tranzistorių tankį ir geresnes šilumines charakteristikas.

Kodėl Kinija lažinasi dėl šio požiūrio

Strateginė lustų kaupimo strategijos logika apima ne tik našumo metriką. „Huawei“ įkūrėjas Renas Zhengfei išsakė filosofiją, kaip pasiekti „pažangiausią našumą sudedant ir sugrupuojant lustus, o ne konkuruojant mazgui už mazgą“. Tai reiškia, kad Kinija sprendžia puslaidininkių iššūkį.

Apsvarstykite alternatyvas. TSMC ir Samsung siekia 3 nm ir 2 nm procesų, kurie Kinijos gamintojams lieka visiškai nepasiekiami. Užuot kovoję neįveikiamą kovą dėl proceso mazgo lyderystės, lustų kaupimo strategija siūlo konkuruoti dėl sistemos architektūros ir programinės įrangos optimizavimo.

Taip pat yra CUDA problema. „Nvidia“ dominavimas dirbtinio intelekto skaičiavime priklauso ne tik nuo aparatinės įrangos, bet ir nuo jos CUDA programinės įrangos ekosistemos. Wei tai apibūdina kaip „trigubą priklausomybę“, apimančią modelius, architektūras ir ekosistemas.

Kinijos lustų dizaineriai, besilaikantys tradicinės GPU architektūros, turėtų arba atkartoti CUDA funkcijas, arba įtikinti kūrėjus atsisakyti brandžios, plačiai priimtos platformos. Lustų kaupimo strategija, siūlanti visiškai kitokią skaičiavimo paradigmą, suteikia galimybę išvengti šios priklausomybės.

Galimybių klausimas

Ar lustų sukrovimo strategija iš tikrųjų gali veikti? Techniniai pagrindai yra tvirti – 3D lustų krovimas jau naudojamas didelio pralaidumo atmintyje ir pažangiuose pakavimo sprendimuose visame pasaulyje. Naujovė yra šių metodų taikymas kuriant visiškai naujas skaičiavimo architektūras, o ne tiesiog tobulinant esamus dizainus.

Tačiau yra keletas didelių iššūkių. Pirma, šilumos valdymas tampa labai sunkesnis, kai sukraunami keli aktyvūs apdorojimo štampai. 14 nm lustų generuojama šiluma yra žymiai didesnė nei šiuolaikiniai 4 nm ar 5 nm procesai, o krovimas padidina problemą.

Antra, 3D krovimo išeigą labai sunku optimizuoti – bet kurio sluoksnio defektas gali pažeisti visą krūvą. Trečia, programinės įrangos ekosistema, reikalinga norint efektyviai naudoti tokias architektūras, dar neegzistuoja ir prireiks metų.

Realiausias įvertinimas yra tai, kad lustų sukrovimo strategija yra tinkamas metodas tam tikriems darbo krūviams, kai atminties pralaidumas yra svarbesnis nei neapdorotas skaičiavimo greitis. Gali būti naudingos dirbtinio intelekto užduotys, tam tikros duomenų analizės operacijos ir specializuotos programos. Tačiau „Nvidia“ našumo suderinimas atliekant visą AI mokymo ir išvadų užduočių spektrą išlieka tolimas tikslas.

Ką tai reiškia AI lustų karams

Lustų sudėjimo strategijos, kaip Kinijos puslaidininkių kūrimo židinio taško, atsiradimas rodo strateginį posūkį. Užuot bandydama atkartoti vakarietiškus lustų dizainus su prastesniais proceso mazgais, Kinija tiria architektūrines alternatyvas, atitinkančias esamas gamybos pranašumus.

Vis dar neaišku, ar naudojant lustų kaupimo strategiją pavyks užpildyti „Nvidia“ našumo atotrūkį. Akivaizdu, kad Kinijos puslaidininkių pramonė prisitaiko prie apribojimų, siekdama naujovių tose srityse, kuriose eksporto kontrolė turi mažesnį poveikį – sistemos projektavimas, pakavimo technologija ir programinės įrangos bei aparatinės įrangos bendras optimizavimas.

Pasaulinei AI pramonei tai reiškia, kad konkurencinė aplinka tampa sudėtingesnė. Dabartinis „Nvidia“ dominavimas susiduria su tradicinių konkurentų, tokių kaip AMD ir „Intel“, iššūkiais ir visiškai naujais architektūriniais metodais, kurie gali iš naujo apibrėžti, kaip atrodo „AI lustas“.

Lustų kaupimo strategija, kad ir kokie būtų dabartiniai jos apribojimai, atspindi būtent tokį architektūrinį sutrikimą – todėl verta atidžiai stebėti.

Taip pat žiūrėkite: Naujasis „Nvidia Blackwell“ lustas, skirtas Kinijai, gali aplenkti H20 modelį

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.

Source link

Pagrindinė koncepcija: kurti aukštyn, o ne pirmyn

Veiklos reikalavimai ir tikrovės patikrinimas

Kodėl Kinija lažinasi dėl šio požiūrio

Galimybių klausimas

Ką tai reiškia AI lustų karams

Susiję įrašai

„Tesla“ ir „Intel“ lustų partnerystė: 10% „Nvidia“ kainos

Singularity Compute pristato Švedijos GPU klasterį, esant AI infrastruktūros krizei

Draudikai nukreipia AI strategiją prie pagrindinės rizikos draudimo