„OpenAI Jalapeño“ lusto strategija

„OpenAI“ finansinė trajektorija labai priklauso nuo infrastruktūros sąnaudų – realybė, kuri paskatino naujojo „OpenAI Jalapeño“ lusto kūrimą. Sukurtas bendradarbiaujant su Broadcom, taikomosios programos integrinis grandynas (ASIC) yra tiesioginis bandymas sumažinti dideles kapitalo išlaidas, susijusias su trečiųjų šalių aparatine įranga.

Nors šiuo metu „Nvidia“ savo aukščiausios klasės procesorių pelno marža siekia 75%, „OpenAI“ dirba su mažesnėmis maržomis ir išlaiko maždaug 33 centus pelno už kiekvieną dolerį, susidariusį įvertinus didžiules veiklos išlaidas. Didelių kalbų modelių vykdymo finansinė našta yra didelė.

Praėjusiais metais „ChatGPT“ serverių reagavimas „OpenAI“ kainavo stulbinančius 8,4 mlrd. USD. Dabar platforma pritraukia 900 milijonų naudotojų per savaitę, todėl šiais metais šios veiklos sąnaudos turėtų siekti maždaug 14 milijardų JAV dolerių. Per ateinančius aštuonerius metus „OpenAI“ skyrė maždaug 1,4 trilijono JAV dolerių skaičiavimo galiai, o tai yra didžiulis statymas įmonei, šiuo metu generuojančiai 25 milijardus JAV dolerių metinių pajamų.

Turinys:

Aparatinės įrangos projektavimas LLM išvadai

„OpenAI Jalapeño“ lustas, pavadintas pirmuoju bendrovės „žvalgybos procesoriumi“, sukurtas specialiai didelės kalbos modelio (LLM) išvadoms, o ne bendrosios paskirties AI darbo krūviams. „OpenAI“ pateikė pagrindinį architektūrinį projektą, pagrįstą specifiniais modelių planais ir aptarnavimo sistemomis, o „Broadcom“ valdė silicio inžineriją ir didelio našumo tinklų integravimą.

TSMC tvarko fizinę gamybą Taivane, o Celestica pavesta kurti lentų ir stelažų sistemas. Remiantis „OpenAI“, ankstyvieji laboratoriniai pavyzdžiai jau atlieka neribotą darbo krūvį, įskaitant neišleistą GPT-5.3-Codex-Spark modelį, esant tiksliniam gamybos dažniui ir galiai.

Richardas Ho, OpenAI aparatinės įrangos programos vadovas, pažymėjo, kad architektūra sumažina duomenų judėjimą, kad realizuotas panaudojimas priartėtų prie teorinio didžiausio našumo. Skirtingai nuo bendrosios paskirties greitintuvų, pritaikytų pagal senus AI darbo krūvius, ši architektūra specialiai subalansuoja skaičiavimo, atminties ir tinklo išteklius, kad išspręstų duomenų judėjimo kliūtis, būdingas interaktyviam LLM aptarnavimui.

Kad tai būtų pasiekta plačiu mastu, platforma integruoja Broadcom Tomahawk tinklo silicį tiesiai į dizainą, todėl pasirinktiniai procesoriai gali bendrauti didžiulėse, sugrupuotose duomenų centrų aplinkose.

Vertikalus integracinis smagratis

Pereinant prie pritaikyto silicio, OpenAI iš vien programinės įrangos sluoksnio pereina į vertikaliai integruotą infrastruktūros įmonę^{. Ši pilno krūvos strategija apima visą dujotiekį: lusto architektūrą, programinės įrangos branduolius, atminties sistemas, tinklo planavimą ir galutinį taikymo sluoksnį.^{. Panašiai kaip Apple tvirtas patentuotos aparatinės įrangos ir iOS susiejimas, OpenAI dabar gali optimizuoti savo infrastruktūrą pagal tikslius vidinio modelio planus.^.}}

Ši integracija maitina nuolatinį smagratį^{. Padidėjęs infrastruktūros efektyvumas sumažina mokymo ir aptarnavimo modelių išlaidas^{. Įperkamesnis aptarnavimas leidžia sukurti geresnius, labiau reaguojančius produktus, o tai skatina vartotojų apimtį ir pajamas vėl investuoti į naujos kartos tinkintą infrastruktūrą.^.}}

Vėlyvojo pranašumo įveikimas

Pristatydama savo silicį, OpenAI patenka į aplinką, kurioje pagrindiniai konkurentai praleido beveik dešimtmetį kurdami patentuotą aparatinę įrangą. „Google“ pradėjo diegti savo „Tensor Processing Units“ (TPU) 2015 m. ir dabar valdo maždaug ketvirtadalį pasaulinių AI skaičiavimo pajėgumų už „Nvidia“ tiekimo grandinės ribų.

„Amazon“ išsiuntė daugiau nei vieną milijoną savo pasirinktinių lustų, o „Meta“ ir „Microsoft“ toliau plečia savo infrastruktūrą.

„Jalapeño yra mūsų ilgalaikės visos infrastruktūros strategijos dalis, kuria siekiama, kad skaičiavimai būtų gausesni“, – sakė Gregas Brockmanas, OpenAI prezidentas ir vienas iš įkūrėjų. „Patys sukūrę didesnę stekelio dalį, galime efektyviau aptarnauti daugiau išmanumo.

Norėdami užpildyti šią laiko juostos spragą, OpenAI paspartino kūrimo etapą. „OpenAI Jalapeño“ lustas iš tuščio lapo dizaino perėjo į gamybos juostos ištraukimą – paskutinį žingsnį prieš pradedant fizinę gamybą – vos per devynis mėnesius. Inžinierių komandos pasiekė šį terminą naudodamos OpenAI kalbos modelius, kad automatizuotų ir optimizuotų aparatinės įrangos projektavimo proceso dalis.

Tai sukuria unikalią grįžtamojo ryšio kilpą, kurioje vartotojams teikiami modeliai aktyviai naudojami kuriant fizinę infrastruktūrą, kuri veiks ateityje. Planuojama, kad pradinis aparatinės įrangos diegimas duomenų centruose prasidės 2026 m.

„Broadcom“ generalinis direktorius Hockas Tanas patvirtino, kad diegimas bus vykdomas kartu su infrastruktūros partneriais, įskaitant „Microsoft“, kad būtų pasirengta gigavatų masto duomenų centro integracijai.

(Nuotrauka OpenAI)

Taip pat žiūrėkite: „Omio“ plėtoja kelionių produktus naudodama OpenAI modelius

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra TechEx dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.

Source link

Aparatinės įrangos projektavimas LLM išvadai

Vertikalus integracinis smagratis

Vėlyvojo pranašumo įveikimas

Susiję įrašai

„City Union Bank“ atidaro dirbtinio intelekto centrą, kad palaikytų banko operacijas

„Kakao Mobility“ informacija 4 lygio autonominio vairavimo planas, skirtas fiziniam AI

„Commvault“ paleidžia „Ctrl-Z“ debesies AI darbo krūviams