Kai AI duomenų centrai pasiekia erdvės ribas: naujas „NVIDIA“ pataisymas


Kai AI duomenų centruose baigėsi vietos, jie susiduria su brangia dilema: pastatykite didesnes įrenginius arba raskite būdų, kaip padaryti kelias vietas sklandžiai. Naujausia „NVIDIA“ „Spectrum-XGS Ethernet“ technologija žada išspręsti šį iššūkį sujungdama AI duomenų centrus per didelius atstumus į tai, ką įmonė vadina „giga mastelio AI super faktorytoriais“.

Paskelbta prieš „Hot Chips 2025“, ši tinklo naujovė atspindi bendrovės atsakymą į augančią problemą, verčiančią AI pramonę pergalvoti, kaip skaičiavimo galia paskirstoma.

Problema: kai vieno pastato nepakanka

Kadangi dirbtinio intelekto modeliai tampa sudėtingesni ir reikalaujantys, jiems reikia didžiulės skaičiavimo galios, kuri dažnai viršija tai, ką gali suteikti bet kuris vienas objektas. Tradiciniai AI duomenų centrai susiduria su galios talpos, fizinės erdvės ir aušinimo galimybių apribojimais.

Kai įmonėms reikia daugiau apdorojimo galios, paprastai jos turi sukurti visiškai naujas įrenginius, tačiau dėl tinklo apribojimų buvo problemiška darbų koordinavimas tarp atskirų vietų. Problema slypi standartinėje Ethernet infrastruktūroje, kuri kenčia nuo didelio vėlavimo, nenuspėjamų našumo svyravimų (vadinamų „jitter“) ir nenuoseklu duomenų perdavimo greičiu, kai jungiama tolimose vietose.

Dėl šių problemų AI sistemoms sunku efektyviai paskirstyti sudėtingus skaičiavimus keliose vietose.

NVIDIA sprendimas: „Scale-Across“ technologija

„Spectrum-XGS Ethernet“ pristato tai, ką „NVIDIA“ termina „mastelio-across“ galimybes-trečiąjį požiūrį į AI skaičiavimą, kuris papildo esamą „mastelio kaupimą“ (paverčiant atskirus procesorius galingesnius) ir „mastelio išstūmimą“ (pridedant daugiau procesorių toje pačioje vietoje).

Ši technologija integruota į esamą „NVIDIA“ „Spectrum-X Ethernet“ platformą ir apima keletą pagrindinių naujovių:

  • Atstumo pritaikymo algoritmai Tai automatiškai sureguliuoja tinklo elgseną pagal fizinį atstumą tarp įrenginių
  • Išplėstinė spūsčių kontrolė Tai apsaugo
  • Tikslus latentinis valdymas užtikrinti nuspėjamo reagavimo laiką
  • Telemetrija nuo galo iki galo realaus laiko tinklo stebėjimui ir optimizavimui

Remiantis „NVIDIA“ pranešimu, šie patobulinimai gali „beveik dvigubai padidinti NVIDIA kolektyvinės komunikacijos bibliotekos našumą“, kuri tvarko ryšį tarp kelių grafikos apdorojimo įrenginių (GPU) ir skaičiavimo mazgų.

Realaus pasaulio įgyvendinimas

„CoreWeave“, debesų infrastruktūros įmonė, specializuojanti GPU pagreitintą skaičiavimą, planuoja būti tarp pirmųjų „Spectrum-XGS Ethernet“ priėmėjų.

„Su„ NVIDIA Spectrum-XGS “galime sujungti savo duomenų centrus į vieną vieningą superkompiuterį, suteikdami klientams prieigą prie GIGA mastelio AI, kuris paspartins kiekvienos pramonės šakos proveržį“,-sakė Peteris Salanki, „CoreWeave“ įkūrėjas ir vyriausiasis technologijų pareigūnas.

Šis dislokavimas bus praktinis bandymas, ar ši technologija gali įvykdyti pažadus realiomis sąlygomis.

Pramonės kontekstas ir padariniai

Skelbimas seka daugybę į tinklą orientuotų leidimų iš NVIDIA, įskaitant originalią „Spectrum-X“ platformą ir „Quantum-X“ silicio fotonikos jungiklius. Šis modelis rodo, kad įmonė pripažino tinklų kūrimo infrastruktūrą kaip kritinę AI kūrimo kliūtį.

„Čia yra AI pramonės revoliucija, o milžiniškos masto AI gamyklos yra esminė infrastruktūra“,-pranešime spaudai sakė Jensen Huang, NVIDIA įkūrėjas ir generalinis direktorius. Nors Huango apibūdinimas atspindi NVIDIA rinkodaros perspektyvą, AI pramonėje pripažįstamas pagrindinis iššūkis, kurį jis apibūdina – reikia daugiau skaičiavimo pajėgumų.

Ši technologija gali turėti įtakos AI duomenų centrų planuojamiems ir valdomiems. Užuot pastatę didžiules pavienes įrenginius, kurie tempia vietinius elektros tinklus ir nekilnojamojo turto rinkas, įmonės gali paskirstyti savo infrastruktūrą keliose mažesnėse vietose, išlaikydamos našumo lygį.

Techniniai aspektai ir apribojimai

Tačiau keli veiksniai gali įtakoti „Spectrum-XGS Ethernet“ praktinį veiksmingumą. Tinklo našumas dideliais atstumais išlieka fiziniai apribojimai, įskaitant šviesos greitį ir pagrindinės interneto infrastruktūros kokybę tarp vietų. Technologijos sėkmė daugiausia priklausys nuo to, kaip gerai ji gali veikti atsižvelgiant į šiuos suvaržymus.

Be to, paskirstytų AI duomenų centrų valdymo sudėtingumas apima ne tik tinklų kūrimą, kad apimtų duomenų sinchronizaciją, toleranciją gedimams ir reguliavimo laikymosi skirtingose ​​jurisdikcijose – tai, kad vien tik tinklo tobulinimas negali išspręsti.

Prieinamumas ir poveikis rinkai

„NVIDIA“ teigia, kad „Spectrum-XGS Ethernet“ yra „dabar prieinamas“ kaip „Spectrum-X“ platformos dalis, nors kainų nustatymo ir konkrečių diegimo tvarkaraščiai nebuvo atskleisti. Technologijos įvaikinimo lygis greičiausiai priklausys nuo ekonominio efektyvumo, palyginti su alternatyviais metodais, tokiais kaip didesnių vienos vietos įrenginių kūrimas ar esamų tinklų sprendimų naudojimas.

Esmė vartotojams ir įmonėms yra tokia: jei „Nvidia“ technologija veikia kaip pažadėta, mes galime pamatyti greitesnes AI paslaugas, galingesnes programas ir potencialiai mažesnes išlaidas, nes įmonės įgyja efektyvumo paskirstytoje skaičiavime. Tačiau jei technologija nepavyks pristatyti realaus pasaulio sąlygų, PG įmonės ir toliau susidurs su brangiu pasirinkimu tarp vis didesnių vienkartinių įrenginių pastato ar priimdamos kompromisus.

Būsimas „CoreWeave“ diegimas bus pirmasis pagrindinis išbandymas, ar jungiantis AI duomenų centrus visais atstumais gali iš tikrųjų veikti mastu. Rezultatai greičiausiai lems, ar kitos įmonės seka pavyzdžiu, ar laikosi tradicinių metodų. Kol kas „Nvidia“ pateikė ambicingą viziją, tačiau AI pramonė vis dar laukia, ar realybė atitinka pažadą.

Taip pat žiūrėkite: Nauja „Nvidia Blackwell Chip“, skirta Kinijai, gali peržengti H20 modelį

Norite sužinoti daugiau apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite AI ir „Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra kartu su kitais pirmaujančiais renginiais, įskaitant intelektualią automatizavimo konferenciją, „BlockX“, „Skaitmeninės transformacijos savaitės“ ir „Cyber ​​Security & Cloud Expo“.

Naršykite kitus būsimus „Enterprise Technology“ renginius ir internetinius seminarus, kuriuos maitina „TechForge“ čia.



Source link

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -