Kaip kelių agentų AI ekonomika įtakoja verslo automatizavimą


Kelių agentų dirbtinio intelekto ekonomikos valdymas dabar lemia šiuolaikinių verslo automatizavimo darbo eigos finansinį gyvybingumą.

Organizacijos, peržengiančios standartines pokalbių sąsajas į kelių agentų programas, susiduria su dviem pagrindiniais apribojimais. Pirmas klausimas yra mąstymo mokestis; sudėtingi autonominiai agentai turi samprotauti kiekviename etape, todėl pasikliauti didžiulėmis architektūromis kiekvienai papildomai užduočiai yra per brangu ir lėta praktiniam naudojimui įmonėje.

Konteksto sprogimas veikia kaip antroji kliūtis; Šios išplėstinės darbo eigos sukuria iki 1500 procentų daugiau žetonų nei standartiniai formatai, nes kiekviena sąveika reikalauja iš naujo siųsti visą sistemos istoriją, tarpinius samprotavimus ir įrankių išvestis. Atliekant išplėstines užduotis, šis žetonų kiekis padidina išlaidas ir sukelia tikslo nukrypimą – scenarijų, kai agentai nukrypsta nuo pradinių tikslų.

Kelių agentų AI architektūrų įvertinimas

Siekdami įveikti šias valdymo ir efektyvumo kliūtis, aparatinės ir programinės įrangos kūrėjai išleidžia labai optimizuotus įrankius, skirtus tiesiogiai įmonės infrastruktūrai.

NVIDIA neseniai pristatė „Nemotron 3 Super“ – atvirą architektūrą su 120 milijardų parametrų (iš kurių 12 milijardų lieka aktyvūs), kuri yra specialiai sukurta vykdyti sudėtingas agentines AI sistemas.

Iš karto pasiekiama NVIDIA sistema sujungia pažangias samprotavimo funkcijas, kad padėtų autonominiams agentams efektyviai ir tiksliai atlikti užduotis, kad būtų pagerintas verslo automatizavimas. Sistema remiasi hibridine ekspertų mišinio architektūra, jungiančia tris pagrindines naujoves, užtikrinančias iki penkių kartų didesnį pralaidumą ir dvigubai didesnį nei ankstesnio Nemotron Super modelio tikslumą. Išvados metu tik 12 milijardų parametrų iš 120 milijardų yra aktyvūs.

Mamba sluoksniai suteikia keturis kartus didesnį atminties ir skaičiavimo efektyvumą, o standartiniai transformatorių sluoksniai valdo sudėtingus argumentavimo reikalavimus. Latentinė technika padidina tikslumą, kai generuojant žetonus už vieną kainą įdarbinami keturi ekspertai. Sistema taip pat numato kelis būsimus žodžius tuo pačiu metu, padidindama išvadų greitį tris kartus.

Veikdama Blackwell platformoje, architektūra naudoja NVFP4 tikslumą. Ši sąranka sumažina atminties poreikį ir daro išvadas iki keturių kartų greičiau nei FP8 konfigūracijos Hopper sistemose, neprarandant tikslumo.

Automatizavimo galimybių pavertimas verslo rezultatais

Sistema siūlo vieno milijono žetonų konteksto langą, leidžiantį agentams išlaikyti visą darbo eigos būseną atmintyje ir tiesiogiai spręsti tikslo nukrypimo riziką. Programinės įrangos kūrimo agentas gali įkelti visą kodų bazę į kontekstą vienu metu, įgalindamas kodo generavimą ir derinimą nereikalaujant dokumento segmentavimo.

Atlikdama finansinę analizę, sistema gali įkelti į atmintį tūkstančius puslapių ataskaitų, taip padidindama efektyvumą, nes nebereikia iš naujo samprotauti ilgų pokalbių metu. Didelio tikslumo įrankių iškvietimas užtikrina, kad autonominiai agentai patikimai naršytų didžiules funkcijų bibliotekas, užkertant kelią vykdymo klaidoms didelės svarbos aplinkose, pvz., autonominio saugumo koordinavimo kibernetinio saugumo srityje.

Pramonės lyderiai, įskaitant Amdocs, Palantir, Cadence, Dassault Systèmes ir Siemens, diegia ir pritaiko modelį, kad automatizuotų darbo eigą telekomunikacijų, kibernetinio saugumo, puslaidininkių projektavimo ir gamybos srityse.

Programinės įrangos kūrimo platformos, tokios kaip CodeRabbit, Factory ir Greptile, integruoja ją kartu su patentuotais modeliais, kad būtų pasiektas didesnis tikslumas mažesnėmis sąnaudomis. Gyvosios gamtos mokslų įmonės, tokios kaip „Edison Scientific“ ir „Lila Sciences“, naudos tai, kad palaikytų gilios literatūros paieškos, duomenų mokslo ir molekulinio supratimo agentus.

Ši architektūra taip pat leidžia AI-Q agentui užimti aukščiausią poziciją „DeepResearch Bench“ ir „DeepResearch Bench II“ pirmaujančiųjų sąrašuose, pabrėždama jo gebėjimą atlikti kelių etapų tyrimus dideliuose dokumentų rinkiniuose, išlaikant samprotavimų nuoseklumą.

Galiausiai, modelis užėmė aukščiausią vietą dirbtinės analizės srityje dėl efektyvumo ir atvirumo, pasižyminčiu didžiausiu tikslumu tarp tokio dydžio modelių.

Įgyvendinimas ir infrastruktūros derinimas

Sukurta atlikti sudėtingas papildomas užduotis kelių agentų sistemose, diegimo lankstumas išlieka verslo automatizavimo lyderių prioritetu.

NVIDIA išleido modelį su atvirais svoriais pagal leistiną licenciją, leisdama kūrėjams įdiegti ir pritaikyti jį darbo vietose, duomenų centruose ar debesų aplinkoje. Ji yra supakuota kaip NVIDIA NIM mikropaslauga, padedanti plačiai diegti nuo vietinių sistemų iki debesies.

Architektūra buvo apmokyta naudojant sintetinius duomenis, generuojamus pasienio samprotavimo modeliais. NVIDIA paskelbė visą metodiką, apimančią daugiau nei 10 trilijonų duomenų rinkinių prieš ir po mokymo, 15 mokymo aplinkų, skirtų sustiprinti mokymąsi, ir vertinimo receptus. Tyrėjai gali toliau tobulinti modelį arba sukurti savo naudodami NeMo platformą.

Bet kuris vykdytojas, planuojantis diegti skaitmeninimą, turi spręsti konteksto sprogimo ir mąstymo mokesčių problemas, kad būtų išvengta tikslo nukrypimo ir išlaidų viršijimo agentų darbo eigoje. Nustačius visapusišką architektūrinę priežiūrą, užtikrinama, kad šie sudėtingi agentai ir toliau atitiktų įmonės direktyvas, taip užtikrinant tvarų efektyvumo padidėjimą ir tobulinant verslo automatizavimą visoje organizacijoje.

Taip pat žiūrėkite: Ai2: fizinio AI kūrimas naudojant virtualius modeliavimo duomenis

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais, įskaitant „Cyber ​​Security & Cloud Expo“. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.



Source link

Draugai: - Marketingo agentūra - Teisinės konsultacijos - Skaidrių skenavimas - Klaipedos miesto naujienos - Miesto naujienos - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Teniso treniruotės - Pranešimai spaudai - Kauno naujienos - Regionų naujienos - Palangos naujienos