Kinijos dirbtinio intelekto modeliai turi 175 000 neapsaugotų sistemų, nes Vakarų laboratorijos atsitraukia

Nes Vakarų AI laboratorijos nebebus arba nebegali. Kadangi „OpenAI“, „Anthropic“ ir „Google“ susiduria su vis didesniu spaudimu apriboti savo galingiausius modelius, Kinijos kūrėjai užpildė atvirojo kodo tuštumą dirbtiniu intelektu, specialiai sukurtu tam, ko reikia operatoriams: galingų modelių, veikiančių naudojant prekinę aparatinę įrangą.

Naujas saugumo tyrimas atskleidžia, kaip kruopščiai Kinijos AI užfiksavo šią erdvę. „SentinelOne“ ir „Censys“ paskelbti tyrimai, kuriuose per 293 dienas apžvelgiami 175 000 paveiktų dirbtinio intelekto kompiuterių iš 130 šalių, rodo, kad Alibaba Qwen2 pagal pasaulinį diegimą nuolat užima antrą vietą po Meta’s Llama. Iškalbingiau, Kinijos modelis rodomas 52 % sistemų, kuriose veikia keli AI modeliai, o tai rodo, kad jis tapo de facto Llama alternatyva.

„Tikimės, kad per ateinančius 12–18 mėnesių Kinijos kilmės modelių šeimos atliks vis svarbesnį vaidmenį atvirojo kodo LLM ekosistemoje, ypač kai Vakarų pasienio laboratorijos lėtina arba riboja atvirojo svorio leidimus“, – „TechForge Media“ sakė Gabriel Bernadett-Shapiro, žymus „SentinelOne“ dirbtinio intelekto tyrinėtojas. AI naujienos.

Išvada gaunama, kai OpenAI, Anthropic ir Google susiduria su reguliavimo patikrinimu, saugos peržiūros išlaidomis ir komercinėmis paskatomis, skatinančiomis juos kurti su API susijusius leidimus, o ne laisvai skelbti modelių svorį. Kontrastas su Kinijos kūrėjais negalėjo būti ryškesnis.

Kinijos laboratorijos pademonstravo tai, ką Bernadett-Shapiro vadina „norą skelbti didelius, aukštos kokybės svorius, kurie yra aiškiai optimizuoti vietiniam diegimui, kiekybiniam įvertinimui ir prekinei techninei įrangai“.

„Praktiškai tai leidžia juos lengviau pritaikyti, lengviau valdyti ir lengviau integruoti į krašto ir gyvenamąją aplinką“, – pridūrė jis.

Paprasčiau tariant: jei esate tyrėjas ar kūrėjas, norintis paleisti galingą AI savo kompiuteryje be didžiulio biudžeto, Kinijos modeliai, tokie kaip Qwen2, dažnai yra geriausias arba vienintelis pasirinkimas.

Turinys:

Pragmatika, o ne ideologija

Alibaba Qwen2 nuolat užima antrą vietą po Meta’s Llama pagal 175 000 veikiančių šeimininkų visame pasaulyje. Šaltinis: SentinelOne/Censys

Tyrimai rodo, kad šis dominavimas nėra atsitiktinis. Qwen2 palaiko tai, ką Bernadett-Shapiro vadina „nulinio rango nepastovumu“ – jis užima antrąją vietą pagal kiekvieną tyrėjų išnagrinėtą matavimo metodą: bendrus stebėjimus, unikalius pagrindinius kompiuterius ir šeimininkų dienas. Nėra jokių svyravimų, nėra regioninių skirtumų, tik nuoseklus visuotinis pritaikymas.

Bendro diegimo modelis taip pat atskleidžia. Kai operatoriai naudoja kelis dirbtinio intelekto modelius toje pačioje sistemoje – tai įprasta palyginimo arba darbo krūvio segmentavimo praktika – „Llama“ ir „Qwen2“ susiejimas atsiranda 40 694 pagrindiniuose kompiuteriuose, o tai sudaro 52 % visų kelių šeimų diegimų.

Geografinė koncentracija sustiprina vaizdą. Kinijoje vien Pekinas sudaro 30 % atvirų šeimininkų, o Šanchajus ir Guangdongas prideda dar 21 % kartu. Jungtinėse Amerikos Valstijose Virdžinija, atspindinti AWS infrastruktūros tankumą, sudaro 18% prieglobos.

*Kinija ir JAV dominuoja atviroje „Ollama“ prieglobos paskirstymo vietoje, o Pekinas sudaro 30 % Kinijos dislokacijų. Šaltinis: SentinelOne/Censys*

„Jei išleidimo greitis, atvirumas ir aparatinės įrangos perkeliamumas ir toliau skirsis tarp regionų, Kinijos modelių linijos greičiausiai taps numatytosiomis atvirojo diegimo sąlygomis ne dėl ideologijos, o dėl prieinamumo ir pragmatikos“, – aiškino Bernadett-Shapiro.

Valdymo problema

Šis pokytis sukuria tai, ką Bernadett-Shapiro apibūdina kaip „valdymo inversiją“ – esminį AI rizikos ir atskaitomybės pasiskirstymo pokytį.

Platformoje priglobtose paslaugose, tokiose kaip „ChatGPT“, viena įmonė kontroliuoja viską: infrastruktūrą, stebi naudojimą, įgyvendina saugos kontrolę ir gali sustabdyti piktnaudžiavimą. Atviro svorio modeliuose valdiklis išgaruoja. Atskaitomybė pasklinda tūkstančiuose tinklų 130 šalių, o priklausomybė koncentruojasi į keletą modelių tiekėjų – vis dažniau iš Kinijos.

175 000 atvirų kompiuterių veikia visiškai už valdymo sistemų, valdančių komercines AI platformas. Nėra centralizuoto autentifikavimo, greičio ribojimo, piktnaudžiavimo aptikimo ir, svarbiausia, jokio nužudymo jungiklio, jei aptinkamas netinkamas naudojimas.

„Kai išleidžiamas atviro svorio modelis, nereikšminga pašalinti saugos ar saugumo mokymus“, – pažymėjo Bernadett-Shapiro.

Nuolatinis 23 000 prieglobų, rodančių 87 % vidutinį veikimo laiką, stuburas skatina didžiąją dalį veiklos. Tai nėra mėgėjų eksperimentai – tai operacinės sistemos, teikiančios nuolatinį naudingumą, dažnai paleidžiančios kelis modelius vienu metu.

Galbūt labiausiai rūpi: 16–19 % infrastruktūros negalėjo būti priskirta jokiam identifikuojamam savininkui.“ Net jei galime įrodyti, kad modelis buvo panaudotas atakos metu, nėra nusistovėjusių pranešimų apie piktnaudžiavimą maršrutų“, – sakė Bernadett-Shapiro.

Apsauga be apsaugų

Beveik pusė (48 %) veikiančių kompiuterių reklamuoja „įrankio iškvietimo galimybes“, o tai reiškia, kad jie ne tik generuoja tekstą. Jie gali vykdyti kodą, pasiekti API ir savarankiškai bendrauti su išorinėmis sistemomis.

„Tik teksto modelis gali generuoti žalingą turinį, tačiau įrankio iškvietimo modelis gali veikti“, – paaiškino Bernadett-Shapiro. „Neautentifikuotame serveryje užpuolikui nereikia kenkėjiškų programų ar kredencialų; jiems tereikia raginimo.

*Beveik pusė veikiančių „Ollama“ kompiuterių turi įrankių iškvietimo galimybes, kurios gali vykdyti kodą ir pasiekti išorines sistemas. Šaltinis: SentinelOne/Censys*

Didžiausios rizikos scenarijus apima tai, ką jis vadina „atskleisti, įrankiais įgalinti RAG arba automatizavimo galiniai taškai, valdomi nuotoliniu būdu kaip vykdymo sluoksnis“. Užpuolikas gali tiesiog paprašyti modelio apibendrinti vidinius dokumentus, išgauti API raktus iš kodų saugyklų arba iškviesti paskesnes paslaugas, kurioms modelis sukonfigūruotas pasiekti.

Suporuota su „mąstymo“ modeliais, optimizuotais kelių žingsnių samprotavimui (kurių yra 26 % pagrindinių kompiuterių), sistema gali savarankiškai planuoti sudėtingas operacijas. Tyrėjai nustatė mažiausiai 201 pagrindinį kompiuterį, kuriame veikia „necenzūruotos“ konfigūracijos, kurios aiškiai pašalina apsauginius turėklus, nors Bernadett-Shapiro pažymi, kad tai yra apatinė riba.

Kitaip tariant, tai ne tik pokalbių robotai – tai dirbtinio intelekto sistemos, galinčios imtis veiksmų, o pusė jų neturi slaptažodžio apsaugos.

Ką turėtų daryti pasienio laboratorijos

Vakarų AI kūrėjams, besirūpinantiems išlaikyti įtaką technologijos trajektorijai, Bernadett-Shapiro rekomenduoja kitokį požiūrį į modelių leidimus.

„Pasienio laboratorijos negali kontroliuoti diegimo, tačiau jos gali formuoti riziką, kurią jos išleidžia į pasaulį“, – sakė jis. Tai apima „investavimą į ekosistemos lygio priėmimo ir netinkamo naudojimo modelių stebėjimą po išleidimo“, o ne traktavimą, kad leidimai yra vienkartiniai mokslinių tyrimų rezultatai.

Dabartinis valdymo modelis numato centralizuotą diegimą su pasklidusiu tiekimu prieš tiekimą – visiškai priešingai nei vyksta iš tikrųjų. „Kai nedaug linijų dominuoja tai, kas paleidžiama naudojant prekinę aparatinę įrangą, sprendimai, priimami visur“, – paaiškino jis. „Valdymo strategijos turi pripažinti tą inversiją“.

Tačiau pripažinimas reikalauja matomumo. Šiuo metu dauguma laboratorijų, išleidžiančių atviro svorio modelius, neturi sistemingo būdo stebėti, kaip jie naudojami, kur jie naudojami ir ar saugos mokymai lieka nepakitę po kiekybinio įvertinimo ir patikslinimo.

12-18 mėnesių perspektyva

Bernadett-Shapiro tikisi, kad atviras sluoksnis „išliks ir taps profesionalus“, nes įrankių naudojimas, agentai ir multimodaliniai įėjimai tampa numatytosiomis galimybėmis, o ne išimtimis. Laikinasis kraštas ir toliau svyruos mėgėjams eksperimentuojant, tačiau stuburas taps stabilesnis, pajėgesnis ir tvarkys jautresnius duomenis.

Vykdymas išliks netolygus, nes gyvenamosiose ir mažose VPS diegimo priemonės nesusijusios su esamomis valdymo priemonėmis. „Tai nėra klaidingos konfigūracijos problema“, – pabrėžė jis. „Stebime ankstyvą viešo, nevaldomo AI skaičiavimo substrato formavimąsi. Nėra centrinio jungiklio, kurį būtų galima apversti.”

Geopolitinė dimensija prideda skubos. „Kai didžioji dalis pasaulyje nevaldomų dirbtinio intelekto skaičiavimų priklauso nuo modelių, išleistų kelių ne Vakarų laboratorijų, tradicinės prielaidos apie įtaką, koordinavimą ir atsaką po išleidimo tampa silpnesnės“, – sakė Bernadett-Shapiro.

Vakarų kūrėjams ir politikos formuotojams tai akivaizdi: „Net tobulas jų pačių platformų valdymas turi ribotą poveikį realaus pasaulio rizikos paviršiui, jei dominuojantys pajėgumai gyvena kitur ir plinta per atvirą, decentralizuotą infrastruktūrą.

Atvirojo kodo AI ekosistema globalizuojasi, tačiau jos svorio centras ryžtingai slenka į rytus. Ne per bet kokią suderintą strategiją, o per praktinę ekonomiką, kas nori paskelbti, ko tyrėjams ir operatoriams iš tikrųjų reikia, kad dirbtinis intelektas būtų vykdomas vietoje.

Šiame tyrime užfiksuoti 175 000 atvirų šeimininkų yra tik matomas to esminio pertvarkymo paviršius – Vakarų politikos formuotojai tik pradeda atpažinti, jau nekalbant apie tai.

Taip pat žiūrėkite: „Huawei“ išsamiai aprašo atvirojo kodo AI plėtros planą „Huawei Connect 2025“

„TechEx“ renginių AI ir „Big Data Expo“ reklamjuostė.

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais, įskaitant „Cyber Security & Cloud Expo“. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.

Source link

Pragmatika, o ne ideologija

Valdymo problema

Apsauga be apsaugų

Ką turėtų daryti pasienio laboratorijos

12-18 mėnesių perspektyva

Susiję įrašai

„Intuit“, „Uber“ ir „State Farm“ bandomieji AI agentai

Vadovai ragina vienybę ir teisingą plėtrą

AI žmogiškųjų išteklių srityje: tikrasis veiklos poveikis