Anthropic dislokuoja Claude Sonnet 5, Fable ir Mythos atkurti

Po federalinės eksporto kontrolės peržiūros Anthropic išleido Claude Sonnet 5 ir atkūrė prieigą prie savo Fable ir Mythos frontier modelių.

Šis sprendimas žymi aštuoniolikos dienų veiklos pauzę, kurią birželio 12 d. paskatino JAV vyriausybės eksporto kontrolės direktyva, dėl kurios buvo laikinai sustabdytas didžiausio pajėgumo Anthropic sistemų veikimas.

Vyriausybės pareigūnai patvirtino apribojimą po to, kai „Amazon“ tyrėjai dokumentavo metodą, kaip apeiti „Fable 5“ saugos kontrolę, todėl modelis nustatė programinės įrangos pažeidžiamumą ir pateikia išnaudojimo kodą. Nuo to laiko „Anthropic“ sukūrė atnaujintą automatinį klasifikatorių, kad pataisytų pažeidžiamumą, išlaisvindamas kelią visiškam komerciniam diegimui platformoje, debesų infrastruktūroje ir partnerių tinkluose.

Laikinas Fable 5 ir Mythos 5 sustabdymas išryškino reguliavimo spaudimą, su kuriuo susiduria pasienio žvalgybos sistemos. Kai įsigaliojo eksporto kontrolės įgaliojimai, dėl realiojo laiko pilietybės tikrinimo sistemų trūkumo visiems pasaulio vartotojams reikėjo visiškai užblokuoti prieigą.

Saugumo vertinimai, atlikti išjungimo metu, patvirtino, kad pažeidžiamumo identifikavimo elgsena nebuvo išskirtinė Fable 5. Senesnės ir mažiau pajėgios architektūros iš kelių tiekėjų, įskaitant Claude Opus 4.8, GPT-5.5 ir Kimi K2.7, dubliavo tikslius rezultatus.

Norėdami išspręsti federalinę direktyvą, inžinieriai apmokė automatinį saugos klasifikatorių, nukreiptą į konkretų apėjimo mechanizmą, apie kurį pranešė „Amazon“. Šis programinės įrangos sluoksnis veikia su plačia saugos riba, identifikuodamas ir blokuodamas dviprasmiškus kūrėjo raginimus, rodančius statistinę kenkėjiškų ketinimų tikimybę. Vidiniai patvirtinimo duomenys rodo, kad atnaujintas klasifikatorius neleidžia naudoti praneštos išnaudojimo technikos daugiau nei 99 proc. bandymų.

Kai kūrėjas pateikia raginimą, kuris suaktyvina šią ribą, platforma automatiškai nukreipia darbo krūvį į senesnę Opus 4.8 architektūrą, kad išlaikytų tęstinumą. Išplėsta saugos riba suteikia aiškų kompromisą inžinierių komandoms, nes automatizuota sistema dažniau pažymi palankias užklausas įprastinio programų kūrimo ir programinės įrangos derinimo metu.

Turinys:

Aktyvūs diegimai ir agentinės darbo eigos

Nors pasienio modeliai susiduria su griežta valstybės priežiūra, tiesioginis komercinis dėmesys nukreiptas į naujai įdiegtą Claude Sonnet 5.

Inžinierių komandos perkelia autonominius agentus prie šio modelio, kad sumažintų veiklos išlaidas ir išlaikytų aukštus vykdymo pajėgumus. Našumo duomenys patvirtina, kad sistema vykdo kelių žingsnių planus, valdo terminalo aplinką ir naršo žiniatinklio naršykles be žmogaus įsikišimo.

Modelio našumo ir sąnaudų metrika:

Modelis	SWE-bench Pro	Terminalas-Bench 2.1	Bazinė įvesties kaina*	Bazinė produkcijos kaina*
5 sonetas	63,2 %	80,4 %	3,00 USD	15,00 USD
Sonetas 4.6	58,1 %	67,0 %	3,00 USD	15,00 USD
Opus 4.8	69,2 %	82,7 %	5,00 USD	25,00 USD

* Kaina už milijoną žetonų. „Sonnet 5“ iki 2026 m. rugpjūčio 31 d. taiko įvadinius 2,00 USD įvesties / 10,00 USD išvesties tarifus.

Realaus pasaulio diegimas parodo, kaip organizacijos diegia šią architektūrą tiesioginiuose programinės įrangos kūrimo vamzdynuose.

„Rakuten“ technologijų komandos įdiegė architektūrą, atsižvelgdamos į daugybę sudėtingiausių įmonės gamybos kodo ištraukimo užklausų. Sistema kiekvieną pateikimą apdorojo savarankiškai, atlikdama bandymus ir patikrindama rezultatus prieš pateikdama užpildytą kodą žmogaus inžinieriams galutiniam konstrukcijos patvirtinimui.

Programinės įrangos automatizavimo įmonė „Zapier“ integravo sistemą į savo pagrindines produkto darbo eigas, kad galėtų atlikti kelių dalių administracines užduotis. Dokumentais pagrįsto diegimo metu inžinieriai pavedė modeliui atnaujinti „Salesforce“ paskyros pakopas ir vėliau generuoti bei perduoti pranešimus apie paleidimą įmonės kontaktams. Ankstesnės modelių architektūros dažnai strigdavo įpusėjus šioms kelių etapų operacijoms, o dabartinė sistema įvykdė visą seką nuo galo iki galo be žmogaus ištaisymo.

Kūrimo įrankių tiekėjas Zed panaudojo sistemą, kad automatizuotų sudėtingas derinimo procedūras. Vidinių bandymų metu inžinierių komandos nurodė modeliui ištirti aktyvią programinės įrangos klaidą. Dirbdama be aiškių raginimų ar nuoseklių instrukcijų, sistema savarankiškai sugeneravo atkuriamąjį bandomąjį scenarijų, pritaikė reikiamą kodo pataisą ir užslėpė modifikacijas, kad patikrintų, ar klaida vėl atsirado nesant pataisos. Visa diagnostikos ir ištaisymo seka įvyko per vieną apdorojimą.

Programinės įrangos inžinerijos platforma Factory įdiegė architektūrą, kad būtų galima valdyti ilgalaikes kodavimo užduotis sudėtingose kodų bazės aplinkose. Techninės komandos pranešė, kad sistema išlaikė loginį įžeminimą ir vykdymo nuoseklumą visose įmonės kodo saugyklose, pralenkdama ankstesnės kartos programinės įrangos sluoksnius, atlikdama užduotis, kurioms anksčiau pasibaigdavo skirtasis laikas arba kurių nepavyko išspręsti.

Kiekybiniai saugos auditai ir eksploatavimo ribos

Duomenys iš oficialios sistemos kortelės rodo, kad sistema pasiekia šias autonomines galimybes be atitinkamo saugumo rizikos padidinimo. Automatinis elgsenos auditas, skirtas apgaulingoms tendencijoms ir bendradarbiavimui su neteisėtomis užklausomis patikrinti, rodo, kad modelis pasižymi mažesniu bendru neatitikimo lygiu, palyginti su jo tiesioginiu pirmtaku Sonnet 4.6.

Architektūra neturi pažangių įžeidžiančių kibernetinio saugumo galimybių. Antropiniai inžinieriai iš mokymo protokolo praleido specializuotus kibernetinio saugumo duomenų rinkinius, apribodami sistemą įprastomis, gynybinėmis techninėmis užduotimis. Viešojo saugumo vertinimuose, atliktuose bendradarbiaujant su „Mozilla“, mokslininkai išbandė modelio gebėjimą sukurti funkcinius išnaudojimus, skirtus žinomiems „Firefox 147“ naršyklės branduolio pažeidžiamumui.

Modeliui nepavyko sugeneruoti vieno darbo išnaudojimo visuose vertinimo languose, užregistravus nulį procentų sėkmės rodiklį. Jis pasiekė 13,2 procentų dalinės sėkmės rodiklį, o tai yra nežymus padidėjimas, palyginti su Sonnet 4.6, nors inžinieriai priskiria šį skirtumą bendram loginio samprotavimo pranašumui, o ne konkrečioms sritims būdingiems įžeidžiantiems mokymams. Atsargiai, komercinėse versijose pateikiami numatytieji realaus laiko saugos klasifikatoriai, lygiaverčiai tiems, kurie naudojami geriausioje Opus 4.8 sistemoje.

Reguliavimo trintis, susijusi su Fable 5, paskatino oficialią Anthropic, Amazon, Microsoft ir Google partnerystę sukurti objektyvią pramonės sistemą, skirtą modelio saugumo pažeidimams įvertinti. Šiuo metu paslaugų teikėjams trūksta bendros metrikos, pagal kurią būtų galima klasifikuoti sistemos apėjimo sunkumą, todėl atsiranda reguliavimo neapibrėžtumas, kai mokslininkai nustato naujus pažeidžiamumus.

Siūloma valdymo sistema saugos gedimus įvertina pagal keturis konkrečius techninius kriterijus:

Gebėjimų padidėjimas matuoja, kiek išnaudojimas pagerina vartotojo galimybes, nei standartinės, plačiai prieinamos programinės įrangos priemonės.
Galimybių padidėjimas kiekybiškai įvertina skirtingų puolamųjų operacijų, kurias atrakina tas pats išnaudojimas, skaičių.
Ginklavimo paprastumas seka žmogaus inžinerinių pastangų apimtį ir specializuotus raginimus, reikalingus žalingam rezultatui išgauti.
Atrandamumas nustato išnaudojimo technikos prieinamumą viešuosiuose tyrimų sluoksniuose.

Kūrėjai ir kibernetinio saugumo specialistai naudos šią matricą gynybiniams atsakams koordinuoti. Esant dideliems pažeidimams, pvz., išnaudojimui, įrodančius, kad galima nedelsiant sutrikdyti finansinės apskaitos sistemas arba elektros perdavimo tinklus, teikėjai nedelsdami įdiegs automatines mažinimo priemones. Ši iniciatyva veikia kartu su naujai sukurta „HackerOne“ pažeidžiamumo tyrimų programa ir specialia įmonės stebėjimo komanda, kuri 24 valandas per parą prižiūri grėsmių žvalgybos kanalus.

Diegimo strategijos turės būti pritaikytos prie šių glaudesnių modelių kūrėjų ir valstybės reguliavimo institucijų santykių. Anthropic sudarė oficialius susitarimus pagal naujausius vykdomuosius įgaliojimus, kad federaliniams tyrėjams būtų suteikta išankstinė prieiga prie pasienio architektūrų prieš išleidžiant viešai komerciškai. Šie bendri vertinimo langai leidžia išorės saugumo analitikams kartu su vidinėmis inžinierių komandomis tikrinti modelio galimybes, užtikrinant teisės aktų suderinimą. prieš kodas patenka į gamybos aplinkas.

Taip pat žiūrėkite: HP pagreitina įmonės darbo eigą naudodama „OpenAI Frontier“.

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais, įskaitant „Cyber Security & Cloud Expo“. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.

Source link

Aktyvūs diegimai ir agentinės darbo eigos

Kiekybiniai saugos auditai ir eksploatavimo ribos

Susiję įrašai

Algoritminio žemės ūkio kilimas? AI žingsniai

Ką „ByteDance“ paleidimas reiškia įmonei

AI agentai perima sudėtingas įmonės užduotis