„Baidu ERNIE“ daugiarūšis dirbtinis intelektas pagal etalonus lenkia GPT ir Gemini


Naujausias „Baidu“ ERNIE modelis, itin efektyvus daugiarūšis AI, aplenkia GPT ir Gemini pagal pagrindinius etalonus ir taikosi į įmonės duomenis, kurių dažnai nepaiso į tekstą orientuoti modeliai.

Daugeliui įmonių vertingos įžvalgos yra užrakintos inžinerinėse schemose, gamyklos grindų vaizdo sklaidos kanaluose, medicininiuose nuskaitymuose ir logistikos prietaisų skydeliuose. Naujasis „Baidu“ modelis ERNIE-4.5-VL-28B-A3B-Thinking yra skirtas užpildyti šią spragą.

Įmonių architektams įdomu ne tik multimodalinis pajėgumas, bet ir architektūra. Jis apibūdinamas kaip „lengvas“ modelis, veikimo metu suaktyvinantis tik tris milijardus parametrų. Šis metodas skirtas didelėms išvadų sąnaudoms, kurios dažnai stabdo AI mastelio keitimo projektus. Baidu lažinasi apie efektyvumą kaip kelią į priėmimą, mokydamas sistemą kaip „multimodalinių agentų“, galinčių mąstyti ir veikti, o ne tik suvokti, pagrindą.

Sudėtingos vaizdinės duomenų analizės galimybės, kurias palaiko AI etalonai

„Baidu“ daugiarūšis ERNIE AI modelis puikiai valdo tankius, netekstinius duomenis. Pavyzdžiui, jis gali interpretuoti diagramą „Piko laiko priminimas“, kad surastų optimalias lankymo valandas – užduotį, kuri atspindi išteklių planavimo problemas logistikoje ar mažmeninėje prekyboje.

ERNIE 4.5 taip pat rodo galimybes techninėse srityse, pavyzdžiui, tilto grandinės schemos sprendimas taikant Ohmo ir Kirchhoffo dėsnius. Mokslinių tyrimų ir plėtros bei inžinerinių ginklų atveju būsimas padėjėjas galėtų patvirtinti projektus arba paaiškinti sudėtingas schemas naujiems darbuotojams.

Šią galimybę palaiko „Baidu“ etalonai, rodantys, kad ERNIE-4.5-VL-28B-A3B-Thinking pranoksta konkurentus, tokius kaip GPT-5-High ir Gemini 2.5 Pro, atlikus kai kuriuos pagrindinius testus:

  • „MathVista“: ERNIE (82,5) prieš Dvynius (82,3) ir GPT (81,3)
  • ChartQA: ERNIE (87,1) prieš Dvynius (76,3) ir GPT (78,2)
  • VLM yra akli: ERNIE (77,3) prieš Dvynius (76,5) ir GPT (69,6)

Žinoma, verta paminėti, kad dirbtinio intelekto standartai yra vadovas, tačiau gali būti klaidingi. Visada atlikite vidinius testus pagal savo poreikius prieš diegdami bet kokį AI modelį, skirtą svarbioms programoms.

„Baidu“ pereina nuo suvokimo prie automatizavimo, naudodamas naujausią ERNIE AI modelį

Pagrindinė įmonės AI kliūtis yra pereiti nuo suvokimo („kas tai yra?“) prie automatizavimo („kas dabar?“). ERNIE 4.5 teigia, kad tai išspręs integruodama vaizdinį įžeminimą su įrankių naudojimu.

Prašymas multimodalinio AI surasti visus kostiumus dėvinčius žmones atvaizde ir grąžinti jų koordinates JSON formatu. Modelis generuoja struktūrinius duomenis, funkciją, kurią lengva perkelti į gamybos liniją vizualiai apžiūrėti arba į sistemą, tikrinančią svetainės vaizdus, ​​kad būtų laikomasi saugos.

Modelis taip pat valdo išorinius įrankius ir gali savarankiškai priartinti nuotrauką, kad perskaitytų nedidelį tekstą. Jei jis susiduria su nežinomu objektu, jis gali pradėti vaizdų paiešką, kad jį identifikuotų. Tai yra mažiau pasyvi AI forma, kuri gali įgalioti agentą ne tik pažymėti duomenų centro klaidą, bet ir priartinti kodą, ieškoti vidinėje žinių bazėje ir pasiūlyti pataisymą.

Verslo intelekto atrakinimas naudojant multimodalinį AI

Naujausias Baidu ERNIE AI modelis taip pat skirtas įmonių vaizdo archyvams nuo mokymų ir susitikimų iki saugos filmuotos medžiagos. Jis gali išgauti visus ekrane rodomus subtitrus ir susieti juos su tiksliomis laiko žymomis.

Taip pat parodomas laiko suvokimas, konkrečių scenų radimas (pvz., „nufilmuotos ant tilto“), analizuojant vaizdinius ženklus. Aiškus galutinis tikslas – padaryti paiešką didelėse vaizdo įrašų bibliotekose, kad darbuotojas galėtų rasti tikslią momentą, kai buvo aptarta konkreti tema per dviejų valandų trukmės internetinį seminarą, per kurį jis keletą kartų galėjo užsnūsti.

„Baidu“ teikia diegimo gaires keliems būdams, įskaitant transformatorius, vLLM ir „FastDeploy“. Tačiau techninės įrangos reikalavimai yra pagrindinė kliūtis. Norint įdiegti vieną kortelę, reikia 80 GB GPU atminties. Tai ne atsitiktinių eksperimentų įrankis, o organizacijoms, turinčioms esamą ir didelio našumo AI infrastruktūrą.

Tiems, kurie turi aparatinę įrangą, „Baidu“ įrankių rinkinys „ERNIEKit“ leidžia tiksliai sureguliuoti patentuotus duomenis; būtinybė daugeliui didelės vertės naudojimo atvejų. „Baidu“ pateikia savo naujausią ERNIE AI modelį su „Apache 2.0“ licencija, leidžiančia naudoti komerciniais tikslais, o tai būtina norint pritaikyti.

Rinka pagaliau juda prie multimodalinio AI, kuris gali matyti, skaityti ir veikti tam tikrame verslo kontekste, o etaloniniai rodikliai rodo, kad tai daro įspūdingai. Neatidėliotina užduotis yra nustatyti didelės vertės vizualinio samprotavimo darbus savo veikloje ir palyginti juos su didelėmis aparatinės įrangos ir valdymo sąnaudomis.

Taip pat žiūrėkite: Wiz: vykstant pasaulinėms AI lenktynėms, atsiranda saugumo spragų

Norite daugiau sužinoti apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite „AI & Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra „TechEx“ dalis ir vyksta kartu su kitais pagrindiniais technologijų renginiais, įskaitant „Cyber ​​Security Expo“. Norėdami gauti daugiau informacijos, spustelėkite čia.

AI naujienas teikia TechForge Media. Čia rasite kitus būsimus įmonių technologijų renginius ir internetinius seminarus.



Source link

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -