„SoundHound AI“, jau pagrindinis balso asistentų žaidėjas, dabar suteikia savo technologijoms porą akių.
Įsivaizduokite, kad važiuojate pro orientyrą ir, neištraukdami telefono, paklauskite savo automobilio: „Koks ten pastatas?“ ir gauti greitą atsakymą. Štai ką kuria „SoundHound AI“.
Pradėjus „Vision AI“, naujoji „Soundhound“ sistema sujungia „Sight“ ir „Sound“, kad būtų sukurtas daug protingesnis ir natūralesnis būdas bendrauti su technologijomis. Idėja yra imituoti, kaip mes, kaip žmonės, veikiame; Mes ne tik klausome kažko, bet ir matome jų gestus ir tai, į ką jie žiūri.
Pateikdamas tą patį kontekstinį supratimą į AI, „Soundhound“ tikisi išlyginti nemandagią ir dažnai varginančią patirtį, kurią turime su daugeliu šių dienų išmaniųjų įrenginių. Bendrovė nukreipia realaus pasaulio programas, kai ši kombinuota prasmė galėtų padaryti didžiulį skirtumą, nesvarbu, ar tai jūsų kitame automobilyje, „Restaurant Drive-Thru“ ar gamyklos grindyse.
Keyvanas Mohajeris, „Soundhound AI“ generalinis direktorius, sakė: „Soundhound, mes tikime, kad AI ateitis nėra tik multimodalinė-ji yra giliai integruota, reaguojanti ir sukurta realaus pasaulio poveikiui.
„Naudodamiesi„ Vision AI “, mes išplečiame savo lyderystę balsu ir pokalbių AI, kad iš naujo apibrėžtume, kaip žmonės sąveikauja su įmonių siūlomais ir naudojamais produktais ir paslaugomis.“
Taigi, kaip tai veikia? „Vision AI“ iš fotoaparato paima tiesioginį pašarą ir sujungia jį su įmonės balso technologijomis, kurios jau puikiai supranta natūralią kalbą. Apdorodama tai, ką mato ir ką girdi tuo pačiu metu, sistema gali suvokti tikrąjį vartotojo ketinimą tokiu būdu, kokio paprasto balso asistentas niekada negalėjo.
Pagalvokite apie mechaniką, nešiojantį išmaniuosius akinius, kurie gali tiesiog pažvelgti į variklio dalį ir paprašyti instrukcijų, gaudami momentinį vaizdinį ir garso nurodymą, niekada nenukreipdami savo įrankių. Parduotuvėje darbuotojas galėjo nuskaityti lentynas tiesiog žiūrėdamas į jas, kad gautų realaus laiko atsargų skaičių. Visiems kitiems tai gali reikšti „Drive-thru“ kioską, kuris vizualiai patvirtina mūsų užsakymą ekrane tuo metu, kai sakome.
Viena didžiausių techninių problemų kuriant tokią sistemą yra garso ir vaizdinių elementų užtikrinimas, kad būtų puikiai sinchronizuoti. Bet koks atsilikimas sugriautų natūralaus pokalbio iliuziją.
Pranavas Singhas, „Soundhound AI“ inžinerijos viceprezidentas, komentavo: „Su„ Vision AI “mes sujungiame vaizdinį atpažinimą ir pokalbio intelektą į vieną sinchronizuotą srautą. Kiekvienas kadras, kiekvienas posakis, kiekvienas ketinimas yra aiškinamas tose pačiose ekosistemose – greičiau, natūralesnę vartotojo patirtį, kuri skalės visame skalėje iš kiosų į įterptus įrenginius.
„Tai yra intelekto sankirtos ir vykdymo sankryžoje, pateikiant AI, kuri mato tai, ką matote, girdi tai, ką sakote, ir reaguoja akimirką“.
Verslui, priėmusiems šią technologiją, pažadas yra suteikti greitesnes paslaugas, mažiau klaidų ir laimingesnių klientų. Tai reiškia, kad reikia pašalinti trintį ir priversti technologijas jaustis mažiau kaip įrankis, kurį turite veikti, ir labiau kaip partneris, padedantis jums susitvarkyti.
Ši nauja vaizdinė galimybė nėra vienintelis atnaujinimo garsas. Bendrovė taip pat neseniai patobulino savo sistemos „smegenis“ su nauju atnaujinimu „Amelia 7.1“. Šis patobulinimas daro savo AI agentus greičiau, tikslesnę ir suteikia įmonėms labiau kontroliuoti ir skaidrumą dėl to, kaip jie veikia.
Derindamas regėjimą ir garsą, „Soundhound“ siekia mus stumti arčiau pasaulio, kuriame bendravimas su AI jaučiasi taip lengvai ir intuityviai, kaip ir kalbėtis su kitu žmogumi.
(Christian Lue nuotrauka)
Taip pat žiūrėkite: Alano Turingo institutas: humanitariniai mokslai yra raktas į AI ateitį
Norite sužinoti daugiau apie AI ir didelius duomenis iš pramonės lyderių? Peržiūrėkite AI ir „Big Data Expo“, vykstančią Amsterdame, Kalifornijoje ir Londone. Išsamus renginys yra kartu su kitais pirmaujančiais renginiais, įskaitant intelektualią automatizavimo konferenciją, „BlockX“, „Skaitmeninės transformacijos savaitės“ ir „Cyber Security & Cloud Expo“.
Naršykite kitus būsimus „Enterprise Technology“ renginius ir internetinius seminarus, kuriuos maitina „TechForge“ čia.