Новы штучны інтэлект аўтамабільнага аўдыё можа палепшыць не толькі мелодыі

Галівуд увесь час адлюстроўваў штучны інтэлект (AI) як аператыўны пласт антыўтапічных робатаў, якія замяняюць нічога не падазравалых людзей і ствараюць эскалацыю цэнтральнага канфлікту. У найлепшым выпадку вы можаце ўявіць сабе маладога Хэйлі Джоэла Осмента, які грае Дэвіда, самасвядомага, штучнага дзіцяці ў свеце Спілберга ў палярных шапках, талых і затопленых прыбярэжных гарадах (гучыць знаёма?) ШІ: штучны інтэлект хто (спойлер) забівае толькі сябе. А можа, вы памятаеце голас Робіна Уільямса Двухсотгадовы чалавек хто, зноў жа, з'яўляецца самасвядомым робатам, які спрабуе квітнець, хто (зноў на спойлеры), у выніку становіцца яго адзінай ахвярай. І, вядома, ёсць амаль клішэ спасылка на тэрмінатар і яго постапакаліптычны свет з машынамі, якія спрабуюць знішчыць людзей, і, ну, (не вельмі спойлер) мноствам ахвяр за пару дзесяцігоддзяў. Аднак ні ў адным з гэтых сцэнарыяў людзі не суіснуюць з палепшаным жыццём, не кажучы ўжо пра палепшаныя забавы і бяспеку.

Гэта, аднак, новая рэальнасць. Алгарытмы штучнага інтэлекту могуць быць уключаны ў аўдыядызайн і пастаянна ўдасканальвацца з дапамогай бесправадных абнаўленняў, каб палепшыць вопыт кіравання. І ў прамой супярэчнасці з гэтымі галівудскімі прыкладамі, такі штучны інтэлект сапраўды можа палепшыць верагоднасць выжывання чалавека.

Проста для задавальнення

Да нядаўняга часу ўвесь карыстальніцкі інтэрфейс (UI), уключаючы распрацоўку аўдыё, патрабаваў складанага праграмавання экспертамі-кадзістамі на працягу стандартных трыццаці шасці (36) месяцаў праграмы для аўтамабіля. Стыль ліставога металу і электронныя скрынкі вызначаюцца, закупляюцца і распрацоўваюцца паралельна толькі для каліброўкі асобных элементаў на позняй стадыі распрацоўкі. Фірмовыя гукі. Акустычныя сігнатуры. Усе асобныя ініцыятывы ў рамках адной, анемічнай канструкцыі сістэмы каштаваць вытворцам мільярды.

Але штучны інтэлект дазволіў значна больш гнуткі і эфектыўны спосаб наблізіцца да дызайну гуку. "Тое, што мы бачым, - гэта збліжэнне тэндэнцый", - сцвярджае Джош Морыс, менеджэр машыннага навучання DSP Concept. «Аўдыё становіцца ўсё больш дамінуючай функцыяй у аўтамабільнай прамысловасці, але ў той жа час вы бачыце, што сучасныя працэсары становяцца мацнейшымі з большай памяццю і магчымасцямі».

І пры гэтым выкарыстанне арыентаванай на сістэму платформы распрацоўкі, штучнага інтэлекту і гэтых больш магутных працэсараў забяспечвае вадзіцелям і пасажырам новы ўзровень адаптыўнай хуткасці рэагавання ў рэжыме рэальнага часу. . «Замест гістарычнай неабходнасці пісаць пачкі кода для ўсіх мажлівых сцэнарыяў, штучны інтэлект кіруе хуткасцю рэагавання сістэмы на аснове засвоенага ўсведамлення навакольных умоў і падзей, - сцвярджае Стыў Эрнст, кіраўнік аддзела развіцця аўтамабільнага бізнесу DSP Concept.

Вельмі відавочны спосаб выкарыстання такой сістэмы навучання - гэта "знішчэнне шуму" аўтамабіля, каб можна было наладзіць і палепшыць аўдыё прэміум-класа, нягледзячы на ​​замену на зімовыя шыны або іншыя падобныя змены навакольнага асяроддзя. Але Кампанія LG Electronics распрацавала алгарытмы, якія працуюць у праграме Audio Weaver канцэпцыі DSP платформа, якая дазваляе ўдасканальваць галасавыя дыялогі падчас забаў на заднім сядзенні, каб падкрэсліць іх у параўнанні з выбухамі ў фільме, што дазваляе пасажыру лепш чуць важны змест

Яшчэ адзін невідавочны аспект - гэта тое, як фірмовыя аўдыягукі арганізуюцца сярод іншых шумоў. Ці патрабуецца для гэтага транспартнага сродку нарастаючая паслядоўнасць загрузкі, каб прайграваць іншыя гукі, такія як радыё і званкі, аўтаматычна сцішацца? Кожны вопыт можна скарэктаваць.

Больш верагодна, каб квітнець

Па меры таго, як свет імчыцца як на электрамабілі, так і на аўтаномнае кіраванне, частата і патрэбы ў гукавых папярэджаннях, хутчэй за ўсё, рэзка зменяцца. Напрыклад, інжынер па бяспецы аўтаномнага таксі не можа меркаваць, што пасажыры знаходзяцца дзе-небудзь побач з візуальным дысплеем, калі патрабуецца своечасовае папярэджанне. І наколькі чутны гэты абвестка для амаль 25 мільёнаў амерыканцаў з абмежаванымі магчымасцямі для каго аўтаномныя транспартныя сродкі павінны адкрыць новыя магчымасці мабільнасці? «Аўдыё цяпер не толькі для праслухоўвання вашай любімай песні», - сцвярджае Эрнст. «Пры аўтаномным кіраванні існуюць разнастайныя сігналы, неабходныя для таго, каб кіроўца быў уцягнуты або папярэджваў незаангажаванага кіроўцы аб тым, што адбываецца вакол яго».

«І тое, што робіць яго больш складаным, — уводзіць Адам Левенсан, кіраўнік аддзела маркетынгу DSP Concepts, — дык гэта тое, што ўсе рэчы, якія выконваюцца адначасова ў аўтамабілі: тэлефанія, эфектны або прасторавы гук, шум рухавіка, шум дарогі, акустычныя сістэмы абвесткі аўтамабіля, галасавыя сістэмы і г.д. Мы любім казаць, што самы складаны аўдыёпрадукт - гэта аўтамабіль».

Напрыклад, уявіце сабе сцэнар, калі кіроўца ўключыў аўтаномны рэжым язды па шашы, узмацніў мелодыю і прыемна не ведае аб набліжэнні машыны хуткай дапамогі. Пры якой дакладнасці (і адлегласці) выяўлення сірэны з выкарыстаннем мікрафона(-аў) аўтамабіля аўтамабіль папярэджвае свайго квазі-адцягненага кіроўцы? Як гэта папярэджанне павінна быць прадстаўлена, каб пераадолець навакольны шум, забяспечыць дастатковую ўвагу, але не палохаць кіроўцу без патрэбы? Усё гэта можна наладзіць з дапамогай загадзя распрацаваных мадэляў, папярэдняга навучання з рознымі сірэнамі і наступнай налады ў воблаку. «Тут агульная аркестроўка становіцца вельмі важнай», — тлумачыць Морыс. «Мы можам узяць вынікі мадэлі [выяўлення AI] і накіраваць іх у розныя месцы ў машыне. Можа быць, вы паменшыце гук, уключыце нейкі сігнал папярэджання і ўспыхнеце што-небудзь на прыборнай панэлі, каб кіроўца звярнуў увагу».

Тое ж самае справядліва і для знешніх абвестак. Напрыклад, бясшумны электрамабіль можа мець наладжаную сігналізацыю для пешаходаў. Такім чынам, новыя каліброўкі можна ствараць у аўтаномным рэжыме і загружаць у транспартныя сродкі ў выглядзе абнаўленняў праграмнага забеспячэння на аснове ўключанага новаўвядзення.

Інавацыі паўсюль. І штучны інтэлект падсілкоўвае ўтапічны вопыт, а не стварае дыстапічны свет Галівуду.

Аўтарскі прагноз

Вось мой прагноз на тыдзень (а гэта толькі аўторак, людзі): наступная эвалюцыя аўдыё будзе ўключаць поўную імгненную зваротную сувязь, уключаючы тонкае задавальненне карыстальнікаў у рэальным часе. Так, значная частка бягучага дызайну, верагодна, паляпшае вопыт, але пастаянная каліброўка дызайну, арыентаванага на карыстальніка (UCD), можа быць дадаткова ўдасканалена на аснове выразаў твару, мовы цела і каментарыяў пасажыраў, тым самым індывідуальна наладжваючы задавальненне ў рэжыме рэальнага часу. Усе неабходныя сродкі ёсць: камера, штучны інтэлект, працэсары і адаптыўная платформа.

Так, мы чулі раней адаптыўнае асвятленне настрою і дыстанцыйнае выяўленне нуды, стрэсу і г.д. для павышэння бяспекі, але нічога, што паляпшае камбінаваны вопыт, заснаваны на алгарытмах навучання ў рэальным часе ўсіх датчыкаў, накіраваных карыстальнікам.

Магчыма, я занадта экстрапалюю. Але, як і герой Робіна Уільямса, я ахопліваю два стагоддзі… так што, магчыма, я проста адчувальны да таго, чаго хочуць людзі.

Крыніца: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/