Этыка штучнага інтэлекту, шакавальнае адкрыццё таго, што навучанне ІІ таксічнаму або прадузятаму можа быць карысным, у тым ліку для аўтаномных самакіраваных аўтамабіляў

Ці павінны мы быць гатовыя распрацаваць таксічны ІІ для барацьбы з таксічным ІІ?

Геці

Вось стары радок, які, я ўпэўнены, вы чулі раней.

Каб ведаць аднаго, трэба.

Вы можаце не ўсвядоміць, што гэта выраз, які можна прасачыць да пачатку 1900-х гадоў і звычайна ўжываўся, калі звярталіся да парушальнікаў (іншыя варыянты крылатай фразы ўзыходзяць да 1600-х гадоў). Прыклад таго, як гэта выказванне можа быць выкарыстана, цягне за сабой паняцце, што калі вы хочаце злавіць злодзея, вам трэба выкарыстоўваць злодзея для гэтага. Гэта дэманструе сцвярджэнне, што трэба ведаць чалавека. Многія фільмы і тэлевізійныя шоу выкарысталі гэтую карысную мудрасць, часта паказваючы, што адзіны дзейсны спосаб злавіць жуліка цягне за сабой наём гэтак жа карумпаванага ашуканца для пераследу парушальніка.

Пераключаючы перадачы, некаторыя маглі б скарыстацца той жа логікай, каб сцвярджаць, што прыдатным спосабам вызначыць, ці ўвасабляе хтосьці празмерныя прадузятасці і дыскрымінацыйныя перакананні, было б знайсці чалавека, які ўжо захоўвае такія тэндэнцыі. Верагодна, чалавек, ужо напоўнены прадузятасці, зможа больш лёгка адчуць, што гэты іншы чалавек таксама напоўнены таксічнасцю. Зноў жа, трэба ведаць, што гэта агульнапрызнаная мантра.

Вашай першапачатковай рэакцыяй на магчымасць выкарыстання прадузятага чалавека для вышуку іншага прадузятага чалавека можа быць скептыцызм і недавер. Хіба мы не можам высветліць, ці мае нехта непрыхільныя прадузятасці, проста даследуючы іх і не звяртаючыся да пошуку кагосьці падобнага? Здавалася б дзіўным наўмысна імкнуцца выявіць кагосьці, хто з'яўляецца прадузятым, каб выявіць іншых, якія таксама таксічна прадузятыя.

Я мяркую, што гэта часткова залежыць ад таго, ці гатовыя вы прыняць меркаваны рэфрэн, які трэба ведаць. Звярніце ўвагу, што гэта не азначае, што адзіны спосаб злавіць злодзея патрабуе, каб вы выключна і заўсёды карысталіся злодзеем. Вы маглі б разумна сцвярджаць, што гэта проста дадатковы шлях, якому можна надаць належную ўвагу. Можа быць, часам вы гатовыя пацешыць магчымасць выкарыстоўваць злодзея, каб злавіць злодзея, у той час як іншыя абставіны могуць зрабіць гэта неспасціжнай тактыкай.

Выкарыстоўвайце правільны інструмент для правільнай налады, як кажуць.

Цяпер, калі я выклаў гэтыя асновы, мы можам перайсці да, магчыма, трывожнай і нібыта шакавальнай часткі гэтай гісторыі.

Ці гатовыя вы?

Сфера ІІ актыўна прытрымліваецца таго ж прынцыпу, што часам трэба ведаць яго, асабліва ў выпадку спробы выявіць ІІ, які прадузяты або дзейнічае дыскрымінацыйным чынам. Так, дзіўная ідэя заключаецца ў тым, што мы можам наўмысна захацець распрацаваць ІІ, які будзе цалкам і без сарамлівасці прадузятым і дыскрымінацыйным, робячы гэта для таго, каб выкарыстоўваць яго ў якасці сродку для выяўлення і раскрыцця іншага ІІ, які мае такое ж падабенства таксічнасці. Як вы ўбачыце праз момант, у аснове гэтага пытання ляжаць розныя непрыемныя праблемы этыкі ІІ. Для майго пастаяннага і шырокага асвятлення этыкі ІІ і этычнага ІІ гл спасылка тут і спасылка тут, Проста назваць некалькі.

Я мяркую, што вы маглі б выказаць гэтае выкарыстанне таксічнага ІІ, каб пераследваць іншыя таксічныя ІІ, як вядомую канцэпцыю барацьбы з агнём (мы можам выкарыстоўваць мноства эўфемізмаў і ілюстрацыйных метафар, каб адлюстраваць гэтую сітуацыю). Або, як ужо падкрэслівалася, мы маглі б скупа спасылацца на сцвярджэнне, што трэба ведаць чалавека.

Агульная канцэпцыя заключаецца ў тым, што замест таго, каб спрабаваць высветліць, ці ўтрымлівае дадзеная сістэма AI празмерныя прадузятасці, з дапамогай звычайных метадаў, магчыма, мы павінны імкнуцца выкарыстоўваць і менш звычайныя сродкі. Адным з такіх нетрадыцыйных сродкаў было б распрацаваць ІІ, які ўтрымлівае ўсе найгоршыя прадузятасці і непрымальныя для грамадства таксічнасці, а затым выкарыстоўваць гэты ІІ, каб дапамагчы знішчыць іншы ІІ, які мае тыя ж схільнасць да дрэннага.

Калі вы хутка падумаеце, гэта, вядома, здаецца цалкам разумным. Мы маглі б імкнуцца стварыць ІІ, які будзе максімальна таксічны. Затым гэты таксічны ІІ выкарыстоўваецца для выяўлення іншага ІІ, які таксама мае таксічнасць. Што тычыцца тады выяўленага «дрэннага» ІІ, мы можам справіцца з ім, адмяніўшы таксічнасць, цалкам адмовіўшыся ад ІІ (гл. маё асвятленне дэгоржацыі або знішчэння ІІ на гэтая спасылка тут), або зняволенне ІІ (гл. маё асвятленне зняволення ІІ у гэтая спасылка тут), або рабіць усё, што здаецца прыдатным.

Контраргумент заключаецца ў тым, што мы павінны праверыць нашы галовы, што мы наўмысна і добраахвотна распрацоўваем ІІ, які таксічны і напоўнены прадузятасцямі. Гэта апошняе, што мы павінны ўлічваць, некаторыя б заклікалі. Засяродзьцеся на тым, каб AI цалкам складаўся з дабра. Не засяроджвайцеся на распрацоўцы штучнага інтэлекту, які мае заганы і асадкі неапраўданых прадузятасці. Некаторым здаецца адштурхваючым само ўяўленне аб такой пагоні.

Ёсць больш сумненняў з нагоды гэтага спрэчнага квэста.

Магчыма, місія па распрацоўцы таксічнага ІІ проста падбадзёрыць тых, хто жадае стварыць ІІ, які здольны падарваць грамадства. Гэта як быццам мы кажам, што ствараць ІІ з неадпаведнымі і непрыемнымі ўхіламі - гэта цалкам нармальна. Ні клопатаў, ні ваганняў. Імкнучыся распрацаваць таксічны AI, як хочацца, мы гучна перадаем будаўнікам AI па ўсім свеце. Гэта (падміргнуць-падміргнуць) усё ў імя дабра.

Акрамя таго, выкажам здагадку, што гэты таксічны ІІ выгляд зачапіцца. Магчыма, ІІ выкарыстоўваецца і паўторна выкарыстоўваецца многімі іншымі распрацоўшчыкамі ІІ. У рэшце рэшт, таксічны ІІ хаваецца ва ўсіх відах сістэм ІІ. Можна правесці аналогію з распрацоўкай віруса, які падрывае чалавека, які выходзіць з меркавана закрытай лабараторыі. Наступнае, што вы ведаеце, праклятая рэч паўсюль, і мы знішчылі сябе.

Пачакайце секунду, супраць гэтых контраргументаў ідзе, вы шалясцеце ад усялякіх вар'ятаў і нічым не пацверджаных здагадак. Зрабіце глыбокі ўдых. Супакойся.

Мы можам бяспечна зрабіць таксічны ІІ і трымаць яго ў абмежаваным рэжыме. Мы можам выкарыстоўваць таксічны ІІ, каб знайсці і дапамагчы ў зніжэнні расце распаўсюджанасці ІІ, які, на жаль, мае неабгрунтаваныя прадузятасці. Любыя іншыя з гэтых недарэчна дзікіх і нічым не абгрунтаваных воклічаў з'яўляюцца чыста рэзкімі рэакцыямі і, на жаль, дурнымі і наўпрост неразумнымі. Не спрабуйце выкінуць дзіцяці разам з вадой, вы папярэджаны.

Падумайце пра гэта так, сцвярджаюць прыхільнікі. Правільнае стварэнне і выкарыстанне таксічнага ІІ у мэтах даследаванняў, ацэнкі і дзейнічаючы як дэтэктыў, каб раскрыць іншыя крыўдлівыя для грамадства ІІ - гэта годны падыход, і ён павінен атрымаць належнае ўзрушэнне. Адкіньце ў бок свае непрытомныя рэакцыі. Спусціцеся на зямлю і паглядзіце на гэта цвяроза. Наш погляд накіраваны на прыз, а менавіта на выкрыццё і ліквідацыю перанасычанасці сістэм AI, заснаваных на прадузятасці, і гарантуючы, што як грамадства мы не будзем перапоўненыя таксічным AI.

Перыяд. Поўная кропка.

Існуюць розныя ключавыя спосабы паглыбіцца ў гэта паняцце выкарыстання таксічнага або тэндэнцыйнага ІІ у карысных мэтах, у тым ліку:

Наладжвайце наборы даных, якія наўмысна ўтрымліваюць прадузятыя і цалкам таксічныя дадзеныя, якія можна выкарыстоўваць для навучання ІІ адносна таго, што нельга рабіць і / або на што варта сачыць
Выкарыстоўвайце такія наборы даных для падрыхтоўкі мадэляў машыннага навучання (ML) і глыбокага навучання (DL) аб выяўленні прадузятасці і высвятленні вылічальных мадэляў, якія цягнуць за сабой таксічнасць грамадства
Прымяненне таксічнасці навучаны ML/DL да іншага ІІ, каб пераканацца, ці з'яўляецца мэтавай ІІ патэнцыйна прадузятым і таксічным
Зрабіце даступнымі ML/DL, навучаныя ў галіне таксічнасці, каб прадэманстраваць распрацоўшчыкам штучнага інтэлекту, чаго варта сачыць за тым, каб яны маглі лёгка правяраць мадэлі, каб убачыць, як узнікаюць алгарытмічна прасякнутыя прадузятасці
Прыклад небяспекі таксічнага ІІ у рамках этыкі штучнага інтэлекту і разумення этычнага інтэлекту, усё расказанае ў гэтай серыі прыкладаў ІІ з шкоднымі дзіцячымі праблемамі
іншае

Перш чым перайсці да сутнасці гэтых некалькіх шляхоў, давайце ўсталюем некаторыя дадатковыя асноватворныя звесткі.

Магчыма, вы смутна ведаеце, што адзін з самых гучных галасоў у нашы дні ў вобласці ІІ і нават па-за межамі ІІ - гэта патрабаванне большага падабенства этычнага ІІ. Давайце паглядзім, што азначае спасылка на этыку ІІ і этычны ІІ. Акрамя таго, мы можам стварыць сцэну, даследуючы, што я маю на ўвазе, калі кажу пра машыннае навучанне і глыбокае навучанне.

Адзін канкрэтны сегмент або частка этыкі ІІ, які прыцягвае вялікую ўвагу СМІ, складаецца з ІІ, які дэманструе непрыхільныя прадузятасці і няроўнасць. Вы, магчыма, ведаеце, што, калі пачалася апошняя эра ІІ, быў вялікі ўсплёск энтузіязму адносна таго, што некаторыя цяпер называюць ІІ Назаўсёды. На жаль, пасля таго, як хлынула хваляванне, мы сталі сведкамі AI для дрэннага. Напрыклад, было выяўлена, што розныя сістэмы распазнавання асоб на аснове штучнага інтэлекту змяшчаюць расавыя і гендэрныя прадузятасці, якія я абмяркоўваў на спасылка тут.

Намаганні супрацьстаяць AI для дрэннага актыўна вядуцца. Да таго ж крыклівы прававой імкненне стрымаць правапарушэнні, ёсць таксама істотны штуршок да прыняцця этыкі ІІ, каб выправіць подласць ІІ. Паняцце заключаецца ў тым, што мы павінны прыняць і ўхваліць ключавыя этычныя прынцыпы ІІ для распрацоўкі і выкарыстання ІІ, робячы гэта, каб падарваць AI для дрэннага і адначасова абвяшчаючы і прасоўваючы пераважнае ІІ Назаўсёды.

Што тычыцца сумежных паняццяў, то я прыхільнік спробы выкарыстоўваць ІІ як частку вырашэння праблем з ІІ, змагаючыся з агнём агнём такім чынам. Напрыклад, мы можам убудаваць этычныя кампаненты ІІ у сістэму ІІ, якая будзе кантраляваць, як робіць усё астатні ІІ, і, такім чынам, патэнцыйна фіксаваць у рэжыме рэальнага часу любыя дыскрымінацыйныя намаганні, глядзіце маё абмеркаванне на спасылка тут. Мы таксама маглі б мець асобную сістэму штучнага інтэлекту, якая дзейнічае як тып манітора этыкі ІІ. Сістэма ІІ служыць у якасці наглядчыка, каб адсочваць і выяўляць, калі іншы ІІ сыходзіць у неэтычную бездань (гл. мой аналіз такіх магчымасцяў на спасылка тут).

Праз хвіліну я падзялюся з вамі некаторымі агульнымі прынцыпамі, якія ляжаць у аснове этыкі ІІ. Тут і там шмат такіх спісаў. Можна сказаць, што пакуль не існуе адзінага спісу універсальнай прывабнасці і супадзення. Вось такая прыкрая навіна. Добрая навіна заключаецца ў тым, што, прынамсі, ёсць лёгка даступныя спісы этыкі AI, і яны, як правіла, вельмі падобныя. Увогуле, гэта сведчыць аб тым, што з дапамогай свайго роду аргументаванага збліжэння мы знаходзім шлях да агульнай агульнасці таго, з чаго складаецца этыка ІІ.

Спачатку давайце коратка азнаёмімся з некаторымі агульнымі запаветамі этычнага інтэлекту, каб праілюстраваць, што павінна быць важнай увагай для тых, хто стварае, вядзе або выкарыстоўвае ІІ.

Напрыклад, як сцвярджае Ватыкан у ст Рым заклікае да этыкі ІІ і, як я падрабязна разгледзеў спасылка тут, яны вызначылі шэсць асноўных прынцыпаў этыкі ІІ:

празрыстасць: У прынцыпе, сістэмы ІІ павінны быць вытлумачальнымі
ўключэнне: Неабходна ўлічваць патрэбы ўсіх людзей, каб кожны мог атрымаць выгаду, а ўсім можна было прапанаваць найлепшыя ўмовы для выяўлення сябе і развіцця
адказнасць: Тыя, хто распрацоўвае і разгортвае выкарыстанне ІІ, павінны дзейнічаць з адказнасцю і празрыстасцю
Бесстароннасць: Не стварайце і не дзейнічайце ў адпаведнасці з прадузятасць, тым самым абараняючы справядлівасць і чалавечую годнасць
надзейнасць: Сістэмы AI павінны быць у стане надзейна працаваць
Бяспека і канфідэнцыяльнасць: Сістэмы AI павінны працаваць бяспечна і паважаць канфідэнцыяльнасць карыстальнікаў.

Як гаворыцца ў паведамленні міністэрства абароны зша Этычныя прынцыпы выкарыстання штучнага інтэлекту і, як я падрабязна разгледзеў спасылка тут, гэта іх шэсць асноўных прынцыпаў этыкі ІІ:

Адказны: Персанал Міністэрства абароны будзе праяўляць належны ўзровень меркавання і ўважлівасці, застаючыся адказным за распрацоўку, разгортванне і выкарыстанне магчымасцяў ІІ.
Справядлівы: Дэпартамент будзе прымаць наўмысныя крокі, каб звесці да мінімуму ненаўмыснае прадузятасць у магчымасцях ІІ.
Адсочваецца: Магчымасці Дэпартамента AI будуць развівацца і разгортвацца такім чынам, каб адпаведны персанал валодаў належным разуменнем тэхналогій, працэсаў распрацоўкі і аперацыйных метадаў, якія прымяняюцца да магчымасцяў AI, уключаючы празрыстыя і паддаюцца праверку метадалогіі, крыніцы даных, а таксама працэдуру праектавання і дакументацыю.
надзейнасць: Магчымасці ІІ Дэпартамента будуць мець дакладнае, дакладна вызначанае выкарыстанне, а бяспека, бяспека і эфектыўнасць такіх магчымасцяў будуць падлягаць тэсціраванню і запэўненню ў рамках гэтых вызначаных відаў выкарыстання на працягу ўсяго іх жыццёвага цыклу.
Кіруемы: Дэпартамент будзе распрацоўваць і распрацоўваць магчымасці штучнага інтэлекту для выканання іх прызначаных функцый, пры гэтым валодаючы здольнасцю выяўляць і пазбягаць непрадбачаных наступстваў, а таксама здольнасцю адключаць або дэактываваць разгорнутыя сістэмы, якія дэманструюць ненаўмыснае паводзіны.

Я таксама абмеркаваў розныя калектыўныя аналізы этычных прынцыпаў ІІ, у тым ліку ахарактарызаваў набор, распрацаваны даследчыкамі, якія даследавалі і сціснулі сутнасць шматлікіх нацыянальных і міжнародных этычных прынцыпаў ІІ у артыкуле пад назвай «Глабальны ландшафт этычных прынцыпаў ІІ» (апублікаваны у Прырода), і што маё асвятленне даследуе на спасылка тут, што прывяло да гэтага спісу ключавых каменяў:

Празрыстасць
Справядлівасць і справядлівасць
Не-злачынства
адказнасць
недатыкальнасць прыватнага жыцця
Дабразычлівасць
Свабода і аўтаномія
давер
ўстойлівасць
пачуццё ўласнай годнасці
Салідарнасць

Як вы маглі здагадацца, спрабаваць вызначыць асаблівасці, якія ляжаць у аснове гэтых прынцыпаў, можа быць вельмі цяжка зрабіць. Больш за тое, спробы ператварыць гэтыя шырокія прынцыпы ў нешта цалкам матэрыяльнае і дастаткова дэталёвае, каб іх можна было выкарыстоўваць пры стварэнні сістэм ІІ, таксама цяжкі арэх. У цэлым лёгка памахаць рукой аб тым, што такое запаведзі этыкі ІІ і як іх варта выконваць, у той час як значна больш складаная сітуацыя ў кадаванні ІІ, калі трэба быць сапраўднай гумай, якая сустракае дарогу.

Прынцыпы этыкі штучнага інтэлекту павінны выкарыстоўвацца распрацоўшчыкамі ІІ, а таксама тымі, хто кіруе намаганнямі па распрацоўцы ІІ, і нават тымі, якія ў канчатковым рахунку займаюцца і абслугоўваюць сістэмы ІІ. Усе зацікаўленыя бакі на працягу ўсяго жыццёвага цыклу распрацоўкі і выкарыстання ІІ разглядаюцца ў рамках выканання ўстаноўленых нормаў этычнага ІІ. Гэта важная асаблівасць, паколькі звычайная здагадка заключаецца ў тым, што «толькі кадэры» або тыя, хто праграмуе ІІ, падлягаюць захаванню паняццяў этыкі ІІ. Як гаварылася раней, для распрацоўкі і выкарыстання штучнага інтэлекту патрабуецца вёска, і для гэтага ўся вёска павінна быць дасведчанай і прытрымлівацца этычных правілаў ІІ.

Давайце таксама пераканаемся, што мы знаходзімся на адной старонцы адносна прыроды сённяшняга ІІ.

Сёння няма ніводнага ІІ, які быў бы разумным. У нас гэтага няма. Мы не ведаем, ці будзе магчымы разумны ІІ. Ніхто не можа дакладна прадказаць, ці дасягнем мы разумнага ІІ і ці неяк цудам спантанна паўстане разумны ІІ у форме вылічальнай кагнітыўнай звышновай (звычайна яе называюць сінгулярнасцю, глядзіце маё асвятленне на спасылка тут).

Тып ІІ, на які я засяроджваюся, складаецца з неразумнага ІІ, які мы маем сёння. Калі б мы хацелі дзіка разважаць пра пачуццёвы ІІ, гэтая дыскусія можа пайсці ў кардынальна іншым кірунку. Разумны ІІ нібыта быў бы чалавечага якасці. Вам трэба будзе ўлічваць, што разумны ІІ з'яўляецца кагнітыўным эквівалентам чалавека. Больш за тое, паколькі некаторыя мяркуюць, што мы можам мець звышінтэлектуальны ІІ, можна ўявіць, што такі ІІ можа апынуцца разумнейшым за людзей (для майго даследавання звышінтэлектуальнага ІІ як магчымасці гл. асвятленне тут).

Давайце больш прыземлены і разгледзім сучасны вылічальны неразумны ІІ.

Зразумейце, што сучасны ІІ не здольны «думаць» ні ў якім разе нароўні з чалавечым мысленнем. Калі вы ўзаемадзейнічаеце з Alexa або Siri, размоўныя здольнасці могуць здацца падобнымі да чалавечых, але рэальнасць такая, што гэта вылічальнае і недастатковае чалавечае пазнанне. Апошняя эра штучнага інтэлекту шырока выкарыстоўвала машыннае навучанне (ML) і глыбокае навучанне (DL), якія выкарыстоўваюць вылічальнае ўзгадненне шаблонаў. Гэта прывяло да сістэм ІІ, якія маюць выгляд чалавекападобных схільнасцей. Між тым, сёння няма ніводнага ІІ, які меў бы падабенства здаровага сэнсу і не меў бы ніводнага кагнітыўнага здзіўлення надзейнага чалавечага мыслення.

ML/DL з'яўляецца адной з формаў вылічэння шаблону адпаведнасці. Звычайны падыход заключаецца ў тым, што вы збіраеце дадзеныя аб задачы прыняцця рашэння. Вы падаеце дадзеныя ў камп'ютэрныя мадэлі ML/DL. Гэтыя мадэлі імкнуцца знайсці матэматычныя заканамернасці. Калі такія шаблоны знойдзены, сістэма ІІ будзе выкарыстоўваць гэтыя шаблоны пры сустрэчы з новымі дадзенымі. Пры прадстаўленні новых дадзеных шаблоны, заснаваныя на «старых» або гістарычных дадзеных, прымяняюцца для прыняцця бягучага рашэння.

Я думаю, вы можаце здагадацца, куды гэта вядзе. Калі людзі, якія прымалі рашэнні па ўзорах, уключалі ў сябе непрыхільныя прадузятасці, верагоднасць таго, што дадзеныя адлюстроўваюць гэта тонкім, але істотным чынам. Машынае навучанне або Deep Learning вылічальнае ўзгадненне шаблонаў проста паспрабуе матэматычна імітаваць дадзеныя адпаведна. Там няма падабенства здаровага сэнсу або іншых разумных аспектаў мадэлявання, створанага AI, як такога.

Акрамя таго, распрацоўшчыкі ІІ могуць таксама не разумець, што адбываецца. Таямнічая матэматыка ў ML/DL можа абцяжарыць выяўленне схаваных цяпер ухілаў. Вы па праве спадзявацца і чакаць, што распрацоўшчыкі ІІ правядуць праверку на патэнцыйна схаваныя прадузятасці, хоць гэта больш складана, чым можа здацца. Існуе вялікая верагоднасць таго, што нават пры адносна шырокім тэсціраванні ў мадэлях супастаўлення шаблонаў ML/DL ўсё яшчэ будуць уключаны прадузятасці.

Вы можаце выкарыстоўваць вядомае ці сумнавядомую прымаўку: смецце - у смецце - выходзіць. Справа ў тым, што гэта больш падобна на прадузятасці, якія падступна ўліваюцца, калі прадузятасці пагружаюцца ў ШІ. Алгарытм прыняцця рашэнняў (ADM) ІІ аксіяматычна нагружаецца няроўнасцямі.

Не добра.

Што яшчэ можна зрабіць з усім гэтым?

Давайце вернемся да раней пазначанага спісу таго, як паспрабаваць справіцца з прадузятасцямі ІІ або таксічным ІІ, выкарыстоўваючы некалькі нетрадыцыйны падыход «трэба ведаць адзін». Нагадаем, што спіс складаўся з наступных істотных момантаў:

Наладжвайце наборы даных, якія наўмысна ўтрымліваюць прадузятыя і цалкам таксічныя дадзеныя, якія можна выкарыстоўваць для навучання ІІ адносна таго, што нельга рабіць і / або на што варта сачыць
Выкарыстоўвайце такія наборы даных для падрыхтоўкі мадэляў машыннага навучання (ML) і глыбокага навучання (DL) аб выяўленні прадузятасці і высвятленні вылічальных мадэляў, якія цягнуць за сабой таксічнасць грамадства
Прымяненне таксічнасці навучаны ML/DL да іншага ІІ, каб пераканацца, ці з'яўляецца мэтавай ІІ патэнцыйна прадузятым і таксічным
Зрабіце даступнымі ML/DL, навучаныя ў галіне таксічнасці, каб прадэманстраваць распрацоўшчыкам штучнага інтэлекту, чаго варта сачыць за тым, каб яны маглі лёгка правяраць мадэлі, каб убачыць, як узнікаюць алгарытмічна прасякнутыя прадузятасці
Прыклад небяспекі таксічнага ІІ у рамках этыкі штучнага інтэлекту і разумення этычнага інтэлекту, усё расказанае ў гэтай серыі прыкладаў шкодных дзяцей з шкодным інтэлектам
іншае

Мы ўважліва разгледзім першы з гэтых важных момантаў.

Налада набораў даных аб таксічных дадзеных

Праніклівым прыкладам спробы ўсталяваць наборы даных, якія ўтрымліваюць непрыемныя сацыяльныя прадузятасці, з'яўляецца набор даных CivilComments з падпарадкаванай калекцыі WILDS.

Па-першае, некаторыя хуткія фоны.

WILDS - гэта зборнік з адкрытым зыходным кодам набораў даных, якія можна выкарыстоўваць для навучання ML/DL. Асноўная заяўленая мэта WILDS заключаецца ў тым, што яна дазваляе распрацоўшчыкам AI мець лёгкі доступ да дадзеных, якія прадстаўляюць зрухі размеркавання у розных канкрэтных абласцях. Некаторыя з даменаў, даступных у цяперашні час, ахопліваюць такія вобласці, як віды жывёл, пухліны ў жывых тканінах, шчыльнасць качанаў пшаніцы і іншыя дамены, такія як CivilComments, якія я зараз апішу.

Праца са зрухамі размеркавання з'яўляецца важнай часткай правільнага стварэння сістэм ІІ ML/DL. Вось такая здзелка. Часам дадзеныя, якія вы выкарыстоўваеце для трэніровак, аказваюцца значна адрозніваюцца ад дадзеных тэставання або «ў дзікай прыродзе», і, такім чынам, ваш, як мяркуецца, навучаны ML/DL, адносіцца да таго, якім будзе рэальны свет. Праніклівыя распрацоўшчыкі AI павінны навучаць свае ML/DL, каб справіцца з такімі зрухамі размеркавання. Гэта павінна быць зроблена загадзя, і не будзе нейкім сюрпрызам, што пазней запатрабуе рэканструкцыі ML/DL як такой.

Як тлумачыцца ў артыкуле, у якой былі прадстаўлены WILDS: «Зрухі размеркавання — калі размеркаванне навучання адрозніваецца ад размеркавання тэстаў — можа істотна пагоршыць дакладнасць сістэм машыннага навучання (ML), разгорнутых у дзікай прыродзе. Нягледзячы на іх паўсюднае распаўсюджванне ў рэальных разгортваннях, гэтыя зрухі размеркавання недастаткова прадстаўлены ў наборах даных, якія сёння шырока выкарыстоўваюцца ў супольнасці ML. Каб ліквідаваць гэты прабел, мы прадстаўляем WILDS, абраны эталон з 10 набораў даных, які адлюстроўвае разнастайны спектр зрухаў размеркавання, якія натуральна ўзнікаюць у рэальных прылажэннях, напрыклад, зрухі ў бальніцах для ідэнтыфікацыі пухлін; праз камеры-пасткі для маніторынгу дзікай прыроды; і праз час і месца ў спадарожнікавых здымках і картаграфаванні беднасці» (у артыкуле пад назвай «WILDS: A Benchmark of in-the-Wild Distribution Shifts» Пан Вэй Ко, Сіёры Сагава, Хенрык Марклунд, Санг Се, Марвін Чжан, Ашай Балсубрамані , Вэйхуа Ху і іншыя).

Колькасць такіх набораў даных WILDS працягвае расці, і характар набораў даных, як правіла, паляпшаецца, каб падмацаваць каштоўнасць выкарыстання дадзеных для навучання ML/DL.

Набор даных CivilComments апісваецца наступным чынам: «Аўтаматычны агляд тэксту, створанага карыстальнікамі, напрыклад, выяўленне таксічных каментароў — з'яўляецца важным інструментам для мадэрацыі вялікага аб'ёму тэксту, напісанага ў Інтэрнэце. На жаль, папярэдняя праца паказала, што такія класіфікатары таксічнасці ўлоўліваюць збоі ў навучальных дадзеных і ілжыва звязваюць таксічнасць са згадваннем некаторых дэмаграфічных дадзеных. Гэтыя тыпы ілжывых карэляцый могуць значна пагоршыць прадукцыйнасць мадэлі для асобных субпапуляцый. Мы вывучаем гэтае пытанне праз мадыфікаваны варыянт набору даных CivilComments» (як апублікавана на сайце WILDS).

Разгледзім нюансы непрыемных публікацый у Інтэрнэце.

Вы, несумненна, сутыкаліся з таксічнымі каментарамі пры выкарыстанні практычна любых сацыяльных сетак. Здавалася б, для вас амаль немагчыма магічна пазбегнуць таго рэзкага і бездагляднага зместу, які, здаецца, шырока распаўсюджаны ў нашы дні. Часам вульгарны матэрыял непрыкметны, і, магчыма, вам давядзецца чытаць паміж радкоў, каб зразумець сутнасць тэндэнцыйнага або дыскрымінацыйнага тону або сэнсу. У іншых выпадках словы з'яўляюцца відавочна таксічнымі, і вам не патрэбны мікраскоп або спецыяльнае кальцо дэшыфратара, каб высветліць, што цягне за сабой урыўкі.

CivilComments - гэта набор даных, які быў сабраны, каб паспрабаваць распрацаваць AI ML/DL, які можа вылічальна выявіць таксічнае змесціва. Вось на чым засяродзіліся даследчыкі, якія ляжаць у аснове намаганняў: «Ненаўмысная прадузятасць у машынным навучанні можа выяўляцца ў выглядзе сістэмных адрозненняў у прадукцыйнасці для розных дэмаграфічных груп, што патэнцыйна пагаршае існуючыя праблемы справядлівасці ў грамадстве ў цэлым. У гэтым артыкуле мы ўводзім набор паказчыкаў, якія не залежаць ад парогаў, якія забяспечваюць дэталёвае ўяўленне аб гэтым ненаўмысным зрушэнні, разглядаючы розныя спосабы, як размеркаванне балаў класіфікатара можа вар'іравацца ў розных групах. Мы таксама прадстаўляем вялікі новы тэставы набор каментарыяў у інтэрнэце з анатацыямі для спасылак на асобу. Мы выкарыстоўваем гэта, каб паказаць, як нашы паказчыкі могуць быць выкарыстаны для пошуку новых і патэнцыйна тонкіх ненаўмысных зрушэнняў у існуючых публічных мадэлях» (у артыкуле пад назвай «Nuanced Metrics For Measuring Unintended Bias With Real Data for Test Classification» Дэніэл Боркан, Лукас Дыксан, Джэфры Сорэнсен, Нітум Тэйн, Люсі Васерман).

Калі вы падумаеце над гэтым пытаннем шырока, вы можаце падумаць, як у свеце можна адрозніць, што з'яўляецца таксічным каментарыем, а што не таксічным. Людзі могуць кардынальна адрознівацца ў тым, што яны тлумачаць як прама таксічныя фармулёўкі. Адзін чалавек можа быць абураны той ці іншай заўвагай або каментарыем у інтэрнэце, размешчаным у сацыяльных сетках, а хтосьці можа быць зусім не разварушаны. Часта прыводзяць аргументы, што паняцце таксічных каментарыяў з'яўляецца цалкам расплывістым прадпісаннем. Гэта як мастацтва, дзе звычайна кажуць, што мастацтва разумеецца толькі вачыма таго, хто глядзіць, і гэтак жа прадузятыя або таксічныя выказванні таксама толькі ў вачах таго, хто глядзіць.

Балдэрдаш, адмаўляюць некаторыя. Любы чалавек з разумным розумам можа зразумець, атрутная заўвага ў Інтэрнэце ці не. Вам не трэба быць навукоўцам-ракетчыкам, каб зразумець, калі нейкая з'едлівая абраза напоўнена прадузятасцямі і нянавісцю.

Вядома, грамадскія норавы змяняюцца і змяняюцца з цягам часу. Тое, што яшчэ некаторы час таму не лічылася абразлівым, сёння можа разглядацца як агідна няправільнае. Акрамя таго, рэчы, сказаныя шмат гадоў таму, якія калісьці разглядаліся як празмерна прадузятыя, могуць быць пераасэнсаваны ў святле змяненняў у значэнні. У той жа час іншыя сцвярджаюць, што таксічны каментар заўсёды таксічны, незалежна ад таго, калі ён быў першапачаткова апублікаваны. Можна сцвярджаць, што таксічнасць не адносная, а абсалютная.

Спроба ўсталяваць, што з'яўляецца таксічным, тым не менш, можа быць даволі складанай галаваломкай. Мы можам падвоіць гэтую клапатлівую справу, каб паспрабаваць распрацаваць алгарытмы або ІІ, якія могуць высветліць, што ёсць што. Некаторыя кажуць, што калі людзям цяжка рабіць такія ацэнкі, то праграмаваць камп'ютар, хутчэй за ўсё, аднолькава ці больш праблематычна.

Адзін з падыходаў да наладжвання набораў даных, якія ўтрымліваюць таксічны кантэнт, прадугледжвае выкарыстанне метаду краўдсорсінгу для ацэнкі або ацэнкі змесціва, такім чынам, забяспечваючы чалавечыя сродкі вызначэння таго, што разглядаецца як непрыемнае, і ўключаючы маркіроўку ў сам набор даных. Затым AI ML/DL можа правяраць даныя і звязаную з імі маркіроўку, якую пазначылі ацэншчыкі. Гэта, у сваю чаргу, патэнцыйна можа служыць сродкам вылічальнага пошуку асноўных матэматычных заканамернасцей. Вуаля, ML/DL тады можа быць у стане прадбачыць або вылічальна ацаніць, ці можа дадзены каментар быць таксічным ці не.

Як згадвалася ў цытуемым артыкуле аб нюансаваных паказчыках: «Гэта маркіроўка просіць ацэншчыкаў ацаніць таксічнасць каментара, выбіраючы з «Вельмі таксічны», «Таксічны», «Цяжка сказаць» і «Не таксічны». Ацэншчыкаў таксама спыталі аб некалькіх падтыпах таксічнасці, хоць гэтыя пазнакі не выкарыстоўваліся для аналізу ў гэтай працы. Выкарыстоўваючы гэтыя метады ацэнкі, мы стварылі набор даных з 1.8 мільёна каментарыяў, узятых з інтэрнэт-форумаў, якія змяшчаюць пазнакі таксічнасці і ідэнтычнасці. У той час як усе каментары былі пазначаныя як таксічнасць, а падмноства з 450,000 XNUMX каментарыяў было пазначана для ідэнтычнасці. Некаторыя каментарыі, пазначаныя для ідэнтыфікацыі, былі папярэдне адабраныя з выкарыстаннем мадэляў, створаных на аснове папярэдніх ітэрацый маркіроўкі ідэнтычнасці, каб гарантаваць, што аглядальнікі натоўпу будуць бачыць змест ідэнтычнасці часта» (у цытуемым артыкуле Дэніэла Боркана, Лукаса Дыксана, Джэфры Сорэнсена, Нітума Тэйна, Люсі Васерман).

Іншы прыклад імкнення да набораў даных, якія ўтрымліваюць ілюстратыўнае таксічнае змест, уключае намаганні па навучанні інтэрактыўных сістэм апрацоўкі натуральнай мовы (NLP) на аснове штучнага інтэлекту. Магчыма, вы ўзаемадзейнічалі з сістэмамі НЛП, такімі як Alexa і Siri. Я асвятляў некаторыя цяжкасці і абмежаванні сучаснага НЛП, у тым ліку асабліва трывожны выпадак, які адбыўся, калі Alexa прапанавала дзецям непрыдатную і небяспечную параду, гл. спасылка тут.

Нядаўняе даследаванне імкнулася выкарыстоўваць дзевяць катэгорый сацыяльнай прадузятасці, якія звычайна грунтаваліся на спісе ахоўных дэмаграфічных характарыстык EEOC (Камісія па роўных магчымасцях працаўладкавання), уключаючы ўзрост, пол, нацыянальнасць, знешні выгляд, расу або этнічную прыналежнасць, рэлігію, інваліднасць, сэксуальную прыналежнасць. арыентацыі, а таксама сацыяльна-эканам. Па словах даследчыкаў: «Добра дакументавана, што мадэлі НЛП вывучаюць сацыяльныя прадузятасці, але было праведзена мала працы над тым, як гэтыя прадузятасці выяўляюцца ў выніках мадэлі для прыкладных задач, такіх як адказ на пытанні (QA). Мы прадстаўляем Bias Benchmark для QA (BBQ), набор дадзеных набораў пытанняў, створаных аўтарамі, якія падкрэсліваюць зацверджаныя сацыяльныя прадузятасці ў адносінах да людзей, якія належаць да абароненых класаў па дзевяці сацыяльных вымярэннях, якія маюць дачыненне да англамоўнага кантэксту ЗША" (у артыкуле пад назвай "BBQ : Hand-Built Benchmark for Question Answering» Алісія Пэрыш, Анжаліка Чэн, Мікіта Нангія, Вішак Падмакумар, Джэйсан Пханг, Яна Томпсан, Фу Мон Хтут, Сэмюэл Р. Боўман).

Стварэнне набораў даных, якія наўмысна ўтрымліваюць неаб'ектыўныя і цалкам таксічныя дадзеныя, з'яўляецца расце тэндэнцыяй у ІІ, і асабліва ўзбуджана з'яўленнем этыкі ІІ і жаданнем вырабляць этычны ІІ. Гэтыя наборы даных можна выкарыстоўваць для падрыхтоўкі мадэляў машыннага навучання (ML) і глыбокага навучання (DL) для выяўлення збояў і высвятлення вылічальных мадэляў, якія цягнуць за сабой таксічнасць грамадства. У сваю чаргу, навучаны ML/DL па таксічнасці можа быць разумна накіраваны на іншы ІІ, каб высветліць, ці з'яўляецца мэтавы ІІ патэнцыйна прадузятым і таксічным.

Акрамя таго, даступныя сістэмы ML/DL, навучаныя таксічнасці, могуць быць выкарыстаны, каб прадэманстраваць распрацоўшчыкам ІІ, на што трэба сачыць, каб яны маглі лёгка правяраць мадэлі, каб убачыць, як узнікаюць алгарытмічна прасякнутыя збоі. У цэлым, гэтыя намаганні здольныя прадэманстраваць небяспеку таксічнага штучнага інтэлекту ў рамках этыкі ІІ.

На гэтым этапе гэтай важкай дыскусіі, я б паспрачаўся, што вы жадаеце атрымаць дадатковыя ілюстрацыйныя прыклады, якія маглі б прадэманстраваць гэтую тэму. Ёсць асаблівы і, безумоўна, папулярны набор прыкладаў, якія блізкія мне. Вы бачыце, у якасці эксперта па ІІ, уключаючы этычныя і прававыя наступствы, мяне часта просяць вызначыць рэалістычныя прыклады, якія дэманструюць дылемы этыкі ІІ, каб можна было лягчэй зразумець тэарэтычны характар тэмы. Адна з самых цікавых абласцей, якая яскрава прадстаўляе гэтую этычную праблему ІІ, - гэта з'яўленне сапраўдных самакіраваных аўтамабіляў на аснове ІІ. Гэта паслужыць зручным варыянтам выкарыстання або прыкладам для шырокага абмеркавання гэтай тэмы.

Вось тады вартае ўвагі пытанне, якое варта паразважаць: Ці паказвае з'яўленне сапраўдных самакіраваных аўтамабіляў на аснове штучнага інтэлекту?

Дазвольце мне крыху разабрацца з пытаннем.

Па-першае, звярніце ўвагу, што ў сапраўдным самакіраваным аўтамабілі няма чалавека-кіроўцы. Майце на ўвазе, што сапраўдныя аўтамабілі кіруюцца праз сістэму кіравання AI. За рулём не патрэбны кіроўца-чалавек, а таксама не прадугледжана, каб чалавек кіраваў транспартным сродкам. Для майго шырокага і пастаяннага ахопу аўтаномных транспартных сродкаў (АВ) і асабліва аўтамабіляў гл. спасылка тут.

Я хацеў бы дадаткова ўдакладніць, што маецца на ўвазе, калі я маю на ўвазе сапраўдныя аўтамабілі.

Разуменне ўзроўню самакіравання аўтамабіляў

У якасці ўдакладнення, сапраўдныя аўтамабілі з самакіраваннем - гэта тыя, дзе ІІ кіруе аўтамабілем цалкам самастойна, і падчас задачы за рулём няма ніякай дапамогі чалавека.

Гэтыя аўтамабілі без кіроўцы лічацца ўзроўнямі 4 і 5 (гл. маё тлумачэнне на гэтая спасылка тут), у той час як аўтамабіль, які патрабуе, каб вадзіцель-чалавек сумесна падзяляў намаганні за рулём, звычайна разглядаецца на ўзроўні 2 або ўзроўню 3. Аўтамабілі, якія сумесна выконваюць задачы кіравання, апісваюцца як паўаўтаномныя і звычайна ўтрымліваюць розныя аўтаматызаваныя дапаўненні, якія называюць ADAS (Advanced Driver-Asistance Systems).

Сапраўднага самакіравання на 5-м узроўні пакуль няма, і мы яшчэ нават не ведаем, ці атрымаецца гэтага дасягнуць, і колькі часу спатрэбіцца, каб дабрацца да яго.

Між тым намаганні 4-га ўзроўню паступова спрабуюць атрымаць некаторую цягу, праходзячы вельмі вузкія і выбарачныя выпрабаванні на дарозе, хоць існуюць спрэчкі наконт таго, ці варта дапускаць гэтае тэставанне як такое (усе мы - марскія свінкі на жыццё або смерць у эксперыменце якія адбываюцца на нашых шашэйных і праезных дарогах, некаторыя сцвярджаюць, глядзіце мой рэпартаж на гэтая спасылка тут).

Паколькі паўаўтамабільныя машыны патрабуюць чалавека-вадзіцеля, прыняцце такіх тыпаў аўтамабіляў не будзе прыкметна адрознівацца ад кіравання звычайнымі транспартнымі сродкамі, таму няма нічога новага, каб асвятляць іх на гэтай тэме (праўда, як вы ўбачыце у адно імгненне, наступныя пункты, як правіла, дастасавальныя).

Для паўаўтамабільных машын вельмі важна, каб грамадскасць папярэджвала аб трывожным аспекце, які ўзнікае ў апошні час, а менавіта тым, што, нягледзячы на тых людзей, якія кіроўцы размяшчаюць, засынаюць за рулём аўтамабіля 2-га або 3-га ўзроўню. Усім нам трэба пазбягаць увядзення ў зман веры ў тое, што вадзіцель можа адабраць іх увагу ад кіравання задачай падчас кіравання паўаўтамабільным аўтамабілем.

Вы нясеце адказнасць за кіраванне транспартным сродкам, незалежна ад таго, якая аўтаматызацыя можа быць перакінута на ўзровень 2 або 3.

Самастойныя аўтамабілі і рулявое кіраванне ад таксічнага ІІ

Для сапраўднага самакіравання аўтамабіляў узроўню 4 і ўзроўню 5 не будзе ўдзельнічаць у кіраванні аўтамабілем чалавека.

Усе пасажыры будуць пасажырамі.

AI робіць кіраванне.

Адзін з аспектаў, які трэба неадкладна абмеркаваць, цягне за сабой той факт, што ШІ, які ўдзельнічае ў сучасных сістэмах кіравання ШІ, не з'яўляецца разумным. Іншымі словамі, ШІ ў цэлым з'яўляецца сукупнасцю камп'ютэрнага праграмавання і алгарытмаў, і, напэўна, не ў стане разважаць гэтак жа, як і людзі.

Чаму гэты дадатковы акцэнт на AI не з'яўляецца разумным?

Таму што я хачу падкрэсліць, што, абмяркоўваючы ролю сістэмы кіравання ІІ, я не прыпісваю чалавечым якасцям ІІ. Звярніце ўвагу, што ў нашы дні існуе пастаянная і небяспечная тэндэнцыя да антрапамарфізацыі ІІ. Па сутнасці, людзі прызначаюць чалавечаму разуменню сённяшні ШІ, нягледзячы на бясспрэчны і бясспрэчны факт, што такога ШІ пакуль няма.

З гэтым удакладненнем вы можаце сабе ўявіць, што сістэма кіравання аўтамабілем AI ніяк не можа "ведаць" пра грані кіравання. Ваджэнне і ўсё, што з гэтым звязана, трэба будзе запраграмаваць як частка апаратнага і праграмнага забеспячэння самакіравальнага аўтамабіля.

Давайце акунемся ў мноства аспектаў, якія ўзнікаюць у гэтай тэме.

Па-першае, важна ўсведамляць, што не ўсе аўтамабілі з ІІ аднолькавыя. Кожны вытворца аўтамабіляў і тэхналагічная фірма, якая займаецца самакіраваннем, прытрымліваецца свайго падыходу да распрацоўкі самакіраваных аўтамабіляў. Такім чынам, цяжка рабіць разгорнутыя заявы аб тым, што будуць рабіць або не рабіць сістэмы кіравання AI.

Акрамя таго, кожны раз, калі заяўляецца, што сістэма кіравання штучным інтэлектам не робіць якой -небудзь канкрэтнай справы, пазней гэта могуць абагнаць распрацоўшчыкі, якія фактычна запраграмавалі кампутар на такую ж працу. Крок за крокам сістэмы кіравання AI штучна паступова ўдасканальваюцца і пашыраюцца. Існуючае сёння абмежаванне можа больш не існаваць у будучай ітэрацыі або версіі сістэмы.

Я спадзяюся, што гэта дае дастатковую колькасць папярэджанняў, якія ляжаць у аснове таго, што я збіраюся расказаць.

Ёсць мноства патэнцыяльных і калі-небудзь, верагодна, будуць рэалізаваныя прадузятасці, насычаныя штучным інтэлектам, якія будуць супрацьстаяць з'яўленню аўтаномных транспартных сродкаў і самакіраваных аўтамабіляў, глядзіце, напрыклад, маё абмеркаванне на спасылка тут і спасылка тут. Мы ўсё яшчэ знаходзімся на пачатковай стадыі ўкаранення самакіраваных аўтамабіляў. Пакуль прыняцце не дасягне дастатковага маштабу і бачнасці, вялікая частка таксічных аспектаў ІІ, якія, як я прадказваў, у канчатковым выніку адбудуцца, яшчэ не відавочныя і яшчэ не прыцягнулі шырокай увагі грамадскасці.

Разгледзім, здавалася б, простую справу, звязаную з кіраваннем, якая спачатку можа здацца цалкам бяскрыўднай. У прыватнасці, разгледзім, як правільна вызначыць, ці варта спыняцца ў чаканні «наравістых» пешаходаў, якія не маюць права праезду пераходзіць вуліцу.

Вы, несумненна, ехалі і сустракалі пешаходаў, якія чакалі пераходу дарогі, але не мелі права праезду. Гэта азначала, што вы мелі магчымасць спыніцца і дазволіць ім перасекчы. Вы можаце працягваць рух, не дазваляючы ім перасякацца, і пры гэтым цалкам адпавядаць законным правілам ваджэння.

Даследаванні таго, як вадзіцелі-людзі вырашаюць спыніцца або не спыняцца для такіх пешаходаў, сведчаць аб тым, што часам вадзіцелі-людзі робяць выбар на аснове непрыхільных ухілаў. Чалавек-кіроўца можа паглядзець на пешахода і вырашыць не спыняцца, нават калі б ён спыніўся, калі б пешаход меў іншы выгляд, напрыклад, у залежнасці ад расы або полу. Я разгледзеў гэта на спасылка тут.

Як будуць запраграмаваныя сістэмы кіравання штурманам для прыняцця такога ж рашэння "спыніцца або ісці"?

Вы можаце заявіць, што ўсе сістэмы кіравання AI павінны быць запраграмаваны так, каб яны заўсёды спыняліся для тых, хто чакае пешаходаў. Гэта значна спрашчае справу. На самай справе не варта прымаць ніякіх вузлавых рашэнняў. Калі пешаход чакае пераходу, незалежна ад таго, мае ён паласу праезду ці не, пераканайцеся, што аўтамабілі AI спыніліся, каб пешаход мог перайсці.

Лёгка-проста.

Здаецца, жыццё ніколі не бывае такім простым. Уявіце, што ўсе аўтамабілі з самакіраваннем прытрымліваюцца гэтага правіла. Пешаходы непазбежна зразумеюць, што сістэмы кіравання AI - гэта, скажам так, штуршкі. Усе пешаходы, якія жадаюць перайсці вуліцу, воляй-няволяй зробяць гэта, калі захочуць і дзе б яны ні знаходзіліся.

Выкажам здагадку, што самакіруючы аўтамабіль едзе па хуткай вуліцы з абмежаванай хуткасцю ў 45 міль у гадзіну. Пешаход «ведае», што ІІ спыніць самакіруючы аўтамабіль. Такім чынам, пешаход кідаецца на вуліцу. На жаль, фізіка перамагае ІІ. Сістэма ваджэння з штучным інтэлектам паспрабуе спыніць самакіраванне, але імпульс аўтаномнага транспартнага сродку збіраецца перанесці шматтонную прыладу наперад і ўрэзацца ў наравістага пешахода. Вынік альбо наносіць шкоду, альбо прыводзіць да смяротнага зыходу.

Пешаходы звычайна не спрабуюць паводзіць сябе так, калі за рулём знаходзіцца чалавек. Вядома, у некаторых мясцовасцях ідзе вайна вочных яблыкаў. Пешаход глядзіць на кіроўцу. Кіроўца глядзіць на пешахода. У залежнасці ад абставін кіроўца можа спыніцца або кіроўца можа заявіць пра сваю прэтэнзію на праезную частку і нібыта адважыцца на пешахода паспрабаваць перашкодзіць ім на шляху.

Верагодна, мы не хочам, каб ІІ уступаў у падобную вайну з вочным яблыкам, якая таксама з'яўляецца крыху складанай у любым выпадку, паколькі за рулём самакіруемай машыны не сядзіць ні чалавек, ні робат (я абмяркоўваў будучыя магчымасці робатаў што гоняць, гл спасылка тут). Тым не менш, мы таксама не можам дазволіць пешаходам заўсёды браць пад руку. Вынік можа быць катастрафічным для ўсіх зацікаўленых.

Тады ў вас можа паўстаць спакуса перавярнуць гэты бок медаля і заявіць, што сістэма кіравання AI ніколі не павінна спыняцца ў такіх абставінах. Іншымі словамі, калі пешаход не мае належнага права праезду, каб пераходзіць вуліцу, ІІ заўсёды павінен лічыць, што самакіруючы аўтамабіль павінен рухацца без зніжэння. Не пашанцавала гэтым пешаходам.

Такое строгае і спрошчанае правіла не будзе добра прынята шырокай грамадскасцю. Людзі ёсць людзі, і ім не спадабаецца, калі іх цалкам закрыюць ад магчымасці пераходзіць вуліцу, нягледзячы на тое, што ў іх юрыдычна адсутнічае права праезду ў розных умовах. Вы можаце лёгка прадбачыць значны шум з боку грамадскасці і, магчыма, убачыць рэакцыю супраць далейшага прыняцця самакіраваных аўтамабіляў.

Праклятыя, калі робім, і чорт, калі не.

Я спадзяюся, што гэта прывяло вас да абгрунтаванай альтэрнатывы, што ШІ трэба запраграмаваць на падабенства прыняцця рашэнняў аб тым, як змагацца з гэтай кіруючай праблемай. Жорсткае правіла ніколі не спыняцца невыканальна, а таксама жорсткае правіла заўсёды спыняцца таксама невыканальна. ІІ павінен быць распрацаваны з некаторым алгарытмам прыняцця рашэнняў або ADM, каб справіцца з гэтым пытаннем.

Вы можаце паспрабаваць выкарыстоўваць набор даных у спалучэнні з падыходам ML/DL.

Вось як распрацоўшчыкі ІІ могуць вырашыць запраграмаваць гэтую задачу. Яны збіраюць даныя з відэакамер, размешчаных па ўсім пэўным горадзе, дзе будзе выкарыстоўвацца самакіруючы аўтамабіль. Дадзеныя дэманструюць, калі вадзіцелі-людзі выбіраюць спыняцца для пешаходаў, якія не маюць права праезду. Усё гэта сабрана ў набор даных. З дапамогай машыннага навучання і глыбокага навучання дадзеныя мадэлююцца вылічальна. Затым сістэма кіравання AI выкарыстоўвае гэтую мадэль, каб вырашыць, калі спыніцца або не спыняцца.

Як правіла, ідэя заключаецца ў тым, што з чаго б ні складаўся мясцовы звычай, менавіта так ІІ будзе кіраваць самакіруючымся аўтамабілем. Праблема вырашана!

Але ці сапраўды гэта вырашана?

Нагадаем, што я ўжо адзначаў, што існуюць даследаванні, якія паказваюць, што вадзіцелі-людзі могуць быць прадузятымі ў выбары таго, калі спыняцца для пешаходаў. Мяркуецца, што сабраныя даныя аб канкрэтным горадзе будуць утрымліваць гэтыя прадузятасці. AI ML/DL, заснаваны на гэтых дадзеных, хутчэй за ўсё, будзе мадэляваць і адлюстроўваць тыя ж прадузятасці. Сістэма кіравання AI будзе проста выконваць тыя ж існыя прадузятасці.

Каб паспрабаваць змагацца з праблемай, мы маглі б сабраць набор даных, які на самай справе мае такія прадузятасці. Мы альбо знаходзім такі набор даных, а затым пазначаем збоі, альбо сінтэтычна ствараем набор даных, каб дапамагчы ў ілюстрацыі справы.

Усе раней вызначаныя крокі будуць зробленыя, у тым ліку:

Наладзьце набор даных, які наўмысна змяшчае гэтае зрушэнне
Выкарыстоўвайце набор даных, каб навучаць мадэлі машыннага навучання (ML) і глыбокага навучання (DL) выяўленню гэтага канкрэтнага зрушэння
Прымяняйце навучаны ML/DL з дапамогай зрушэння ў адносінах да іншага ІІ, каб пераканацца, што мэтавы ІІ патэнцыйна прадузяты такім жа чынам
Зрабіце даступнымі ML/DL, навучаныя змесцівам, каб прадэманстраваць распрацоўшчыкам AI, на што трэба сачыць, каб яны маглі лёгка правяраць свае мадэлі, каб убачыць, як узнікаюць алгарытмічна прасякнутыя збоі
Прыкладам небяспекі прадузятага ІІ як часткі этыкі ІІ і этычнага ўсведамлення ІІ з дапамогай гэтага дадатковага канкрэтнага прыкладу
іншае

заключэнне

Давайце вернемся да адкрыцця радка.

Каб ведаць аднаго, трэба.

Некаторыя тлумачаць, што гэта неверагодна распаўсюджанае выслоўе мае на ўвазе, што калі справа даходзіць да выяўлення таксічнага ІІ, мы павінны надаваць належнае ўпэўненасць у стварэнні і выкарыстанні таксічнага ІІ для выяўлення і барацьбы з іншым таксічным ІІ. Вынік: часам патрабуецца злодзей, каб злавіць іншага злодзея.

Выказана занепакоенасць тым, што, магчыма, мы робім усё, каб пачаць рабіць злодзеяў. Ці хочам мы распрацаваць таксічны ІІ? Ці не здаецца гэта вар'яцкай ідэяй? Некаторыя ярка сцвярджаюць, што мы павінны забараніць увесь таксічны ІІ, у тым ліку такі ІІ, які быў свядома створаны, нават калі нібыта для гераічнага або галантнага ІІ Назаўсёды мэта.

Шуміць таксічны ІІ у любым разумным або падступным выглядзе, які ён можа паўстаць.

На дадзены момант апошні паварот на гэтую тэму. Звычайна мы мяркуем, што гэтая знакамітая лінія мае дачыненне да людзей або рэчаў, якія робяць дрэнныя або кіслыя ўчынкі. Вось як мы прыходзім да паняцця, што злодзей патрэбны злодзею, каб злавіць злодзея. Магчыма, нам варта перавярнуць гэтую прымаўку з ног на галаву і зрабіць яе хутчэй шчаслівым, чым сумным тварам.

Вось як.

Калі мы хочам, каб штучны інтэлект быў непрадузятым і нетоксичным, можна ўявіць, што яго трэба ведаць. Магчыма, для таго, каб распазнаць і нарадзіць далейшую веліч і дабрыню, патрабуецца самае вялікае і лепшае. У гэтым варыянце мудрасці мудрасці мы трымаем позірк на шчаслівым твары і імкнемся засяродзіцца на прыдумленні ІІ Назаўсёды.

Калі вы разумееце, што я маю на ўвазе, гэта было б больш аптымістычным і задавальняюча вясёлым пунктам гледжання на тое, каб яго ведаць.

Крыніца: https://www.forbes.com/sites/lanceeliot/2022/06/15/ai-ethics-shocking-revelation-that-training-ai-to-be-toxic-or-biased-might-be- карысныя-у тым ліку для тых-аўтаномных-самакіраваных аўтамабіляў/