Заснавальнік Midjourney Дэвід Хольц пра ўплыў штучнага інтэлекту на мастацтва, уяўленне і творчую эканоміку

Прамежак падарожжа з'яўляецца адным з вядучых рухавікоў новай тэхналогіі выкарыстання штучнага інтэлекту (AI) для стварэння візуальных вобразаў з тэкставых падказак. Стартап, які базуецца ў Сан-Францыска, нядаўна трапіў у навіны ў якасці рухавіка, які стаіць за мастацкім творам, які атрымаў узнагароду ў кірмашовым конкурсе штата Каларада, і гэта наўрад ці будзе апошняй складанай праблемай, з якой мастацтва штучнага інтэлекту сутыкнецца ў бліжэйшыя гады.

Midjourney адрозніваецца ад іншых у прасторы, падкрэсліваючы жывапісную эстэтыку ў вобразах, якія ствараюцца. Платформа не спрабуе ствараць фотарэалістычныя выявы, якія можна прыняць за фатаграфіі, і генеральны дырэктар Дэвід Хольц кажа, што асабіста яго вельмі хвалюе дзіўная якасць дыпфейкаў і іншай працы, якая занадта дакладна імітуе рэальнасць. Замест гэтага Хольц кажа, што Midjourney распрацаваны, каб раскрыць творчы патэнцыял звычайных людзей, даючы ім інструменты для стварэння прыгожых фатаграфій, проста апісваючы іх.

Але, нягледзячы на ​​гуманістычную, арыентаваную на спажыўца ўвагу кампаніі, непазбежна ўзнікаюць пытанні аб наступствах для камерцыйнага мастацтва і прафесійных мастакоў. Я браў інтэрв'ю ў Хольца для a больш шырокая частка пра патэнцыйныя збоі, якія штучны інтэлект можа выклікаць у вытворчасці вобразаў для забаў, відэагульняў і выдавецтва. Вось больш працяглы ўрывак з нашай размовы, у якой Хольц дае больш глыбіні і кантэксту, разглядаючы гэтыя праблемы і выкладаючы сваё бачанне кампаніі, галіны і тэхналогій. Інтэрв'ю было адрэдагавана для даўжыні і яснасці.

Роб Салковіц, аўтар Forbes: Якая ваша роля і тытул?

Дэвід Хольц, Midjourney. Я заснавальнік і генеральны дырэктар. Але звычайна я аддаю перавагу, каб мяне называлі заснавальнікам, таму што генеральны дырэктар гучыць вельмі дзелавіта, а мы не вельмі дзелавыя. Мы - лабараторыя прыкладных даследаванняў, якая вырабляе прадукты.

Якая місія Midjourney?

Нам падабаецца казаць, што мы спрабуем пашырыць магчымасці ўяўлення чалавека. Мэта складаецца ў тым, каб зрабіць людзей больш фантазійнымі, а не ствараць фантазійныя машыны, што, на мой погляд, з'яўляецца важным адрозненнем.

Ці можаце вы даць кароткую гісторыю кампаніі на сённяшні дзень?

Мы пачалі працаваць над ідэйнай часткай нашай кампаніі каля паўтара года таму. Былі некаторыя прарывы ​​ў мадэлях дыфузіі, людзі разумелі кліпы, адкрыты штучны інтэлект і г.д. Амаль усе, хто ўдзельнічае ў гэтым, - Сан-Францыска, і мы ўсе зразумелі, што гэта стане сур'ёзным, што гэта адрозніваецца ад многіх іншых рэчаў.

У чым Midjourney бачыць карысць гэтай тэхналогіі пераўтварэння тэксту ў відарыс для бізнесу і грамадства?

Мяне, безумоўна, больш хвалюе грамадства, чым бізнес. Мы спажывецкі прадукт, але, магчыма, 30%-50% нашых карыстальнікаў зараз з'яўляюцца прафесіяналамі. Большасць - не. Мастакі на платформе кажуць нам, што гэта дазваляе ім быць больш крэатыўнымі і даследчыцкімі ў пачатку, прыдумляючы шмат ідэй за кароткі прамежак часу.

Зараз нашы прафесійныя карыстальнікі выкарыстоўваюць платформу для канцэпцыі. Самая складаная частка [камерцыйнага арт-праекта] часта бывае ў пачатку, калі зацікаўленыя бакі не ведаюць, чаго хочуць, і павінны ўбачыць некаторыя ідэі, на якія можна адрэагаваць. Midjourney можа дапамагчы людзям значна хутчэй прыйсці да патрэбнай ідэі, таму што ітэрацыя гэтых паняццяў вельмі працаёмкая.

Яшчэ адна перавага для мастакоў заключаецца ў тым, што яны даюць людзям упэўненасць у тых сферах, у якіх яны не ўпэўненыя. Большасць, калі не ўсе мастакі, адчуваюць, што ёсць частка мастацтва, якую яны не могуць рабіць добра. Гэта могуць быць колеры, кампазіцыя, фон. У нас ёсць вядомы дызайнер персанажаў, які выкарыстоўвае наш прадукт, і людзі пытаюцца ў яго, навошта вам выкарыстоўваць ІІ, калі вы і так добрыя. І ён сказаў: «Ну, я добры толькі ў характары. Гэта дапамагае мне з астатнім, светам, фонам, каляровымі схемамі».

Прыкладна колькі чалавек карыстаецца прадуктам?

Ім карыстаюцца мільёны. Наш Discord перавышае два мільёны. На сённяшні дзень гэта самы вялікі актыўны сервер Discord.

Ці дазваляе ліцэнзія Midjourney камерцыйнае выкарыстанне малюнкаў, створаных платформай?

так. Але калі вы працуеце ў кампаніі з гадавым даходам больш за мільён долараў, мы просім вас купіць карпаратыўную ліцэнзію.

Як быў створаны набор даных?

Гэта проста вялікі абрывак Інтэрнэту. Мы выкарыстоўваем апублікаваныя наборы адкрытых даных і навучаемся іх. І я б сказаў, што гэта тое, што робяць 100% людзей. Мы не былі пераборлівымі. Навука вельмі хутка развіваецца з пункту гледжання таго, колькі дадзеных вам сапраўды трэба, у параўнанні з якасцю мадэлі. Спатрэбіцца некалькі гадоў, каб па-сапраўднаму разабрацца ў рэчах, і да таго часу ў вас могуць быць мадэлі, якіх вы амаль нічога не трэніруеце. Ніхто сапраўды не ведае, што яны могуць зрабіць.

Вы шукалі згоды ў жывых мастакоў ці ўсё яшчэ працуеце пад аўтарскім правам?

Не. На самай справе не існуе спосабу атрымаць сто мільёнаў малюнкаў і ведаць, адкуль яны. Было б крута, калі б у выявы былі ўбудаваныя метаданыя пра ўладальніка аўтарскіх правоў ці нешта падобнае. Але гэта не рэч; няма рэестра. Няма магчымасці знайсці фатаграфію ў інтэрнэце, а затым аўтаматычна адсачыць яе да ўладальніка, а затым мець любы спосаб зрабіць што-небудзь, каб пацвердзіць яе сапраўднасць.

Ці могуць мастакі адмовіцца ад уключэння ў вашу мадэль навучання дадзеных?

Мы разглядаем гэта. Зараз задача заключаецца ў тым, каб высветліць, якія правілы і як вызначыць, ці сапраўды чалавек з'яўляецца мастаком пэўнага твора, ці ён проста ставіць на ім сваё імя. Мы не сустракалі нікога, хто хацеў бы выдаліць сваё імя з набору даных.

Ці могуць артысты адмовіцца ад таго, каб іх называлі ў падказках?

Не зараз. Мы разглядаем гэта. Зноў жа, нам трэба будзе знайсці спосаб аўтэнтыфікацыі гэтых запытаў, што можа быць складаным.

Што вы скажаце камерцыйным артыстам, якія баяцца, што гэта знішчыць іх сродкі да існавання? Навошта ў пэўны момант арт-дырэктару наймаць ілюстратара для стварэння такіх работ, як канцэпт-арт, дызайн вытворчасці, фоны - такія рэчы - калі яны могуць проста ўводзіць падказкі і атрымліваць карысную прадукцыю нашмат хутчэй і з меншымі выдаткамі?

Гэта яшчэ шмат працы. Гэта не проста «зрабі мне фон». Гэта можа быць у дзесяць разоў менш працы, але гэта значна больш працы, чым менеджэр збіраецца зрабіць.

Я думаю, што гэта можа пайсці двума шляхамі. Адзін са спосабаў - паспрабаваць забяспечыць той жа ўзровень кантэнту, які спажываюць людзі, па больш нізкай цане, так? І іншы спосаб зрабіць гэта - стварыць надзвычай лепшы кантэнт па тых цэнах, якія мы ўжо гатовыя выдаткаваць. Я лічу, што большасць людзей, калі яны ўжо трацяць грошы, і ў вас ёсць выбар паміж надзвычай лепшым кантэнтам або больш танным кантэнтам, насамрэч выбіраюць надзвычай лепшы кантэнт. Рынак ужо ўсталяваў цану, якую людзі гатовыя плаціць.

Я думаю, што некаторыя людзі паспрабуюць выразаць артыстаў. Яны паспрабуюць зрабіць нешта падобнае з меншымі выдаткамі, і я думаю, што яны праваліцца на рынку. Я думаю, што рынак будзе ісці ў бок больш высокай якасці, большай крэатыўнасці і значна больш складанага, разнастайнага і глыбокага кантэнту. І людзі, якія сапраўды ўмеюць карыстацца, як мастакі, і выкарыстоўваюць для гэтага інструменты, - тыя, хто збіраецца выйграць.

Гэтыя тэхналогіі сапраўды ствараюць значна больш глыбокае разуменне і пісьменнасць у візуальным асяроддзі. Вы сапраўды можаце мець попыт, апярэдзіць здольнасць прадзюсаваць на такім узроўні, і тады, магчыма, вы сапраўды павялічыце заробкі артыстам. Гэта можа быць дзіўным, але гэта тое, што адбудзецца. Хуткі рост попыту як на якасць, так і на разнастайнасць прывядзе да стварэння цудоўных і нечаканых праектаў.

Пакаленне студэнтаў скончыла школы мастацтваў, многія з іх былі ў даўгах, разлічваючы на ​​адносна добра аплачваную працу ў вытворчасці забаў, відэагульняў, камерцыйнага мастацтва і гэтак далей. Як з'яўленне AI-платформаў пераўтварэння тэксту ў малюнак уплывае на іх будучыню?

Я думаю, хтосьці паспрабуе скараціць выдаткі, а хтосьці паспрабуе пашырыць амбіцыі. Я думаю, што людзі, якія пашыраюць амбіцыі, па-ранейшаму будуць плаціць тыя самыя заробкі, а людзі, якія спрабуюць скараціць выдаткі, я думаю, пацерпяць няўдачу.

Штучны інтэлект звычайна выкарыстоўваецца ў маштабах для такіх рэчаў, як колл-цэнтры або праверкі сумак у аэрапортах, а таксама для такіх работ, якія людзі не вельмі хочуць выконваць. Каштоўная прапанова заключаецца ў тым, што гэта вызваляе людзей для выканання больш карысных і цікавых відаў працы. Але мастацкая праца карысная і цікавая. Людзі працуюць усё жыццё і развіваюць свае навыкі, каб атрымаць такую ​​працу. Чаму вы паказваеце гэтую тэхналогію на такім узроўні эканомікі як своеасаблівы бізнес-цэнтр і прыярытэт для таго, што вы робіце?

Асабіста я не. Мае рэчы не створаны для прафесійных мастакоў. Калі яны любяць яго выкарыстоўваць, то гэта выдатна. Мае рэчы створаны для падобных людзей, якія, напрыклад, ёсць адна жанчына ў Ганконгу, і яна прыйшла да мяне, і яна кажа: "Адзіная рэч у Ганконгу, якой вашы бацькі ніколі не хочуць, каб вы былі мастаком, і я" м цяпер банкір. Я жыву добрым банкірскім жыццём. Але з Midjourney цяпер я на самой справе пачынаю адчуваць смак таго, як быць чалавекам, якім я хацеў быць». Або хлопец на прыпынку грузавікоў, які робіць уласныя бейсбольныя карткі з дзікімі выявамі, проста дзеля забавы. Гэта зроблена для гэтых людзей, таму што, як і большасць людзей, яны ніколі не могуць рабіць гэтыя рэчы.

Важна падкрэсліць, што гаворка не ідзе пра мастацтва. Гэта пра ўяўленне. Уяўленне часам выкарыстоўваецца для мастацтва, але часта не. Большасць малюнкаў, створаных на Midjourney, не выкарыстоўваюцца прафесійна. Яны нават не дзеляцца. Яны проста выкарыстоўваюцца для гэтых іншых мэтаў, гэтых самых чалавечых патрэб.

Тым не менш, вынік вашага прадукту - гэта выявы, якія маюць камерцыйную каштоўнасць у прафесійным кантэксце ў дадатак да ўсіх гэтых іншых уласцівасцей. І гэта вельмі разбуральна для эканомікі.

Я думаю, што мы робім лодку, і хто-небудзь можа ўдзельнічаць у гонках на лодцы, але гэта не значыць, што лодка прызначана для гонак. Калі вы выкарыстоўваеце лодку для гонак, то, магчыма, так, вядома. У той момант гэта так. Але чалавечы бок сапраўды мае значэнне, і я думаю, што мы не... Мы хочам, каб фатаграфіі выглядалі прыгожа. Мы не лічым сябе спрабуючымі ствараць мастацтва як частку нашай справы. Мы хочам, каб свет быў больш вобразным. Мы аддаем перавагу рабіць прыгожыя рэчы, чым брыдкія.

Ці лічыце вы, што які-небудзь дзяржаўны орган мае юрысдыкцыю або паўнамоцтвы рэгуляваць гэтую тэхналогію? І калі так, то вы лічыце, што яны павінны?

не ведаю Рэгламент цікавы. Вы павінны збалансаваць свабоду рабіць што-небудзь са свабодай быць абароненым. Сама тэхналогія - не праблема. Гэта як вада. Вада можа быць небяспечнай, у ёй можна патануць. Але гэта таксама істотна. Мы не хочам забараняць ваду толькі дзеля таго, каб пазбегнуць небяспечных частак.

Што ж, мы хочам быць упэўненымі, што наша вада чыстая.

Так, гэта праўда.

Крыніца: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- крэатыў-эканоміка/