MacWhisper - бясплатнае праграмнае забеспячэнне для транскрыпцыі, якога я так доўга чакаў

Вы шукаеце праграмнае забеспячэнне Mac для транскрыпцыі аўдыяфайлаў у пісьмовыя тэкставыя файлы? Ёсць шмат платных інструментаў, такіх як Otter.ai і Trint, якія могуць каштаваць рэальных грошай, калі вы пачынаеце выкарыстоўваць іх занадта часта. Але MacWhisper гэта бясплатнае рашэнне, якога чакаў Інтэрнэт. Ці, прынамсі, той, якога я чакаў.

OpenAI выпусціў неверагодна магутную бясплатную праграму яшчэ ў верасні 2022 года, якая дазволіла людзям з некаторымі тэхнічнымі навыкамі канвертаваць свае аўдыя- і відэафайлы ў неверагодна дакладныя стэнаграмы. Праблема заключалася ў тым, што ён быў не вельмі даступны звычайнаму карыстальніку, бо вам трэба было ведаць, як выкарыстоўваць каманды ў праграме Terminal.

Але з MacWhisper, які ўпершыню заўважыў 9to5Mac, хтосьці нарэшце распрацаваў графічны інтэрфейс, або графічны карыстальніцкі інтэрфейс, які заснаваны на OpenAI's Whisper і пакідае ўсе заблытаныя тэхнічныя рэчы пад капотам, дазваляючы вам проста перацягнуць свой аўдыяфайл і атрымаць транскрыпцыю вельмі хутка. І MacWhisper надзвычай дакладны, таму што Whisper OpenAI быў навучаны 680,000 гадзін аўдыядадзеных у інтэрнэце.

Адна з прыемных асаблівасцей MacWhisper - гэта тое, што вы не загружаеце ў Інтэрнэт аўдыя- або відэафайлы, якія хочаце транскрыбаваць. Гэта важна для журналістаў, якія, магчыма, працуюць над дэлікатнай гісторыяй, або для ўсіх, хто проста асцерагаецца загружаць свае асабістыя файлы ў воблака. Файл застаецца на вашым працоўным стале, што азначае, што ніхто не можа перахапіць ваш гук.

Зноў жа, MacWhisper - гэта толькі новы карыстальніцкі інтэрфейс для бясплатнай праграмы, якая была прадстаўлена OpenAI у канцы мінулага года, але яна сапраўды зробіць транскрыпцыю аўдыя простай для ўсіх. Таму што я выкарыстоўваю Whisper і знайшоў яго надзвычай карысным з моманту яго выпуску. І нават я цяпер буду выкарыстоўваць MacWhsiper, таму што гэта напэўна паскорыць мой працоўны працэс.

У якасці толькі аднаго прыкладу: пасля навін аб краху крыптакампаніі FTX я выкарыстаў Whisper, каб перапісаць дзясяткі гадзін старых інтэрв'ю YouTube з заснавальнікам кампаніі Сэмам Бэнкманам-Фрыдам. Адтуль я змог шукаць стэнаграмы і знаходзіць дзіўныя і цікавыя ідэі для напісання артыкулаў, напрыклад, калі SBF сказаў у чэрвені 2021 года, што blockchain выправіў бы Enron. Параўнанне SBF з Enron было дзіўным супадзеннем, улічваючы ўсё, што мы зараз ведаем аб краху FTX. Але я б ніколі не знайшоў гэты момант у старым незразумелым інтэрв'ю, не маючы дзесяткаў стэнаграм, якія я мог бы шукаць. І хоць гэты працэс быў прасцей, чым праслухоўванне гадзін і гадзін запісаў, усё ж быў нязграбным і не вельмі аўтаматызаваным.

Пасля ўстаноўкі Whisper на маёй машыне я ўводзіў «whisper audiofilename.mp3 —model tiny.en» у праграме тэрмінала Mac кожны раз, калі хацеў транскрыбаваць файл. З дапамогай WhisperMac я магу проста перацягнуць свой аўдыяфайл, і ён зробіць сваю магію без лішняга ўводу.

Я пратэставаў MacWhisper з эпізодам NBC Nightly News, які спампаваў з YouTube. І акрамя некалькіх памылак, такіх як інтэрпрэтацыя слова «windchills» як «windshills» і пачуцця Лестэра Холта як «Lester Hold», стэнаграма была вельмі дакладнай. MacWhisper бясплатны, але ёсць платны ўзровень праграмнага забеспячэння, які можа быць крыху больш дакладным, таму што выкарыстоўвае больш інтэнсіўныя навучальныя мадэлі OpenAI, але бясплатная версія выдатна падыдзе большасці людзей.

MacWhisper дазваляе вам экспартаваць транскрыбаванае слова ў некалькі розных фарматаў, уключаючы звычайны тэкст, CSV або нават фармат файла субтытраў, напрыклад SRT і VTT.

І MacWhisper прызначаны не толькі для англійскай мовы. Вы можаце транскрыбаваць аўдыя на 100 розных мовах, што вельмі зручна. Адзіная асаблівасць, якой няма ў MacWhisper і з якой мне падабалася гуляць у Whisper у дадатку Terminal, - гэта пераклад мовы. Я перакладаў вірусныя відэа на рускую і кітайскую мовы, і людзі, якія размаўляюць на гэтых мовах, сказалі мне ў Twitter, што пераклады дакладны.

Яшчэ адна асаблівасць, якой няма ў MacWhisper, хоць яна таксама недаступная ў Whisper OpenAI, - гэта магчымасць адрозніваць дынамікаў. Напрыклад, калі вы расшыфроўваеце інтэрв'ю з двума дакладчыкамі, няма дакладных пазнакаў, якія паказваюць, калі адзін дакладчык спыніўся, а другі пачаў. Але я падазраю, што ў рэшце рэшт хтосьці створыць гэтую магчымасць. Платныя сэрвісы, такія як Trint, робяць гэта аўтаматычна, і было б выдатна, каб у рэшце рэшт яны былі бясплатнымі, але вы атрымліваеце тое, за што плаціце.

У MacWhisper таксама ёсць функцыя, з дапамогай якой вы можаце пераўтварыць маўленне з мікрафона вашага кампутара ў тэкст, што можа быць зручна, калі вы хочаце транскрыбаваць што-небудзь на хаду.

Я правёў месяцы, разважаючы, калі хто-небудзь нарэшце распрацуе графічны інтэрфейс для Whisper, бо некалькі чалавек паспрабавалі, але не стварылі нічога вельмі зручнага для карыстальніка. Але MacWhisper, які быў распрацаваны Jordi Bruin, - гэта праграмнае забеспячэнне, якога я чакаў. Bruin таксама распрацаваў праграмнае забеспячэнне накшталт MacGPT, які дазваляе карыстальнікам атрымліваць доступ да ChatGPT з радка меню.

Вы можаце спампаваць MacWhisper бясплатна, з рэгістрацыяй па электроннай пошце, на сайце Bruin.

Крыніца: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/