MacWhisper është softueri falas i transkriptimit që kam pritur

Po kërkoni softuer Mac për të transkriptuar skedarët audio në skedarë teksti të shkruar? Ka shumë mjete me pagesë, si Otter.ai dhe Trint, që mund të kushtojnë para të vërteta kur filloni t'i përdorni shumë. Por MacWhisper është zgjidhja falas që ka pritur interneti. Ose, të paktën, atë që kam pritur.

OpenAI lëshoi ​​​​një program pa pagesë tepër të fuqishëm në shtator 2022, i cili u lejoi njerëzve me njohuri teknologjike të konvertonin skedarët e tyre audio dhe video në transkripte tepër të sakta. Problemi ishte se nuk ishte shumë i aksesueshëm për përdoruesin mesatar, pasi duhej të njiheshe me përdorimin e komandave në aplikacionin Terminal.

Por me MacWhisper, i cili u pa për herë të parë nga 9to5Mac, dikush më në fund ka zhvilluar një GUI, ose ndërfaqe grafike të përdoruesit, që ndërtohet në krye të Whisper-it të OpenAI dhe lë të gjitha gjërat konfuze të teknologjisë nën kapuç, duke ju lejuar thjesht të tërhiqni dhe lëshoni skedarin tuaj audio dhe të merrni një transkriptim shumë shpejt. Dhe MacWhisper është jashtëzakonisht i saktë sepse Whisper i OpenAI është trajnuar orë 680,000 të të dhënave audio në ueb.

Një nga gjërat e këndshme për MacWhisper është se nuk po ngarkoni skedarin audio ose video që dëshironi të transkriptohet në internet. Kjo është e rëndësishme për gazetarët që mund të punojnë në një histori të ndjeshme, ose këdo që është përgjithësisht i kujdesshëm për të ngarkuar skedarët e tyre personalë në re. Skedari qëndron në desktopin tuaj, që do të thotë se nuk ka asnjë shans që dikush të përgjojë audion tuaj.

Përsëri, MacWhisper është vetëm një ndërfaqe e re përdoruesi për një program falas që u prezantua nga OpenAI në fund të vitit të kaluar, por me të vërtetë do ta bëjë transkriptimin audio të lehtë për pothuajse këdo. Sepse unë e kam përdorur Whisper dhe e kam parë jashtëzakonisht të dobishëm që kur u publikua. Dhe madje edhe unë tani do të përdor MacWhsiper, sepse sigurisht që do të shpejtojë rrjedhën time të punës.

Si vetëm një shembull, pas lajmeve për rënien e kompanisë së kriptove FTX, përdora Whisper për të transkriptuar dhjetëra orë intervista të vjetra në YouTube me themeluesin e kompanisë Sam Bankman-Fried. Nga atje, unë munda të kërkoja transkriptet dhe të gjeja ide të çuditshme dhe interesante për artikuj për të shkruar, si kur SBF tha në qershor 2021 se blockchain do të kishte rregulluar Enron. Krahasimi i SBF me Enron ishte një rastësi e çuditshme, duke pasur parasysh gjithçka që dimë tani se si FTX u shemb. Por nuk do ta kisha gjetur kurrë atë moment në një intervistë të vjetër të errët, pa pasur dhjetëra transkripte që mund të kërkoja. Dhe ky proces, ndonëse më i lehtë sesa dëgjimi i kasetave me orë e orë të tëra, ishte ende i ngathët dhe jo shumë i automatizuar.

Pasi u instalova Whisper në kompjuterin tim, shkruaja "whisper audiofilename.mp3 —model tiny.en" në aplikacionin Terminal të Mac sa herë që doja të transkriptoja një skedar. Me WhisperMac, unë thjesht mund të tërhiq dhe lëshoj skedarin tim audio dhe ai bën magjinë e tij pa ndonjë shtypje shtesë.

Kam testuar MacWhisper me një episod të NBC Nightly News që e kam shkarkuar nga YouTube. Dhe përveç disa gabimeve, si interpretimi i fjalës "dridhje të erës" si "rreth erë" dhe dëgjimi i Lester Holt si "Lester Hold", transkripti ishte shumë i saktë. MacWhisper është falas, por ekziston një nivel i paguar i softuerit që mund të jetë pak më i saktë sepse përdor modelet më intensive të trajnimit të OpenAI, por versioni falas do të funksionojë shumë mirë për shumicën e njerëzve.

MacWhisper ju lejon të eksportoni fjalën e transkriptuar në disa formate të ndryshme, duke përfshirë tekstin e thjeshtë, CSV apo edhe një format skedari të titrave si SRT dhe VTT.

Dhe MacWhisper nuk është vetëm për anglisht. Ju mund të transkriptoni audion në 100 gjuhë të ndryshme, gjë që është jashtëzakonisht e dobishme. E vetmja veçori që MacWhisper nuk e ka, me të cilën më ka pëlqyer të luaja në Whisper në aplikacionin Terminal, është përkthimi i gjuhës. Unë kam përkthyer video virale në rusisht dhe kinezisht dhe më kanë thënë nga njerëz që flasin gjuhët në Twitter se përkthimet janë i saktë.

Karakteristika tjetër që MacWhisper nuk e ka, megjithëse nuk është gjithashtu e disponueshme nga Whisper e OpenAI, është aftësia për të dalluar altoparlantët. Për shembull, nëse jeni duke transkriptuar një intervistë me dy folës, nuk ka shenja të qarta që tregojnë kur një folës ka ndaluar dhe një tjetër ka filluar. Por unë dyshoj se dikush do ta ndërtojë atë aftësi përfundimisht. Shërbimet me pagesë si Trint e bëjnë këtë automatikisht dhe do të ishte mirë që përfundimisht ta kishit falas, por ju merrni atë që paguani.

Ekziston gjithashtu një veçori me MacWhisper ku mund të konvertoni fjalimin nga mikrofoni i kompjuterit tuaj në tekst, i cili mund të jetë i dobishëm nëse doni të transkriptoni diçka menjëherë.

Kalova muaj të tërë duke pyetur veten se kur dikush do të zhvillonte më në fund një GUI për Whisper, pasi disa njerëz e provuan, por nuk krijuan asgjë shumë miqësore për përdoruesit. Por MacWhisper, i cili u zhvillua nga Jordi Bruin, është softueri që kam pritur. Bruin ka zhvilluar gjithashtu softuer si MacGPT, i cili i lejon përdoruesit të hyjnë në ChatGPT nga shiriti i tyre i menusë.

Mund të shkarkoni MacWhisper falas, me regjistrim me email, në faqen e internetit të Bruin.

Burimi: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/