MacWhisper este software-ul gratuit de transcriere pe care îl așteptam

Căutați software pentru Mac pentru a transcrie fișiere audio în fișiere text scrise? Există o mulțime de instrumente plătite, cum ar fi Otter.ai și Trint, care pot costa bani reali atunci când începeți să le utilizați prea mult. Dar MacWhisper este soluția gratuită pe care internetul a așteptat-o. Sau, cel puțin, cea pe care o așteptam.

OpenAI a lansat un program gratuit incredibil de puternic în septembrie 2022, care le-a permis persoanelor cu cunoștințe de tehnologie să-și convertească fișierele audio și video în transcrieri incredibil de precise. Problema a fost că nu era foarte accesibil pentru utilizatorul obișnuit, deoarece trebuia să fiți familiarizat cu utilizarea comenzilor în aplicația Terminal.

Dar cu MacWhisper, care a fost observat prima dată de 9to5Mac, cineva a dezvoltat în sfârșit o interfață grafică cu utilizatorul, care se bazează pe Whisper de la OpenAI și lasă toate chestiile tehnice confuze sub capotă, permițându-vă doar să glisați și să plasați fișierul audio și să obțineți o transcriere foarte rapid. Și MacWhisper este extrem de precis, deoarece Whisper de la OpenAI a fost antrenat 680,000 oră a datelor audio de pe web.

Unul dintre lucrurile frumoase despre MacWhisper este că nu încărcați fișierul audio sau video pe care doriți să îl transcrieți pe internet. Acest lucru este important pentru jurnaliștii care pot lucra la o poveste sensibilă sau pentru oricine este, în general, precaut să-și încarce fișierele personale în cloud. Fișierul rămâne pe desktop, ceea ce înseamnă că nu există nicio șansă ca cineva să vă intercepteze sunetul.

Din nou, MacWhisper este doar o nouă interfață de utilizator pentru un program gratuit care a fost introdus de OpenAI la sfârșitul anului trecut, dar va face transcrierea audio ușoară pentru aproape oricine. Pentru că am folosit Whisper și l-am găsit extrem de util de când a fost lansat. Și chiar și eu acum voi folosi MacWhsiper, pentru că sigur îmi va accelera fluxul de lucru.

Ca doar un exemplu, după știrile despre prăbușirea companiei cripto FTX, am folosit Whisper pentru a transcrie zeci de ore de interviuri vechi pe YouTube cu fondatorul companiei Sam Bankman-Fried. De acolo, am reușit să caut transcrieri și să găsesc idei ciudate și interesante pentru articole de scris, ca atunci când SBF a spus în iunie 2021 că blockchain ar fi reparat Enron. Comparația SBF cu Enron a fost o coincidență ciudată, având în vedere tot ceea ce știm acum despre cum s-a prăbușit FTX. Dar nu aș fi găsit niciodată acel moment într-un interviu obscur, fără să am zeci de stenograme pe care le-aș putea căuta. Și acest proces, deși mai ușor decât ascultarea ore și ore de casete, a fost totuși neplăcut și nu foarte automatizat.

După ce am instalat Whisper pe mașina mea, obișnuiam să tastam „whisper audiofilename.mp3 —model tiny.en” în aplicația Terminal pentru Mac de fiecare dată când doream să transcriu un fișier. Cu WhisperMac, pot doar să trageți și să plasez fișierul meu audio și își face magia fără nicio tastare suplimentară.

Am testat MacWhisper cu un episod din NBC Nightly News pe care l-am descărcat de pe YouTube. Și în afară de câteva erori, cum ar fi interpretarea cuvântului „friguri de vânt” ca „friguri de vânt” și auzirea lui Lester Holt drept „Lester Hold”, transcrierea a fost foarte exactă. MacWhisper este gratuit, dar există un nivel plătit al software-ului care ar putea fi puțin mai precis, deoarece folosește modelele de antrenament mai intensive ale OpenAI, dar versiunea gratuită va funcționa grozav pentru majoritatea oamenilor.

MacWhisper vă permite să exportați cuvântul transcris în câteva formate diferite, inclusiv text simplu, CSV sau chiar un format de fișier cu subtitrări precum SRT și VTT.

Și MacWhisper nu este doar pentru engleză. Puteți transcrie sunetul în 100 de limbi diferite, ceea ce este incredibil de util. Singura caracteristică pe care MacWhisper nu o are, cu care mi-a plăcut să mă joc în Whisper în aplicația Terminal, este traducerea în limbă. Am tradus videoclipuri virale în rusă și chineză și mi sa spus de către oameni care vorbesc limbile pe Twitter că traducerile sunt precis.

Cealaltă caracteristică pe care MacWhisper nu o are, deși nu este disponibilă nici de la Whisper de la OpenAI, este capacitatea de a diferenția difuzoarele. De exemplu, dacă transcrieți un interviu cu doi vorbitori, nu există semne clare care să arate când un vorbitor s-a oprit și altul a început. Dar bănuiesc că cineva va construi această capacitate în cele din urmă. Serviciile plătite precum Trint fac acest lucru automat și ar fi grozav să le aveți gratuit în cele din urmă, dar obțineți ceea ce plătiți.

Există, de asemenea, o funcție cu MacWhisper prin care puteți converti vorbirea de la microfonul computerului în text, ceea ce ar putea fi util dacă doriți să transcrieți ceva din mers.

M-am petrecut luni de zile întrebându-mă când va dezvolta cineva în sfârșit o interfață grafică pentru Whisper, deoarece câțiva oameni au încercat, dar nu au creat nimic foarte ușor de utilizat. Dar MacWhisper, care a fost dezvoltat de Jordi Bruin, este software-ul pe care îl așteptam. Bruin a dezvoltat și software precum MacGPT, care permite utilizatorilor să acceseze ChatGPT din bara de meniu.

Puteți descărca MacWhisper gratuit, cu înregistrare prin e-mail, pe site-ul lui Bruin.

Sursa: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/