Зодиак Белгісіне Өтемақы
Атқарушылық Бағалары

Zodiac Белгісімен Үйлесімділікті Біліңіз

Журналистерге арналған ең жақсы автоматты транскрипция құралдары

Техника Және Құралдар

Сири жаңа ғана алты жасқа толды. Alexa үшке енді ғана толды. Егер біз телефондарымыздан Альбукеркедегі ауа-райын сұрап, Вашингтон Постты дауыстап оқу үшін қонақ бөлмелеріміздегі пластикалық цилиндрді мәжбүрлей алатын болсақ, неге біз сұхбаттарды әлі де қолмен жазып жатырмыз?

Бізге шынымен де міндетті емес екені белгілі болды. Автоматты транскрипция құралдары нарықта біраз уақыттан бері болды және олар ақырында жақсы бола бастады. Енді сайтқа аудио немесе бейне жүктеп салу және жеткілікті толық транскрипт алу үшін бірнеше минут және бірнеше доллар қажет.

Бірақ, барлық құралдар сияқты, кейбіреулері басқаларға қарағанда жақсы. Біз журналистерге арналған ең танымал сегіз транскрипция құралын сынақтан өткіздік (немесе сынап көрдік — кейінірек) Айдаһар диктанты , Бақытты Жазушы , oТранскрипциялау , рекордтық , Аян , Sonix , Тринт және YouTube. Біз әрбір құралды әртүрлі нақты сценарийлер арқылы іске асырдық, олардың әрқайсысы журналистің әдеттегі қолдануына қалай қарсы екеніне тәжірибе жасадық.

Құралдардың ешқайсысы мінсіз болмаса да, біреуі басқаларын санаттағы ең жақсы деп тапты.

Біздің таңдауымыз
Дәлдік, мүмкіндіктер және пайдалану қарапайымдылығы Trint-ті журналистер үшін автоматты транскрипция үшін ең жақсы таңдау жасайды. Бұл біз қолданып көрген ең дәл, мүмкіндігіне ең бай немесе ең арзан құрал болмаса да, оның транскриптті өңдеу құралдары мен журналистің жұмыс процесіне сәл ғана кедергісіз ену мүмкіндігі оған бәсекелестерін жеңуге көмектеседі. Неліктен екенін білу үшін оқыңыз.

Эксперимент
Көріп отырғаныңыздай, бұл құралдардың дәлдік көрсеткіштері төмен. Себебі біз оларды шатастыруға тырыстық.

Біріншіден, адамдардың кең ауқымын, дауыстарын және екпіндерін көрсету үшін біз төрт қатысушымен үлгі аудио жаздырдық. Олар мыналарды қамтиды:

  • Алексиос Манцарлис , Пойнтер факультетінің оқытушысы және Римнен шыққан және өзін «британдық, итальяндық және біртүрлі американдық екпіндерді араластыратын кейбір күлкілі сөздер» деп сипаттайтын халықаралық факт-тексеру желісінің директоры.
  • тәтті гүл шоқтары , қыркүйекте Мехикодан Пойнтерге келген халықаралық факт-тексеру желісінің бағдарлама менеджері
  • Кристен Харе , Poynter журналисі, ол жазбаларда өзін тыңдаған кезде өзін «аздап аңғардың қызы сияқты» деп ойлайды.
  • Мен және Кристен менде «Буффало акценті» бар десе де, менің күбірлеуге, тым жылдам сөйлеуге және сөздердің кейбір бөліктерін өткізіп жіберуге бейімділігім транскрипцияларды қиындатады деп ойлаймын. рефлексия.)

Кристен бізге Google Hangouts/YouTube Live арқылы қосылды ( ашу: Google News Lab гранты менің ұстанымымды ішінара қаржыландырады ), бұл автоматты транскрипция құралдарының көпшілігі ашық ескертеді. Телефоннан немесе бейне чаттағы дыбысты өңдеу олар үшін жалпыға бірдей қиын сияқты.

Алгоритмдерді одан да азаптау үшін біз үзінділерді әдетте сөйлегеннен әлдеқайда жылдамырақ оқимыз, Дульсе мен Алексиос әртүрлі шет тілдерінде (итальян, испан, француз және грек) сөйледі, біз мүмкіндігінше көп жалқы есімдерді айттық (Apalachicola) , Майкл Орескес және әртүрлі грек аралдары, бірнеше атауға болады, Urban Dictionary (a портманто Пол Манафорт туралы және оның құқықтық жағдайын сипаттайтын өрескел сөз) және бір-бірімен жиі сөйлесті.

Біз Пойнтердің вебинар студиясында 14 минуттық сынақты жазып алдық және оны кем дегенде бір қатты ұшақтың (бірнеше блок жерде әуежай бар), жедел жәрдем көлігінің және Кристеннің телефонының шырылдаған дыбысы үзді.

Біз аудионы үш жолмен жазып алдық:

  • А H4nPro масштабтау қол микрофоны, арамызда орнатылған
  • Менің iPhone 6S Plus құрылғыммен масштабтау жанындағы жазу үшін Recordly қолданбасын пайдаланып
  • Жеке YouTube Live қызметі арқылы Кристен бізге осылай қосылды

Содан кейін біз аудионы әр құралға жүктеп салдық және әрқайсысының транскрипциялауға қанша уақыт кеткенін бақылап отырдық. Біз Microsoft Word көмегімен алынған транскрипттерді қалыпқа келтірдік, уақыт белгілерін жойдық және сөйлеуші ​​атауларының сәйкестігіне көз жеткіздік. Басқару элементі ретінде мен дыбысты өзім жазып алдым (oTranscribe арқылы), содан кейін толық дәлдікті тексеру үшін бірнеше рет тыңдадым. Біз сондай-ақ алгоритмдерді емес, адамның транскрипторларын пайдаланатын ақылы қызметті Rev қолданып көрдік, оның қалай жинақталғанын көру үшін.

Қайсысы жақсы жұмыс істейтінін көру үшін біз әртүрлі құжаттарды салыстыру құралдарын сынадық Көшіру ең жақсы нұсқа ретінде. Біз құралдар мен қызметтер арқылы жасалған транскрипттерді мен oTranscribe арқылы жасаған 100 пайыз дұрыс транскриптпен салыстырдық.

Бірнеше қосымша ескертулер:

  • Масштабтаудағы дыбыс ең жақсы сапа болып шықты, сондықтан біз оны көптеген сынақтарымызда қолдандық. Recordly қолданбасы басқа көздерден жазылған дыбысты қабылдамайтын сияқты, сондықтан бұл процестің бір ерекшелігі. Сондай-ақ біз YouTube-ке Zoom аудиосын жүктеп салмадық, оның орнына YouTube Live жазбасындағы аудиоға сүйендік. Алма мен апельсинді салыстыру бұл экспериментті ғылыми емес, бірақ журналистердің бұл құралдарды нақты әлемде қалай пайдаланатынына көбірек сәйкес келеді.
  • Бұл танымал құрал болғанымен, біз Dragon Dictation қолданбасын сынай алмадық, себебі ол iOS 11 жүйесінде жұмыс істемейді. Біз бұл шолуды әзірлеуші ​​​​бұл мәселені қашан және түзетсе, жаңартамыз.
  • Тестілеуден бұрын біз осы компаниялардың ешқайсысына хабарласпадық, сондықтан арнайы өңдеу немесе транскрипттерді өңдеу болған жоқ. Trint, Sonix және Recordly жаңа пайдаланушылар үшін шектеулі тегін минуттар ұсынады, сондықтан біз эксперимент үшін олардың артықшылығын алдық. Біз Happy Scribe үшін репортер емес әріптесіміздің несие картасын қолдандық және Пойнтер туралы айтпадық, өйткені мен оның негізін қалаушылармен бұрын хат жазысып жүргенмін. Біз Ревтің адам транскрипциясының толық құнын төледік. YouTube субтитрлер қызметі мен oTranscribe әрқашан тегін.
  • Біз бұл шолуға қосылмаған көптеген автоматты транскрипция құралдары бар. Біз журналистердің сұрағандарына тоқталуға тырыстық. Біреуін әділетсіз өткізіп жібердік деп ойласаңыз, бізге хабарлаңыз, біз шолуды жаңартамыз.

Транскрипт сапасы (Жеңімпаз: Бақытты Жазушы)

Дәлдік диаграммасы

Жасанды интеллект көтерілісіне алаңдаулы адамдарға кем дегенде тағы бірнеше жыл дайындалуы керек сияқты, өйткені біз сынаған адам транскрипциясының бір қызметі автоматты транскрипцияларды үлкен айырмашылықпен жеңді.

Rev 82 пайыздық дәлдік рейтингіне ие болды, адам аудармашы негізінен шет тілдерін (әділ болу үшін бұл бөлек қызмет), бірнеше жалқы есімдерді, бірнеше сленг сөздерді және күңгірт сөздерді меңгере алмады. Басқа құралдар да бұл нәрселерді жиі жіберіп алғанымен, Rev-тегі адам транскрипторлары, кем дегенде, кейінірек түзетулер үшін пайдалы толтырғыштар болған «[естілмейтін]» және «[айқас» және «[шетел тілі]» сияқты нәрселерді атап өтті.

Тіпті жетіспейтін биттермен де, Rev транскрипциясы толығымен оқылатын және үйлесімді. Егер сіз бастапқы әңгіме үшін қасыңызда болмасаңыз, оны оқу арқылы біз айтып отырған нәрсенің мәнін біле аласыз.

Келесі ең дәл транскрипция YouTube болды. Бейнехостинг сайты YouTube тікелей бейнемізге 72 пайыз дәлдікпен субтитрлерді автоматты түрде жасады. Бірақ жалпы сапаның небәрі 10 пайызға төмендеуінің өзінде, транскрипт Rev-ке қарағанда әлдеқайда аз оқылады, өйткені YouTube тыныс белгілерін немесе динамик сегментациясын қамтамасыз етпейді. Жазбалар мәтіннің үлкен блогы ретінде болады. Оны дыбыспен жұптастырмайынша, әңгімеге қатыспаған адамның әңгімемізді түсінуі мүмкін емес еді.

YouTube ұсыныстарының басқа да кемшіліктері бар, бірақ біз мүмкіндіктерге келгенде олар туралы айтатын боламыз.

Happy Scribe біздің экспериментімізде 62 пайыз дәлдікпен адам емес транскрипцияның ең дәл арнайы құралы болып шықты. Құрал жүктеп салу бетінде «қатты фондық шуды болдыртпау, «ауыр екпіндерден аулақ болу», «Skype және телефон сұхбаттарынан аулақ болу» және «микрофонды динамикке жақын ұстау» туралы ескертеді, біз бұлардың барлығын елемейміз.

Транскрипт мен сөйлеген жерлерде дәлме-дәл жақын болды, әсіресе ешқандай айқас болмаған кезде және мен тиісті зат есімдерді қолданбаған кезде, бірақ Дульс, Кристен және Алексиосты транскрипциялауда біраз қиналдым. Ол кейбір жерлерде әртүрлі динамиктерді жаңа абзацтарға бөлді, бірақ басқаларында сәтсіз болды. Жалпы транскрипт кейбір жерлерде толығымен үйлесімді, ал басқаларында біртүрлі үйлесімсіз болып өзгереді, мысалы, Алексиостың транскрипциясы кезінде «Маған қалалық сөздікті ашуға рұқсат етіңіз, солардың кейбірін қарастырайық» деген сияқты, «Мен тіпті қалалық сөздікте қыздар жақын екенін білдіреді. .”

Trint 61 пайыз дәлдікпен ұқсас нәтижелерді ұсынды. Ол акценттермен, YouTube-тен аудио және өзара сөйлесу немесе тыныш сөйлеумен айналысатын көптеген бірдей жерлерде шатастырды. Дегенмен, ол Бақытты Жазушы сияқты дәл сол жолмен аударылмады. Жоғарыдағы Қалалық сөздік сөйлемі «Мен тіпті қалалық сөздікте де біз оларды өтуге болатынын білдіремін» деп пайда болды.

Тұтастай алғанда, Тринттің транскрипциясы Happy Scribe-ге қарағанда оңайырақ оқылады, өйткені ол спикерлерді ажыратып, оларды жаңа абзацтарға бөлуде жақсы жұмыс істейді. Бұл мінсіз емес, бірақ ол жұмыс істегенде көп айқындық қосады.

Sonix 50 пайыздық көрсеткішпен келесі ең дәл болып шықты. Sonix бір динамик қатты сөйлеген кезде Happy Scribe және Trint-тен сәл жақсы жұмыс істеді. Бірақ кез келген қиылысу, фондық шу немесе тіпті күлкі - бұл құралды кез келген нақты әлемде пайдалануда пайда болуы мүмкін барлық нәрселер оны басқаларға қарағанда шатастыратын сияқты. Ол қалалық сөздік сөйлемін «қалалық сөздікте ашу үшін және біз олардың кейбірін қарастыра аламыз» деп жазды.

Басқа құралдар сияқты, Sonix динамиктерді әртүрлі абзацтарға бөлуге тырысты, бірақ бұл аздап нашаррақ көрінді.

48 пайыздық дәлдікпен автоматты транскрипция құралдарының ең аз дәлдігі рекордты болды. Ол қалалық сөздік сөйлемін «маған осы қалалық сөздікті ашуға рұқсат етіңіз және біз жасай аламыз. Біразын өтіңіз», бұл жаман емес, бірақ мәтіннің бұл бөлігі транскрипттің қалған бөлігін білдірмейді. YouTube сияқты, Recordly транскрипті мәтіннің бір үлкен блогы болып табылады. YouTube-тен айырмашылығы, ол тыныс белгілерін басқа құралдарға қарағанда жиірек және төменірек дәлдікпен қосады.

Жазбаша транскрипт контекстен тыс ең аз пайдалы болып табылады.

Жалпы, ең жақсы транскрипт oTranscribe арқылы өз қолымнан келді. Rev ең жақсы транскрипт болды, мен оны транскрипциялаудың қажеті жоқ. Бірақ бұл автоматты транскрипция құралдарының шолуы және бұл категорияда Happy Scribe бірінші орынға шығу үшін Тринттен әрең шықты.

Мүмкіндіктер (Жеңімпаз: Sonix)
Бірнеше нәрсе автоматты транскрипция құралының салалық стандарттары болып көрінеді. Жүктелген аудионы ойнату мүмкіндігі айқын. Барлық құралдар пайдаланушыларға транскрипттерді әртүрлі форматтарда экспорттауға мүмкіндік береді.

Браузер негізіндегі құралдар (бұл Recordly-дан басқасының барлығын білдіреді) жалпы жинақты ұсынады. Барлығы пайдаланушыларға мәтіндегі әртүрлі нүктелерді басып, жазбаның сол бөлігіне тікелей өтуге мүмкіндік береді. Олардың барлығында дыбысты баяуырақ жылдамдықпен ойнату (төте пернелермен немесе параметрлерді өзгерту арқылы), транскрипттерді қолмен өңдеу, аудиоға қосымша бейне жүктеп салу және кейін пайдалану үшін транскрипттерді сақтау опциялары бар.

Trint бір қадам асып түседі және пайдаланушылар өз қалауы бойынша өткізіп жіберуге болатын транскрипттің төменгі жағындағы дыбыстың визуалды толқын пішінін ұсынады. Сондай-ақ оның мәтінді табу және ауыстыру, бөлектеу немесе сызып тастау үшін кіріктірілген құралдары бар. Пайдаланушылар құралға динамиктердің тізімін қосып, әр абзацқа өз атын қоса алады. Сондай-ақ оның бір рет басу арқылы транскриптті электрондық пошта арқылы жіберуге ыңғайлы мүмкіндігі бар.

Sonix осы құралдардың барлығын (интерактивті толқын пішінін қоспағанда) және тағы бірнешеуін ұсынады. Ең пайдалысы - Sonix сенімді емес сөздерге әртүрлі түстерді тағайындайтын «сенімділік түстері»; Sonix транскрипциясына қаншалықты сенімді екенін көрсететін дыбыс сапасын бағалаушы; және автоматтандырылған динамикті анықтау, әртүрлі динамиктерді анықтауға және оларға идентификаторларды тағайындауға әрекет ететін бета мүмкіндігі.

Біздің сынақта Sonix тек екі түрлі динамикті анықтады, сондықтан бұл құрал біраз жұмысты қажет етеді, бірақ ол әлі де өте пайдалы.

Айтпақшы, топтың жалғыз қолданбасы (тек iOS) ең аз мүмкіндіктерді ұсынады. Бұл рекорд және күту тәжірибесі. Транскрипт өңдеу мүмкіндігі шектеулі, Apple компаниясының кірістірілген жазбалар қолданбасына ұқсас пішімде жеткізіледі. Ол сондай-ақ пайдаланушыларға аудио немесе мәтінді басқа қолданбаға экспорттауға мүмкіндік береді.

Тринттің табу және ауыстыру және толқын пішіні мүмкіндіктері транскрипттерді түзету кезінде пайдалы болғанымен, Sonix мүмкіндіктері транскрипция процесіне маңызды мөлдірлікті қосады. Динамик идентификациясының бета нұсқасы толығымен сенімді болмаса да, бұл өршіл құрал, оны тек осы жерден жақсарту керек.

Уақыт (Жеңімпаз: Бақытты Жазушы, Тринт және рекордтық)

уақыт диаграммасы

Мұнда автоматты транскрипция жарқырайды. Барлық құралдар транскриптті біз жіберген аудио файлдың ұзындығынан аз минут ішінде қамтамасыз етті. Happy Scribe (бес минут), Trint (алты минут) және Recordly (алты минут) арасындағы айырмашылық шамалы болды, бірақ Sonix сәл ұзағырақ болды (11 минут). (Жаңарту: Sonix өкілі динамикті анықтау мүмкіндігі өшірілген кезде оның жылдамдығы басқа құралдармен сәйкес келетінін айтты.) Нақты әлем жағдайында бұл маңызды айырмашылық болуы мүмкін, әсіресе ұзағырақ транскрипциялармен.

YouTube бұл жерде біраз жұмбақ. Бұл транскрипт үшін автоматты субтитрлердің пайда болуына бірнеше минут кетті. Өткен тәжірибелерде біз олардың пайда болуына кететін уақыттың біршама өзгеруі мүмкін екенін анықтадық. YouTube шын мәнінде бұл жолмен пайдалануға арналмағандықтан, оған әдетте қанша уақыт кететінін білмейміз.

Ревтің транскрипторларының транскрипциясын аяқтау үшін шамамен төрт сағат 15 минут қажет болды. Мен мұны oTranscribe арқылы өзім жасау үшін жартысы қажет болды, бірақ бірнеше үзіліссіз емес, Spotify's Терең фокус ойнату тізімі және екі галлон кофе.

Бағасы (Жеңімпаз: рекордтық)

шығындар диаграммасы

Сіз тегін (YouTube, oTranscribe) жеңе алмайсыз, бірақ арнайы автоматты транскрипция құралдарына келетін болсақ, құны әр түрлі болады. Ең жақсы бағаны анықтау үшін құралды қаншалықты жиі пайдаланатыныңызды ескеру қажет.

Sonix - ең қымбат, базалық жоспары айына $15 плюс транскрипцияланған аудионың әр сағаты үшін $8. Бірақ құрал ай сайын емес, жыл сайын төлеуге 33 пайыздық жеңілдік ұсынады.

Trint сонымен қатар жүктеп салу кезінде төлейтін транскрипциялар үшін сағатына 15 доллардан немесе үш сағатқа дейін транскрипцияланған аудио үшін айына 40 доллардан басталатын жоспарларды ұсынады. Қосымша транскрипциялар сағатына 13 доллар тұрады.

Happy Scribe жүктеп салынған аудионың минутына 10 цент тұрады. Математикаға бейімділігі аз түрлер үшін бұл сағатына $6.

Сағатына 2 доллардан аз, бірінші сағат тегін, Recordly автоматты транскрипцияның ең арзан нұсқасы болып табылады.

Таңқаларлық емес, Rev-тегі адам транскрипторлары басқа құралдарға қарағанда қымбатырақ. 13 минуттық клиптің транскрипциясы 14 доллар тұрады, ал біз уақыт белгілері үшін 3,50 доллар төледік. Дегенмен, жұмыс уақытының арзан салыстырмалы құны бізді Rev транскрипторлары әлемде қай жерде және олардың қаншалықты жақсы өтелетінін қызықтырады.

Пайдаланудың қарапайымдылығы (Жеңімпаз: Trint)
Бұл құралдардың ешқайсысын пайдалану қиын емес. Сіз әрқайсысына файлды жүктейсіз (немесе Recordly жағдайында онымен аудио жазасыз) және біраз уақыттан кейін ол сізге өңделетін транскриптке сілтеме жібереді.

Trint файлдарды жүктеп салудан тыс үлкен қадам жасайды және Dropbox, Google Drive және FTP сияқты әртүрлі көздерден аудио немесе бейнені қабылдайды, тіпті пайдаланушыларға жай ғана сілтеме енгізуге мүмкіндік береді. Бұл біз сынаған құралдардың ішінде бірегей. Жүктеп салу басталмас бұрын Trint сонымен қатар фондық шу, өзара сөйлесу және т.б. туралы бірнеше пайдалы сұрақтар қояды. Бұл жазбаны түзетпейді, бірақ пайдаланушыларға болашақта транскрипцияланатын дыбысты қалай жазуға болатынын үйрететін пайдалы UX басуы.

Happy Scribe, Rev, Sonix және Trint барлығы транскрипция дайын болғанда электрондық хаттарды жібереді, сондықтан экранға қарап отырудың қажеті жоқ.

Төменгі сызық
Бұл ең арзан да емес, жалпы транскрипцияның ең дәл нұсқасы да емес, бірақ Тринт біз сынағандардың ең жақсы жан-жақты құралы ретінде жеңіске жетті.

Құрылғанына енді бір жыл болған және Knight Foundation-тан қаржы алған компания (жауапкершіліктен бас тарту: Пойнтер де алады Knight-тан қаржыландыру) және Google Digital News Initiative функционалдық, дәлдік және пайдалану жеңілдігінің ең жақсы жалпы комбинациясын ұсынады.

Тек YouTube-тің 72 пайыздық дәлдік көрсеткішіне ие болған автоматты субтитрлер мүмкіндігі алгоритм басқаратын транскрипцияда Trint-тен әлдеқайда жақсы болды. Бірақ YouTube журналистер күнделікті қажет ететін транскрипция түріне арналмаған және өңдеудің ешбір түрін ұсынбайды.

Жас стартап Happy Scribe біздің дәлдік сынақтарымызда 62 пайыздық көрсеткішпен сәл жақсырақ болды және Trint бағасының шамамен үштен біріне жетсе де, оған Trint-ті пайдалы ететін көптеген қосымша мүмкіндіктер жетіспейді. Көптеген көздерден жүктеп салу, мәтінді табу және ауыстыру мүмкіндігі және динамик идентификациясы шағын, бірақ маңызды жұмыс процесі құралдары болып табылады. Егер сіз жай ғана жылдам және лас транскрипт іздесеңіз, Happy Scribe баратын жол болуы мүмкін.

Оның 61 пайызы мінсіз емес екені рас болса да, біздің сынақтарымыз нақты әлемдегі көптеген қолдануларға қарағанда біршама қиын болды.

Сондай-ақ біз Rev, адам аудармасы қызметін және журналистерге аудионы өз бетінше транскрипциялауға ыңғайлы құралдарды ұсынатын oTranscribe қызметін сынадық. Транскрипцияланған аудионың минутына $1 бағасына қарап, біз Rev орташа журналист үшін тұрақты түрде пайдалану үшін тым қымбат екенін анықтадық. oTranscribe ыңғайлы болғанымен, ол транскрипцияның шаршауын және уақытының азаюын шешпейді.

Әдеттегі қолдануды ескере отырып, Trint - журналистер үшін ең жақсы жан-жақты автоматты транскрипция құралы.

Түзету: Біз бұрын Sonix жасамайтынын хабарлаған едік ұсыныс құралды табыңыз және ауыстырыңыз, бірақ ол шын мәнінде жасайды. Сағынғанымыз үшін кешірім сұраймыз.

Мұны көріңіз! арқылы журналистика құралдары туралы көбірек біліңіз! — Журналистикаға арналған құралдар. Мынаны қолданып көріңіз! арқылы қуат алады Google Жаңалықтар зертханасы . Оны да қолдайды Американдық баспасөз институты және Джон С. және Джеймс Л. Найт қоры