Kako transkribirati govor u tekst na hrvatskom jeziku [članak 3/3]

(Ovo je treći i posljednji članak serije na temu transkripcije. U prvom sam članku pisala o tome zašto transkribirati audio i video sadržaje, u drugom je Saša Matijašić opisao postupak kako dobiti čisti tekstualni transkript iz video ili audio datoteke, a sada zatvaram priču s opisom kako točno ja radim transkripciju, koliko vremena trošim na sve to, koje savjete mogu dati za bolji rezultat, i koji sve alati za transkribiranje postoje.)

U prošlom ste članku vidjeli kako izgleda jedan automatski kreiran transkript dobiven pomoću Speech-to-Text servisa u Google Cloudu, a sad ću dodati još jedan koji smo kreirali u međuvremenu:

Kako izgleda gotov transkript (Na slici vidite dio transkripta dobivenog za treću epizodu Eduza Showa.)

Kako izgleda gotov transkript (Na slici vidite dio transkripta dobivenog za četvrtu epizodu Eduza Showa.)

Sa slika je vidljivo da tekst nije upotrebljiv na način da ga možete copy-pastati u blog post i objaviti.

Zato ja prilikom transkripcije prolazim proces od dvije velike faze:

  1. Preslušavam video i dovršavam transkript
  2. Uređujem kompletan tekst u blog post

Transkripcija u detalje, korak po korak

  1. Otvorim za objavu pripremljen video u nekom video playeru (u mom slučaju to je VLC).
  2. U tekstualnom editoru (u mom slučaju to je Visual Studio Code) već sam pripremila kostur blog posta u koji izravno transkribiram tekst.
  3. Na jednom monitoru gledam video, a na drugom pišem u tekstualni editor.
  4. Usporim video na oko 60% brzine.
  5. Automatski kreirani, sirovi transkript kopiram u blog post.
  6. Pokrenem video na 60% brzine, slušam govor i očima pratim transkript u potrazi za riječima koje treba ispraviti.
  7. Dijelove sirovog transkripta koji su dobro transkribirani samo preskačem i ručno uređujem ono što Googleov servis nije dobro transkribirao automatski.
  8. Pritiskom na tipku Play / Pause na tipkovnici zaustavljam video kad mi treba malo više vremena da uredim neki dio teksta.

Web alati za automatsku transkripciju govora na hrvatskom jeziku

Ove web alate nisam testirala - ne trebaju mi jer mi transkribiramo koristeći Google Cloud - ali nude transkripciju hrvatskog govora u tekst:

  • HappyScribe - imaju free trial, inače 1 sat košta 12 EUR
  • Sonix - prvih 30 minuta je besplatno
  • Vocalmatic - prvih 30 minuta je besplatno

Ako vam transkript treba za kreiranje titlova u videu, Kapwing je fora alat koji podržava i hrvatski jezik. Intuitivan je i jednostavan korištenje (i besplatan za video do 7 minuta).

Vremenski utrošak i ostvarene uštede

Potrošila sam ukupno 3 i pol sata transkribirajući video od 42 minute:

  • oko 5 minuta uloženog vremena za dobaviti automatski transkript
  • 2 i pol sata za transkribiranje, počevši s automatski kreiranim transkriptom
  • 1 sat za finalno uređivanje transkripta u osnovni blog post

Naravno, ovih spomenutih 5 minuta ne uključuje vrijeme koje je potrebno da Googleov servis odradi svoj posao na serveru. To je čistih 5 minuta koliko vam treba da prođete sva 4 koraka o kojima je Saša pisao. Tih 5 minuta dalo bi se dodatno automatizirati, no mi to za sada nismo radili.

Automatski kreirani transkript uštedio mi je oko 20% vremena (mjereno po tome koliko riječi u minuti uspijevam transkribirati sa i bez automatskog transkripta, uzeto kao prosjek od dvije epizode sa i dvije epizode bez automatskog transkripta).

Ako vam je dolazak do automatskog transkripta jeftina i relativno brza i jednostavna operacija, moja je preporuka da ga koristite.

Ako se nećkate, napravite vlastiti eksperiment kao što sam i ja: transkribirajte jedan video sa i drugi video bez automatskog transkripta, i usporedite broj transkribiranih riječi u minuti. Ako ste na vremenskom dobitku s automatskim transkriptom, koristite ga.

Detaljnije o koracima transkripcije

Predložak blog posta prije početka transkripcije

Eduza Show blog postovi, dok su u izradi, žive kao markdown datoteke na mom lokalnom disku. Markdown format datoteka koristim zato jer Eduza Blog kao input prihvaća markdown format (tako sam htjela, tako sam i dobila). Kad sam gotova s blog postom, ja ga jednostavno kopiram u za to predviđen textarea na Eduza Blogu, bez puno dodatnog pimplanja.

Jako mi je važno da mi cijeli proces produkcije blog postova i svake epizode Eduza Showa bude što jednostavniji. Zato transkribiram izravno u ciljani dokument u kojem će taj tekst i ostati:

Template Eduza Show blog posta (Na ovoj slici vidite kako izgleda predložak blog posta u mom editoru prije početka transkribiranja)

Ne volim pisati na jednom mjestu i editirati na drugom. Sve mora biti u jednoj datoteci.

Preslušavanje govora na videu

Nažalost, automatski transkript koji mi daje Googleov servis nije dovoljno dobar da bih od njega mogla napraviti transkript bez preslušavanja videa.

Zato uvijek otvorim video i preslušavam dok transkribiram.

Kad video usporim na oko 60% originalne brzine, ja mogu pratiti tu brzinu i tipkati ono što čujem.

Prije nekoliko sam godina samu sebe naučila vještini touch typinga, tj. naučila sam tipkati sa svih deset prstiju bez gledanja u tipkovnicu. Ta mi supermoć omogućuje da prilično brzo i precizno tipkam, s dovoljno malo pogrešaka da sve što napišem kasnije razumijem.

Vi sebi prilagodite tu brzinu na više ili manje od 60%, sve dok i vi ne budete u stanju da natipkate transkript koji ćete kasnije razumjeti bez potrebe preslušavanja govora.

Savjeti za bržu transkripciju

Pauzirajte video pritiskom na tipke

Ja mogu pauzirati video pritiskom na tipku Play / Pause koja se meni nalazi tipkovnici:

Play / Pause gumb na Macbook Air tipkovnici

To neizmjerno puno pomaže u brzini transkripcije. Vi ćete tijekom transkripcije možda nekoliko stotina puta htjeti (od)pauzirati video. U toj si situaciji jednostavno ne smijete dozvoliti da vam ruka napušta tipkovnicu i kreće prema trackpadu ili nedajbože mišu.

(Ja odavno više ne koristim miša jer me usporava u radu. Radije sam naučila najvažnije tipkovničke kratice za svaku važnu aplikaciju koju koristim.)

Ako vaša tipkovnica nema dediciranu Play / Pause tipku, potražite koje tipkovničke kartice koristi vaš video player za istu funkciju. Isplati se potrošiti jednu minutu da to proguglate, naučite, izvježbate i usvojite jer ćete na Play / Pause potrošiti puno više od jedne minute.

Prvo transkribirajte, onda uređujte

Nažalost, ja sam izgubljeni i beznadni slučaj za sljedeće, no vi možda niste:

Usred transkribiranja, nemojte ispravljati sitne pogreške.

Kad prilikom ručne transkripcije napravite tipfeler ili vidite neku drugu jednostavnu nesavršenost teksta (fali zarez ili početak rečenice nije veliko slovo), pustite to tako kako jest i samo transkribirajte dalje.

Zašto je to dobar savjet?

  1. Svako vas zaustavljanje i pimplanje po tekstu, u trenutku dok još niste završili transkript, usporava i narušava inače glatki proces transkribiranja.
  2. Učinkovitije je prvo se fokusirati na to da imate sav govor prenesen vjerno u tekst, a tek onda gledati kako taj tekst možete poboljšati.
  3. Tipfelere ćete ionako ukloniti kasnije, kad transkript bude gotov, i kad budete tekst fino završavali i pretvarali u blog post koji je spreman za objavu.

Nakon 20 godina pisanja za web, meni je danas iznimno teško odviknuti se loše navike da istovremeno i pišem, i editiram. Jedan od boljih savjeta profesionalnih pisaca jest sljedeći (i nemojte mi sad zamjeriti što ću ovo vrlo eksplicitno izreći):

Pišite kao da povraćate.

(eng. 'Write as you would vomit.')

Znači, prvo se treba ispovraćati na papir, a tek onda treba ići razmišljati kako tu rigotinu pretvoriti u nešto prekrasno za čitanje.

(Ponovno: nemojte mi zamjeriti! Ovo je savjet najboljih pisaca svijeta, i upravo je pamtljiv zato jer je toliko eksplicitan.)

Ja nikako da naučim primjenjivati taj savjet. U trenutku kad u editoru optički primijetim tipfeler, meni je nemoguća misija preskočiti ga. Svaki me tipfeler nesnosno svrbi i osjećam se kao da se odmah moram počešati, pa makar to značilo da ću potrošiti pola sata više na cijeli proces. Opsesivna kompulzija? Vjerojatno, međutim odustala sam od sebe na tom polju.

Savjeti za uređivanje transkripta u lijepi blog post

Usporedite dva transkripta Eduza Showa koje sam objavila i primijetite razlike:

  1. Eduza Show E01
  2. Eduza Show E03

U prvoj sam epizodi doslovno samo transkribirala govor i objavila ga u blog postu.

Za treću epizodu uzela sam si malo više vremena i usred transkripta dodala sam podnaslove koji najavljuju o čemu se priča u nastavku. Ti podnaslovi pomažu čitatelju blog posta da brzo preskoči na dijelove koji ga najviše zanimaju.

Naravno da usred razgovora s gostom nisam najavljivala te podnaslove: to se dodaje naknadno.

Tek učim i unaprjeđujem svoj proces transkribiranja, no već sada vidim da nije nužno 100% slijediti govor, već si možete dozvoliti koliko god želite kreativne slobode.

Evo još par savjeta kako sve od transkripta možete napraviti lijepi blog post, a da se ne ubijete od posla.

Izbacite sve nepotrebne verbalne poštapalice i uzdahe

U govoru ih toleriramo, ali u tekstu ne:

Hmm / aha / umm / ajmo reći / nekakvi / dakle / gle / ono

Sve takve riječi koje nisu važne za razumijevanje govora moraju van. Svaki govornik ima svoje karakteristične poštapalice koje će se uvlačiti u gotovo svaku rečenicu govora. I ja sam tek u procesu transkribiranja i preslušavanja videa u kojima se ja pojavljujem uvidjela na čemu ja osobno moram raditi da postanem bolji govornik.

Automatska transkripcija će pokupiti sve poštapalice, pa ćete ih morati ručno brisati. Preporučujem da koristite Find & Replace funkciju vašeg editora da prvo izbacite sve očite poštapalice i ručno dodate samo tamo gdje mislite da su nužne.

Razbijte zidove teksta u kraće odlomke

Googleov servis stvara odlomke unutar teksta nakon svakih cca 700 znakova. No, tako stvoreni odlomci nemaju veze s onime što ima smisla za čitanje.

Cijeli ćete tekst trebati urediti da odlomci imaju smisla:

  • Započnite novi odlomak uvijek kad se mijenja govornik.
  • Smisleno grupirajte rečenice u odlomke ovisno o temi o kojoj govornik priča.
  • Što kraći odlomci, to bolje.

Izbacite ponavljanja riječi

Googleov servis nije baš jako dobar u kreiranju kvalitetnog transkripta, ali što je dooobaaar u detektiranju zamuckivanja i ponavljanja i svega onog što treba izbaciti iz finalnog teksta!

Gotovo svako zamuckivanje i ponavljanje riječi trebat će izbaciti. To je dodatan posao koji preporučujem da napravite nakon što ste cijeli transkript ručno uredili, tj. kad finalno uređujete tekst u blog post.

Mora li transkript biti pretvoren u savršeni blog post?

Ne mora. Transkript je transkript, i dozvolimo mu da funkcionira kao takav.

Iako sam u prvom članku pisala da transkribiramo prvenstveno zbog korisničkog iskustva i čitatelja koji preferiraju tekst, to ne znači da morate provesti sate i sate uljepšavajući transkript.

Naravno da znam o čemu pričam, jer sam si za četvrtu epizodu Eduza Showa dozvolila previše kreativne slobode pa sam transkript u blog post pretvarala puna četiri sata.

Znači, nakon što sam dva i pol sata provela samo transkribirajući, još sam si na vrat natovarila četiri dodatna sata rada. Htjela sam transkript urediti u mega-post od 6700 riječi, s naslovima, podnaslovima, pod-ponaslovima i podebljanim najvažnijim mislima (because why not). Jednom kad sam krenula uređivati, nisam više mogla stati na pola posla, nego sam dovršila.

Četiri dodatna sata ipak je puno previše, i u nekom trenutku ne isplati se kao stalan dio procesa transkribiranja uvoditi korak koji će vas opterećivati. Tome potencijalno nema kraja, jer jednom kad ste transkript fino uredili, perfekcionist neće htjeti stati na tome, nego će mu/joj sinuti ideja da počne ubacivati i slike i citate i ugrađene tweetove i tko zna kakva sve čuda.

Zato, transkribirajte, uklonite očite tipfelere, ponavljanja i zamuckivanja, i tu stanite. Ako taj transkript ikada počne rangirati na Googleu da ga se isplati pretvoriti u pravi blog post, naknadno nek vam Google i sami čitatelji signaliziraju na koje vaše transkripte se isplati trošiti dodatno vrijeme i trud.


Evo, dovršili smo i treći u seriji članaka o transkribiranju.

No, to nije sve.

Imam jedan odličan bonus za kraj.

Kako postati bolji govornik koristeći automatske transkripte

Radeći na transkribiranju Eduza Showa, prenijela sam preko 26.000 hrvatskih riječi iz govora u tekst.

10% tih riječi bio je moj govor, preostale riječi bile su govor mojih gostiju.

I ja, i neki moji gosti podjednako koristimo puno previše poštapalica i ponavljanja u govoru.

Međutim, te poštapalice i ponavljanja postali su mi vidljivi tek kad sam ih vidjela crno na bijelo, u transkriptu. Automatski kreirani transkript doslovno, u svako slovo poštapalice, ispisuje ono što govornik govori.

Naravno, tijekom snimanja intervjua ja ni svoje, ni njihove poštapalice uopće nisam primjećivala.

Što ne znači da ih neće primijetiti slušatelji, jer hoće.

Zato je moj savjet sljedeći:

  1. Snimite sami sebe kako pet minuta odgovarate na nečije pitanje.
  2. Provucite tu audio datoteku kroz neki alat za automatsku transkripciju iz ovog članka i pogledajte kakav transkript dobivate van.
  3. Isprintajte transkript na papir, uzmite flomaster, i zaokružite sve riječi viška.
  4. Identificirajte JEDNU JEDINU poštapalicu koja se najčešće ponavlja.
  5. Kad sljedeći put razgovarate s nekim, usmjerite pažnju svjesno na vlastiti govor s ciljem da tu jednu jedinu najčešću poštapalicu ne izgovorite.

Moja najčešća poštapalica koje se želim riješiti jest 'ajmo reći'.

Imam ih još puno, ali za sada ću se koncentrirati na ovu jednu.

Do slušanja ;)


Zašto se ne biste uključili u rad Eduze? Evo što možete:

  • Upišite se u newsletter
  • Prijavite edukaciju
  • Ispunite upitnik

Ili nas zapratite na Youtubeu, Facebooku i Linkedinu.

Piše:
Višnja Željeznjak

23.09.2020.