zobrazeno: 1674x

Počítačové technologie k vašim službám

1. část - automatické titulkování televizních pořadů

zdroj: www.gong.cz 10.1.2013 publikováno: 22/01/2013

V první části našeho seriálu o počítačových technologiích, jejichž praktické aplikace slouží sluchově postiženým uživatelům, se přeneseme do Plzně, kde se zabývají automatickým titulkováním televizních pořadů.

Řada televizních diváků by při sledování televizních pořadů ráda využila skryté titulky. Důvody jsou nasnadě – špatná srozumitelnost mluvenému slovu pořadu vysílaného či poslouchaného v hlučném prostředí nebo vada sluchu na straně posluchače. Předem natočené pořady jsou titulkovány standardním off-line způsobem, ale titulkování živě vysílaných pořadů probíhá jiným způsobem – pomocí automatického rozpoznávání mluvené řeči, kdy převod mluvené řeči na text převádí počítač.

Jak probíhá titulkování pořadů, jaké úspěchy mají za sebou ti, co automatické titulkování připravují, a co je teprve čeká, to jsem se vydala zjistit na pracoviště katedry kybernetiky Fakulty aplikovaných věd Západočeské univerzity v Plzni. O počátcích celého projektu začíná vyprávět docent Luděk Müller: ,,První praktické zkušenosti s počítačovým přepisem mluveného slova televizních pořadů do textu vznikly na našem pracovišti v roce 2005, o rok později jsme proto požádali Ministerstvo školství, mládeže a tělovýchovy o projekt Eliminace jazykových bariér handicapovaných diváků České televize (ELJABR). Potřebnou finanční spoluúčast se zavázala hradit Česká televize (ČT), která byla ze zákona povinna vybavit skrytými titulky minimálně 70 procent vysílaných pořadů.“

Pětiletý projekt ELJABR si stanovil dva cíle, prvním z cílů bylo vyvinout systém, který by byl schopen za pomoci technologie automatického rozpoznávání mluvené řeči titulkovat zpravodajské, diskusní, sportovní nebo další živé pořady vysílané ČT a druhým cílem pak bylo vyvinout systém, který dokáže automaticky vytvářet doprovodnou zvukovou stopu televizního pořadu pro diváky, kterým vadí snížená srozumitelnost originálních dialogů současných pořadů.

Dva způsoby titulkování

Jak jsem se na katedře kybernetiky dozvěděla, v současné době probíhá titulkování dvojím způsobem. V prvním případě systém automatického rozpoznávání mluvené řeči rozpoznává přímo originální zvukovou stopu televizního pořadu a přepisuje ji do textu. Do druhého způsobu už je zapojený lidský faktor – zvuková stopa pořadu je přemlouvána takzvaným stínovým řečníkem. Systém pak převádí řeč stínového řečníka do titulků.

Na začátku projektu byly práce věnovány prvnímu způsobu titulkování. První test systému automatického rozpoznávání originální zvukové stopy se uskutečnil v listopadu 2008 a týkal se přenosu ze zasedání Poslanecké sněmovny. Systém běžel nejprve rok a půl v experimentálním provozu a od března 2010 jej zajišťují řešitelé projektu pro ČT jako stálou službu.

Titulkování probíhá zcela pravidelně vždy, když zasedá Parlament České republiky a večer se vysílá na ČT 24 záznam z jeho zasedání v rámci televizního pořadu Záznam z jednání schůze PS PČR. Celkem bylo odvysíláno více než 750 hodin přenosů tohoto pořadu se skrytými titulky.

Druhý způsob titulkování se týká titulkování živých pořadů, u nichž je zvuková stopa obecně hůře rozpoznatelná. Například jde o živé diskuse, dále pořady s hlukem či vzdálenou řečí na pozadí, projev řečníků je spontánní, nespisovný, není pronášen do mikrofonu, apod. Originální zvuková stopa pořadu je poslouchána a přemlouvána ve studiovém či kancelářském prostředí tzv. stínovým řečníkem, který původní záznam přemlouvá neutrálním způsobem do mikrofonu systému tzv. automatického diktátu, což je systém automatického rozpoznávání mluvené řeči zapisující v reálném čase diktovaný text. Způsob titulkování s využitím stínového řečníka se používá u živého pořadu Otázky Václava Moravce. Systém běžel taktéž nejprve půl roku v experimentálním provozu a od října 2011 jeho provoz zajišťují řešitelé projektu pro ČT jako stálou službu. Systém automatického diktátu je umístěn na notebooku stínového řečníka, který je spojen s titulkovacím zařízením přes internet, například z domova. Stínový řečník proto může pracovat všude tam, kde je dostupné připojení k internetu.

Práci stínového řečníka nemůže dělat každý

Doktor Aleš Pražák mi zároveň dokazuje, že práce stínového řečníka není nejjednodušší:,,Stínový řečník musí při své práci vykonávat velké množství paralelních činností – poslouchá originální zvukovou stopu pořadu, diktuje do počítače to, co slyší a v případě, že mluví více řečníků zároveň, musí umět vybrat řeč hlavního řečníka. V případě, že řečník nemluví dobře, popřípadě příliš rychle, musí umět jeho řeč převést do korektního tvaru, popřípadě řeč zestručnit tak, aby se text vešel do titulků, které mají omezený prostor.“ A  ještě dodává: ,,Když se v pořadu objeví slovo, které systém automatického rozpoznávání mluvené řeči nezná, musí slovo přidat do slovníku.“ Pro výběr řečníků a jejich výuku je použito speciální patentově chráněné zařízení, tzv. trenažér pro výuku stínových řečníků. Přesnost vytváření titulků tímto způsobem dosahuje až 98 procent.

Na projekt ELJABR navázal ELJABR II a díky němu mohlo titulkování pořadů pokračovat. V únoru letošního roku bylo spuštěno pravidelné podtitulkování dalšího televizního pořadu ČT Hyde park. Pro sportovní nadšence proběhlo v květnu experimentální titulkování třech zápasů českých hokejistů na mistrovství světa v hokeji a v červnu titulkování dvou zápasů českých fotbalistů na mistrovství Evropy v kopané. V současné době probíhá titulkování pátečního pořadu Star Dance a těší se velkému ohlasu. Na webových stránkách www.kochlear.cz probíhá diskuze s řešiteli projektu, z řad diváků přichází poděkování, názory i nápady, jak titulkování ještě vylepšit. 

,,Domníváme se, že současná technologie nám umožňuje vyvinout a zajistit provoz titulkování prakticky libovolného televizního pořadu, ale protože provoz služby není beznákladový, musela by ČT alokovat ve svém finančním rozpočtu prostředky na tuto činnost. Záleží tedy nejspíše i na kvótách procent televizních pořadů, které je ČT ze zákona povinna vybavit skrytými titulky“, uzavírá docent Luděk Müller.

Tímto však práce odborníků ze Západočeské univerzity v Plzni nekončí. Čekají je ještě další úkoly. I nadále se budou zabývat titulkováním dalších živých pořadů, budou vytvářet doprovodné zvukové stopy televizního vysílání a v neposlední řadě se pokusí generovat znakový jazyk systémem Avatar, což s největší pravděpodobností půjde ruku v ruce s postupným výzkumem českého znakového jazyka.  Celému týmu budeme držet palce.

foto: archiv ZČU

 

 Související články:


sdílet na Facebooku      Google záložy           vybrali.sme.sk vybrali.sme.sk

Diskuze a názory k článku

Vložit příspěvek
tu?n?kurz?vapodtr?en?Srtike ThroughGlowst?nov?n?Maqueeform?tovan? textzarovnat dolevavycentrovatzarovnat dopravaodkazEmail Linkhorn? indexdoln? indexuvozovkyListHelp


Pro vložení příspěvku k článku se musíte přihlásit. Nemáte login? Zaregistrujte se. Registrace je zdarma

Nové články a videa
Konference odhalila tajemství znakového jazyka
15/02/2017 - Lucie Křesťanová
Ze zákulisí natáčení pohádky Nepovedený čert
15/01/2017 - Česká televize
Raná péče o neslyšící děti
22/11/2016 - Česká televize
Lékařka Eva Francová
20/11/2016 - Česká televize
Deaf Friendly
15/11/2016 - Tiché zprávy
Základy sexuální výchovy
12/11/2016 - Česká televize
Migrace, kultura, náboženství
10/11/2016 - Česká televize
Poradenské centrum pro neslyšící a nedoslýchavé Kroměříž
07/11/2016 - Česká televize
Pracovní příležitosti pro neslyšící
05/11/2016 - Česká televize
Profesorka Alena Macurová
02/11/2016 - Česká televize
Tomáš Pazdera
30/10/2016 - Česká televize
Jubileum Jaroslava Paura
25/10/2016 - Česká televize
Život a smrt - energie všude kolem nás
20/10/2016 - Česká televize
Mluvící uši
15/10/2016 - Česká televize
Hluchoslepota a studia
05/10/2016 - Česká televize
Slovenští neslyšící u nás
01/10/2016 - Česká televize

Login 
Přihlašovací jméno:

Heslo:

zapamatovat Zaregistruj se, je to zdarma!
Zapomněl(a) jsi heslo?

nejnovější články z rubriky 
Skryté titulky
Počítačové technologie k vašim službám
Díky expertům z Plzně mají neslyšící titulky u živých pořadů ČT
Skryté titulky a mluvčí ve filmu
Skryté titulky pod lupou IV.
České filmy mají titulky
« « « VÍCE « « « VÍCE « « «

nejčtenější články z rubriky 
České filmy mají titulky
Skryté titulky pod lupou IV.
Skryté titulky a mluvčí ve filmu
Skryté titulky
Díky expertům z Plzně mají neslyšící titulky u živých pořadů ČT
Počítačové technologie k vašim službám

uživatelé 
Online
registrovaní: 0
neregistrovaní: 27
celkem: 27
Přihlášení

ikonka 

aktuality 
První narozeninový mejdan Kašpárka v rohlíku,
Rekordmani a rarity zviřecího světa
Mobilní aplikace, která zpříjemní život nesl
Výběrové řízení na pozici tlumočníka
Hledá se pracovní konzultant a vedoucí pobočky
Rekondiční tábor FIT
Zemřel pan doktor Raimund Koplík
Křest nové aplikace Tiché linky
Tlumočená komentovaná prohlídka výstavy
Divadelní představení s českými titulky pro n

RSS kanály 

[CNW:Counter]