V britském časopise The Linguist vyšel v letošním dvojčísle 2/3 článek zabývající se dvěma různými přístupy k výzkumu možností automatického tlumočení angličtiny do znakového jazyka na University of East Anglia. V českém překladu Daniely Krolupperové byl publikován v odborném bulletinu TOP 6/2002, který vydává Jednota tlumočníků a překladatelů. Z článku vybíráme:
Teprve v polovině 20. století se znakový jazyk dočkal toho, že začal být chápán jako "přirozený" jazyk s vlastní fonologií, morfologií, syntaxí, sémantikou a pragmatikou. Vzbudil nejen odborný zájem lingvistů ale i zájem veřejnosti, jak o tom svědčí rostoucí obliba kurzů znakového jazyka ve Spojeném království. Přesto je kvalifikovaných tlumočníků znakového jazyka stále nedostatek. Legislativa totiž zaručuje neslyšícím přístup k informacím a službám ve značném rozsahu, který stávající počet tlumočníků nemůže pokrýt.
Virutální tlumočníci - avataři
Výzkum na University of East Anglia, který je podporován mnoha organizacemi, hledá možnosti využití současné počítačové technologie a počítačové grafiky - tedy "virtuálních bytostí" pro tlumočení mluvené či psané angličtiny do znakového jazyka. Největší překážkou výzkumu je relativně nízká znalost a omezené používání znakového jazyka.
Technologie virtuálních bytostí "avatarů" dospěla do stavu, kdy je možno vytvářet relativně realistické trojrozměrné postavy, které jsou schopny dostatečně věrně interpretovat znakování. Lze předpokládat, že náklady na tyto technologie budou neustále klesat, takže se avatarové stanou běžným jevem.
Výzkum se zde ubírá dvěma směry. Jedna cesta vychází z technologie "uchopení pohybů", která umožňuje zaznamenat chování znakující osoby a později jej přehrávat. Používá se systém zvaný TESSA. Druhý přístup je zaměřen na lingvistické problémy tlumočení, vytváří se sémantická vyobrazení, na jejichž základě lze vyvíjet znakování.
Cíle a vývoj výzkumu
Cílem výzkumu je z části automatizovaná příprava znakování anglických textů využívající strojového překladu. Jedná se o syntetické znakování. Strojové překlady stále zaostávají za "lidskými tlumočníky", takže snaha se soustředí na vytvoření prostředí, do kterého může člověk zasahovat a upravovat automatický překlad tak, aby kvalita znakování byla zachována.
Tento přístup využívá a rozvíjí technologie používané k vytvoření sémantických zástupců znakového jazyka. Ideální situace by vyžadovala, aby neslyšící sami vyvíjeli slovní zásobu a gramatiku a svůj jazyk také sami popsali. K záznamu znakového jazyka se používají různé systémy, popis jeho formálních náležitostí je už vysoce specializovanou činností.
Základní otázkou zůstává, čí záznamy a popisy využívat v praxi. Lingvistickými otázkami znakového jazyka se totiž vždy zabývali prakticky pouze slyšící lidé. Využívali při své práci pomoci neslyšících, ale jejich informace jsou samozřejmě doslova a do písmene z druhé ruky. Na práci se podílejí jak slyšící tlumočníci znakového jazyka, tak i neslyšící lidé.
Hlavní obtíží při vývoji syntetického znakového jazyka je relativní nedostatek znalostí o formálních vlastnostech znakového jazyka. K zaznamenání fonologických komponentů znakového jazyka se používá systém HamNoSys. Tento systém umožňuje popis pohybů rukou, jejich polohy a umístění. Při tomto výzkumu byl systém rozšířen o zápisy výrazů tváře.
Dále je nutno rozvinout gramatický systém tak, aby bylo možno definovat znakované věty. Znakový jazyk obsahuje množství konstrukcí, které podmiňují zjednodušující teorie, že znakování je procesem zřetězení samostatných událostí, pro které existují samostatné znaky. Například poloha obočí (neutrální, pozdvižené, přikrčené) označuje oznamovací či tázací způsob. V tomto případě není možné využít údaje nashromážděné při "uchopování pohybu" o oznamovací větě ve větě tázací, protože výraz tváře by vedl k nepochopení smyslu. Další otázkou zůstávají slovesa vyžadující přímý a nepřímý objekt, neboť i zde při znakování dochází k nedorozumění.
V současné době se pro popisování těchto jevů používá systému HPSG. Tento systém používaný k zápisu britského znakového jazyka má slovní zásobu 50 znaků a několik gramatických pravidel.
Systém TESSA
Systém TESSA (The Text and Sign Support Agent) nabízí technický pohled na otázku tlumočení znakového jazyka. Místo popisu a gramatických pravidel má systém vytvořenou databázi celých frází uchovávaných zároveň s jejich znakovaným překladem. Vyhledává a přehrává části těchto frází odpovídající zadané frázi. Fráze byly zaznamenány metodou "uchopení pohybu" živého tlumočníka, přehrávají se na avatarovi. Tento přístup vyžaduje, aby požadované fráze byly předem zaznamenány a uchovány ve slovní zásobě systému. Systém TESSA byl vyvinut pro potřeby pošt, usnadňuje komunikaci zaměstnanců s neslyšícím zákazníkem. Věty používané při vyřizování záležitostí na poště lze poměrně snadno zaznamenat. Používají se totiž s malými obměnami (výše částek, dny v týdnu, místo určení apod.) Výhodou tohoto přístupu je možnost okamžitě hodnotit výsledky práce - srozumitelnost, užitečnost a přijatelnost ve společenství neslyšících.
Využití systému na britských poštách
Protože cílem projektu bylo pomoci poštovním úředníků, tlumočí systém většinou mluvený projev do znakového jazyka.
Poštovní úředník používá mikrofon spojený s počítačem. Obrazovka mu nabízí dostupná témata - odeslání dopisu, platba apod. Při vyslovení těchto slov se na obrazovce objeví fráze odpovídající zvolené kategorii. Systém přetlumočí kdykoliv jakoukoliv zaznamenanou frázi. Software používaný k rozlišování promluvy vždycky "slyší" a rozliší frázi, pokud je vyslovena s krátkými pomlkami na začátku a na konci. Může se jednat o samostatnou frázi ("Položil byste to laskavě na váhu?") nebo o kombinací několika frází ("Bude to celkem dvě libry, dvaatřicet pencí"). Složená věta je odeslána softwaru avatara a ten ji přehraje zákazníkovi.
Po zkoumání zápisů zaznamenaných v průběhu několika hodin práce na poště bylo vybráno 115 frází, které by měly dostatečně pokrýt 90 % všech možných poštovních transakcí. Fráze byly po vyzkoušení rozšiřovány a nyní je jich 350.
Používání omezeného počtu frází má výhodu, že rozlišování promluvy je velmi přesné. Tato přesnost je pro systém velmi důležitá. Proces tlumočení je relativně pomalý, neboť avatarové znakují pomalu, aby bylo dosaženo maximální možné srozumitelnosti a případná nedorozumění neprodlužovala komunikaci.
Proč je pro znakování výhodnější využívat avatarů než videozáznamů? Avatar dokáže předvést jakýkoliv pohyb. Pomocí něj lze zoobrazit různé výrazy tváře a postavy, takže jedna soustava záznamů může být využita pro různé "avatary". Zřetězení je plynulejší a snáze kontrolovatelné než na videu.
Zaznamenávání pohybů
Pohyby znakující osoby jsou zaznamenávány speciálními čidly. Záznamy čidel jsou předávány počítači a zpracovány softwarem do formy, kterou je možno zaznamenat jako soubory údajů. Když je zapotřebí se na údaje podívat, jiná část softwaru je přečte a přenese zaznamenané pohyby na torzo a tvář postavy. Torzo může mít na sobě jakýkoliv oděv, možnost výběru tváří "avatara" je bohatá.
Systém TESSA je v současné době schopen komunikovat pouze jedním směrem, nemůže odpovídat na znakování. Další vývoj softwaru je tedy charakterizován snahou o rozpoznávání alespoň velmi omezeného počtu znaků, který by byl schopen přetlumočit i opačným směrem.
Oba dva přístupy může v praxi zhodnotit pouze komunita neslyšících. Pouze oni sami rozhodnou, zda-li se ukáže být užitečnější vytváření syntetického jazyka nebo využívání avatarů.
Zaznamenávání pohybů (VIZ FOTO)
1. Kybernetické rukavice zaznamenávají polohy prstů vzhledem k ruce.2. Magnetická čidla zaznamenávají polohu zápěstí, předloktí, hlavy a trupu v trojrozměrném prostoru.
3. Pohyby tváře zaznamenává kamera umístěná v helmě.