velikost písma: A +/ A/ A -

Počítače přepisují lidskou řeč

Autor: Bohumír Kotora | komentářů: 1

V současnosti lze texty v češtině vytvářet už pouze diktováním do mikrofonu. Pomocník, který to umožňuje, se jmenuje NewtonDictate.

Daný výraz ukrývá nejvýkonnější systém pro rozpoznávání hlasu a přepis lidské řeči do textové podoby v češtině. Vyvinula ho společnost Newton Technologies dohromady s týmem vědců na Technické univerzitě v Liberci (TUL) se záměrem, že své primární zákazníky najde zejména v oblasti soudnictví a advokacie, státní správy, zdravotnictví či médií, což se v praxi potvrzuje.

Jak ke všemu došlo? Již v roce 1994 na TUL vzniknul tým vědců v oboru rozpoznávání řeči pod vedením profesora Jana Nouzy. Tomu se po 11 letech usilovné činnosti podařilo zhotovit první funkční prototyp systému na diktování plynulou řečí v češtině. Roku 2006 zahajuje exkluzivní spolupráci s tímto kolektivem firma Newton Media. Zatímco vědci z Liberce poskytují vlastní engine pro přepis řeči, vkladem nového partnera je hlasový korpus. Primární výsledky vzájemné součinnosti přináší květen 2008. Na Právnické fakultě Masarykovy univerzity v Brně je obhájena první diplomová práce nadiktovaná hlasem.

Jak to celé funguje?
Přepisovací softwarová aplikace Newton Dictate (software = program, které řídí chod počítačů) snímá plynule mluvenou řeč, kterou ve zlomcích sekundy porovnává se svým slovníkem a s využitím kontextu vypisuje rozpoznaný text. Běžnou srozumitelnou mluvu tento systém přepíše bez větších chyb. Aplikace funguje i jako diktafon. Řeč nahrává, automaticky přepisuje, přičemž kteroukoliv část přepisu si lze kdykoliv přehrát a v případě potřeby snadno opravit.

V pozadí kapacitních možností celé technologie stojí využití tzv. procesorů (mikrosoučást počítače, která má „na svědomí“ jeho výkonnost). Teprve současný pokrok v oblasti vývoje procesorů a souvisejícího hardwaru (hmatatelná část PC sestav, např. klávesnice) však umožňuje plně využívat potenciál systému a významně zvýšit jeho účinnost. Až přesnost na úrovni 90–95 % totiž povyšuje NewtonDictate nad schopnosti profesionální zapisovatelky. Následné minimalizování chyb v přepisu mluvené řeči systému poskytuje významnou úsporu času a tím i prostředků s ušetřením pracovní síly. Od srpna 2008 tuto filosofii testují české soudy využitím 1600 licencí tohoto softwaru dodaných na soudy a státní zastupitelství v lednu následujícího roku.

Inteligentní procesory posunují hranice
Úspěšnost produktů, jako je NewtonDictate, a jejich začlenění do běžného života závisí na schopnosti vědců držet stejné tempo inovací jako doposud. Nové inteligentní procesory Intel Core (na trhu od ledna 2010) pomáhají zvýšit rychlost celého počítače a tím i jmenovaného hlasového systému. Zatímco dříve mu bylo nutné určit, zda bude mluvčím muž nebo žena či rozdělovat slovníky pro jednotlivé obory, procesorová novinka to nevyžaduje. A přínos v praxi? Zkracuje se prodleva mezi řečí a jejím zápisem, neomezuje se software. Slovník, který v současnosti obsahuje půl milionu slov a je neustále doplňován, tak může narůst – v případě potřeby – i na dvojnásobek.

Právě propojení technologií s narůstajícím výkonem procesorů je určujícím faktorem pro další rozvoj hlasových služeb. Podle odborníků firmy Intel se dosažení „svatého grálu“ všech výzkumníků v oblasti rozpoznávání řeči - spolehlivého přepisu hovorové řeči, kterou běžně slyšíme kolem nás - dá čekat v horizontu 3–5 let. Splnění tohoto milníku stojí v cestě například podmínka, že při diktování na mikrofon musí dnešní mluvčí svůj hlas přece jen stylizovat a zřetelně vyslovovat, aby byl přepis úspěšný. V budoucnu se zvýší šance na potlačení všech rušivých prvků prostředí, akustických a fonetických vlivů či nejednoznačného kontextu. Procesory na této dobrodružné cestě objevů určitě sehrají klíčovou roli a myšlenky typu automatického překládání do cizích jazyků v mluvené řeči již nebudou jen v oblasti sci-fi.
 
 

Diskuze

Možnost přidání příspěvku k článku mají jen registrovaní uživatelé. Registrovat se můžete ZDE. Pokud jste již registrovaný(á) uživatel(ka), nezapomeňte se prosím přihlásit.