Logo

His Master's CS-Voice


(Softwarové noviny 2/1994)



„Cé-es-vojs-je-pro-gram-kte-rý-pře-vá-dí-texto-vé-so-bo-ry-do-syntetic-ké-řeši-v-šeském-ja-zyce,“ říká demonstrační soubor celkem přirozeně znějícím, jen poněkud přerývaným mužským hlasem. Po Kraftwerkovsky robotických syntezátorech lidské řeči bezesporu uspokojivý pokrok na cestě ke kýžené možnosti pokecat s počítačem, i když ideálu Smerďakovu: „S chytrým člověkem je zajímavo i pohovořiti!“ stále na hony vzdálený.

CS-Voice 1.0 je produktem Frog systems, pražské firmy, která se místo obvyklých účetnictví a texteditorů rafinovaně zabývá vývojem takových programů, u nichž jim u nás zatím nehrozí mnoho domácí konkurence (kupříkladu OCR QuickWriter – viz SWN 11/92). K provozování federálního Hlasu potřebujete federální Wokna (mimochodem poslední verze CS Windows kromě vylepšení DOSovského okna už také v nastavení národního prostředí zaregistrovala rozpad ČSFR), zvukovou kartu kompatibilní se SoundBlasterem a sluchátka či reproduktor.

Vlastní program se prezentuje jako editační okno, do kterého lze načíst nebo přímo vepsat text. Pro načtení lze nastavit výběr z kódové stránky Latin 2, Kamenických nebo Eastern Europe – text však musí být vždy v ASCII. Doplnění konverzního filtru alespoň pro dokumenty T602 by určitě nebylo od věci. Maximální velikost použitelného souboru je 32 KB (což v dokumentaci není uvedeno); opravená verze programu už delší text prostě nedovolí načíst. Do textu lze vkládat odkazy na zvukové soubory wav. Naopak soubory CS-Voice lze údajně pomocí OLE provázat s jinými (kupříkladu vložit do dokumentu MS Write); mně se to však nepodařilo – respektive podařilo, ale nic se neozvalo. Je však pravděpodobné, že jsem buď pouze neměl dostatek trpělivosti, nebo že se program pral s použitým SoundBlasterem 16 ASP, či že byla nějaká drobná muška v instalaci.

Co se týče samotného hlasového výstupu, je třeba uznat, že pánové z Frogu odvedli zatraceně dobrý kus práce. Projev zní skutečně velmi věruhodně a čistě (snad s výjimkou c a č, které občas zní jako s a š); intonace tázacích vět je perfektní. Bohužel totéž už nelze říci o všech implementovaných funkcích. Vezměme si třeba tu potenciálně nejužitečnější – echo klávesnice. Idea je vcelku prostá: CS-Voice vysloví všechno, co napíšete – můžete si dokonce vybrat, zda to bude hláskovat, nebo číst po slovech či celých větách. Pro čistě mechanické přepisování, u něhož nevadí, že vám počítač kafrá do přemýšlení, by čtení po slovech mohlo být užitečné ke kontrole překlepů. Bohužel však CS-Voice není schopen registrovat, co píšete v době, kdy mluví, takže v praxi to vypadá tak, že napíšete slovo, počkáte, až se program vykecá, a teprve pak můžete psát dál.

Diskutabilní je funkce Čtení dialogu, která zapíná a vypíná čtení dialogových oken, ovšem pouze těch nejjednodušších typu ANO/NE (Uložit soubor, Ukončit Windows); podobně i Čtení nabídky, které přečte po stisknutí definovatelného horkého klíče aktuální položku v otevřeném menu. Nejsem sice hlouběji obeznámen s problematikou používání počítačů nevidomými, ale čistě laicky si dovoluji usuzovat, že Windows pro ně prostě nebudou to pravé. V případě, že se mýlím, je možnost čtení pouze jednoduchých oken nedostečná; pokud ne, postrádám u těchto funkcí jakýkoli praktický smysl. A tak jediná funkce, vůči níž nelze mít námitky, je Čtení schránky.

Jiné drobnosti naopak v programu postrádám – kupříkladu nastavení Hláskuj verzálky (explicite Hláskuj všechno), Čti interpunkční znaménka apod. Seznam výrazů a výjimek ve slovníku je naprosto nedostatečný (zato ale obsahuje termín „nanichodný“, s kterýmžto mimořádně odporným slovakismem jsem se jinde dosud nesetkal), stejně jako celá jeho koncepce, která kupříkladu nedovoluje definovat rozdíl mezi výrazem s mezerou a bez mezery. Tím pádem nelze například instruovat CS-Voice, že termín 1% (jednoprocentní) se liší od 1 % (jedno procento) – samozřejmě nelze očekávat, že by dokázal správně rozlišit střední rod (takže: jedenprocentní, jeden procento). Program rovněž neřeší výjimky slovníkem nepodchytitelné, kupříkladu správné vyslovování +, x, –, = mezi číslicemi; pro plus má sice výraz ve slovníku, ale ten se správně přečte pouze v případě, že jsou okolo + mezery (tedy 1 + 1; zatímco 1+1 se čte jako jeden-jeden). Že to přitom jde, dokazuje znaménko rovná se, které (ač také ve slovníku) se čte správně, i když okolo žádné mezery nejsou.

Vyřešit uživatelskou definici slovníku i do takýchto detailů bude zajisté nelehkým oříškem, avšak dokud se to nepodaří, půjde pořád jen o polotovar. Problémy s číslovkami navíc komplikuje český pravopisný úzus, podle kterého se po třetím řádu nepíše tečka, ale mezera (mimochodem – Softwarové noviny tento úzus nedodržují). Nicméně od toho, aby pochopil, že správně napsaných 120 100 je sto dvacet tisíc sto, nikoli sto dvacet sto, má CS-Voice k dispozici informaci v nastavení národního prostředí Windows.

Všechny výše uvedené výhrady jsou ovšem pouze technickými připomínkami – obecně vzato jsem rád, že podobný program existuje, že se i takovýmito zdánlivými podružnosti někdo zabývá; snad se ještě dožiji dne, kdy se tato práce zúročí ve formě plné verbální komunikace s počítačem. Jedinou skutečně zásadní výhradu jsem si nechal na konec: pánové, řekněte mi jakýkoli racionální důvod, proč soudíte, že by měl za váš program někdo vyhodit pět tisíc? Ta cena je prostě absurdní – CS-Voice je a ještě dlouho nepochybně bude dobrý pouze na hraní, na pobavení kolegů a známých. Jeho praktická hodnota (pomineme-li výše zpochybněné použití pro nevidomé) je zcela nulová. Tak pětistovku by ještě leckterý movitější majitel zvukové karty pro tu švandu vyhodil, ale desetkrát tolik!?

A tak se lze obávat, že pokud Žabí systémy nepřehodnotí u tohoto výrobku svou cenovou politiku, zůstane CS-Voice pouze vyhledávaným exponátem na výstavách a většího rozšíření dozná jen díky hackerským bíbíeskám. Škoda.



CS-Voice 1.0
Text-To-Speech program pro češtinu
Věnoval: Frog Systems Praha
Cena (zaváděcí!): 4990 bez DPH





Úvodní strana ARCHIVU MARTINA MANIŠE

Hlavní menu LEGE ARTIS NA WEBU