Generování vzorů dělení slov v UNICODE
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F01%3A00002849" target="_blank" >RIV/00216224:14330/01:00002849 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Generování vzorů dělení slov v UNICODE
Popis výsledku v původním jazyce
Článek popisuje techniku vzorů jako prostředek pro získávání informace z~rozsáhlých dat a zpětné rozpoznávání. Typickou aplikací této techniky je dělení slov. Dosud chybí generátor vzorů dělení pro systém $Omega$ (pro UNICODE) a rozšíření programu PATGEN, omezeného osmibitovým ASCII, není únosné. Proto vyvíjíme knihovnu PATLIB{} pro obecnou manipulaci se vzory a na ní postavíme generátor vzorů dělení slov v~UNICODE. Popíšeme architekturu připravovaného systému a dále méně známou datovou strukturu dynamic packed trie, kterou lze výhodně použít pro efektivní ukládání konečných jazyků s výstupy. Vzory lze použít i pro rozpoznávání hranic složených slov, proto zmíníme návrhy na rozšíření následníků TeXu o klasifikované dělení s~více typy dělících bodů ao automatické potlačování ligatur na švech složených~slov.
Název v anglickém jazyce
Hyphenation Pattern Generation for UNICODE
Popis výsledku anglicky
Pattern generation technique is described, together with design of software library for pattern handling PATLIB.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/VS97028" target="_blank" >VS97028: Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2001
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Sbornik druheho seminare o Linuxu a TeXu, SLT 2001
ISBN
80-7302-009-2
ISSN
—
e-ISSN
—
Počet stran výsledku
10
Strana od-do
23
Název nakladatele
Konvoj
Místo vydání
Brno
Místo konání akce
Brno
Datum konání akce
1. 1. 2001
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—