Optimalizace metodiky využívání grafémů při vyhledávání v Manuscriptoriu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00023221%3A_____%2F11%3A%230000191" target="_blank" >RIV/00023221:_____/11:#0000191 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.manuscriptorium.com/index.php?q=cs/content/vysledky-vav-2011" target="_blank" >http://www.manuscriptorium.com/index.php?q=cs/content/vysledky-vav-2011</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Optimalizace metodiky využívání grafémů při vyhledávání v Manuscriptoriu
Popis výsledku v původním jazyce
Východiskem optimalizace metodiky využívání grafémů je hypotéza, že není nutné generovat veškeré grafémické variace vyhledávaných slov najednou, protože jednotlivé texty i v nich obsažené citace jsou v podstatě jazykově i historicky homogenní. Soubor grafémických variant byl rozdělen na několik částí podle jazykových skupin: latina, anglosaské jazyky, románské jazyky, slovanské jazyky. V každé z uvedených skupin byly zařazeny znaky a kombinace typické pro daný jazykový okruh. Metoda vyhledávání grafických varian je pro uživatele k dispozici beze změny formuláře pro pokročilé vyhledávání.
Název v anglickém jazyce
Optimization of using graphemes methodology in Manuscriptorium search
Popis výsledku anglicky
The base of using graphemes optimization is the hypothesis that it is not necessary to generate all graphemes variations of searched words at once because individual texts and containing quotations are basically not homogenous from the linguistic and historical point. The complex of graphemes variants has been separated into several parts according language groups: Latin, Anglo-Saxon languages, Romance languages, Slavic languages. Into all mentioned groups there have been inserted characters and combinations typical for the concrete language group. The search method of graphemes variants is at disposal without any change of the form for advanced searching.
Klasifikace
Druh
Z<sub>polop</sub> - Poloprovoz
CEP obor
AF - Dokumentace, knihovnictví, práce s informacemi
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Grafémické varianty
Číselná identifikace
—
Technické parametry
Původní soubor grafémů byl pro testovací účely rozdělen na několik částí primárně podle jazykového hlediska. Oproti zadání preferujícímu jazykové členění se ukázalo jako efektivnější členění podle celých jazykových skupin. Do prvního bloku byly vyčleněnygrafémy vyskytující se převážně v latinských textech, další tři bloky obsahovaly grafémy z evropských národních jazyků ? grafémické varianty pro jazyky anglosaské, románské a slovanské. V každé z uvedených skupin byly zařazeny znaky a kombinace typicképro daný jazykový okruh. U slovanských jazyků to byly např. znaky s diakritikou (háčky, čárky) či specifické spřežkové kombinace, které v některých slovanských jazycích diakritiku nahrazují.
Ekonomické parametry
Rozdělením grafémů na skupiny došlo k zrychlení vyhledávání v Manuscriptoriu o 50%.
Kategorie aplik. výsledku dle nákladů
—
IČO vlastníka výsledku
00023221
Název vlastníka
Národní knihovna České republiky
Stát vlastníka
CZ - Česká republika
Druh možnosti využití
N - Využití výsledku jiným subjektem je možné bez nabytí licence (výsledek není licencován)
Požadavek na licenční poplatek
—
Adresa www stránky s výsledkem
—