Optimization of using graphemes methodology in Manuscriptorium search
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00023221%3A_____%2F11%3A%230000191" target="_blank" >RIV/00023221:_____/11:#0000191 - isvavai.cz</a>
Result on the web
<a href="http://www.manuscriptorium.com/index.php?q=cs/content/vysledky-vav-2011" target="_blank" >http://www.manuscriptorium.com/index.php?q=cs/content/vysledky-vav-2011</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Optimalizace metodiky využívání grafémů při vyhledávání v Manuscriptoriu
Original language description
Východiskem optimalizace metodiky využívání grafémů je hypotéza, že není nutné generovat veškeré grafémické variace vyhledávaných slov najednou, protože jednotlivé texty i v nich obsažené citace jsou v podstatě jazykově i historicky homogenní. Soubor grafémických variant byl rozdělen na několik částí podle jazykových skupin: latina, anglosaské jazyky, románské jazyky, slovanské jazyky. V každé z uvedených skupin byly zařazeny znaky a kombinace typické pro daný jazykový okruh. Metoda vyhledávání grafických varian je pro uživatele k dispozici beze změny formuláře pro pokročilé vyhledávání.
Czech name
Optimalizace metodiky využívání grafémů při vyhledávání v Manuscriptoriu
Czech description
Východiskem optimalizace metodiky využívání grafémů je hypotéza, že není nutné generovat veškeré grafémické variace vyhledávaných slov najednou, protože jednotlivé texty i v nich obsažené citace jsou v podstatě jazykově i historicky homogenní. Soubor grafémických variant byl rozdělen na několik částí podle jazykových skupin: latina, anglosaské jazyky, románské jazyky, slovanské jazyky. V každé z uvedených skupin byly zařazeny znaky a kombinace typické pro daný jazykový okruh. Metoda vyhledávání grafických varian je pro uživatele k dispozici beze změny formuláře pro pokročilé vyhledávání.
Classification
Type
Z<sub>polop</sub> - Pilot plant
CEP classification
AF - Documentation, librarianship, work with information
OECD FORD branch
—
Result continuities
Project
—
Continuities
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Others
Publication year
2011
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
Grafémické varianty
Numerical identification
—
Technical parameters
Původní soubor grafémů byl pro testovací účely rozdělen na několik částí primárně podle jazykového hlediska. Oproti zadání preferujícímu jazykové členění se ukázalo jako efektivnější členění podle celých jazykových skupin. Do prvního bloku byly vyčleněnygrafémy vyskytující se převážně v latinských textech, další tři bloky obsahovaly grafémy z evropských národních jazyků ? grafémické varianty pro jazyky anglosaské, románské a slovanské. V každé z uvedených skupin byly zařazeny znaky a kombinace typicképro daný jazykový okruh. U slovanských jazyků to byly např. znaky s diakritikou (háčky, čárky) či specifické spřežkové kombinace, které v některých slovanských jazycích diakritiku nahrazují.
Economical parameters
Rozdělením grafémů na skupiny došlo k zrychlení vyhledávání v Manuscriptoriu o 50%.
Application category by cost
—
Owner IČO
00023221
Owner name
Národní knihovna České republiky
Owner country
CZ - CZECH REPUBLIC
Usage type
N - Využití výsledku jiným subjektem je možné bez nabytí licence (výsledek není licencován)
Licence fee requirement
—
Web page
—