MorfFlex CZ 2.1
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F24%3A10493013" target="_blank" >RIV/00216208:11320/24:10493013 - isvavai.cz</a>
Výsledek na webu
<a href="http://hdl.handle.net/11234/1-5833" target="_blank" >http://hdl.handle.net/11234/1-5833</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
MorfFlex CZ 2.1
Popis výsledku v původním jazyce
MorfFlex CZ 2.1 je český morfologický slovník vyvinutý původně Janem Hajičem jako slovník pro kontrolu pravopisu a lemmatizaci. MorfFlex CZ 2.1 je součástí vydání PDT-C 2.0 https://hdl.handle.net/11234/1-5813. Jedná se o menší upgrade z MorfFlex CZ 2.0 s nezměněnou sadou tagů, ale s některými doplňky a opravami pro plnou kompatibilitu s morfologickou anotací PDT-C 2.0. MorfFlex je seznam trojic lemma-značka-slovní forma. Pro každou slovní formu je kompletní morfologická informace kódována poziční značkou. Slovní formy jsou uspořádány do skupin (paradigma instancí nebo paradigmat ve zkratce) podle jejich formálního morfologického chování. Paradigma (množina slovník forem) je identifikováno jedinečným lemmatem. Kromě tradičních morfologických kategorií obsahuje popis také některé sémantické, stylistické a odvozené informace. Podrobněji viz obsáhlá specifikace české morfologické anotace https://ufal.mff.cuni.cz/techrep/tr64.pdf .
Název v anglickém jazyce
MorfFlex CZ 2.1
Popis výsledku anglicky
MorfFlex CZ 2.1 is the Czech morphological dictionary developed originally by Jan Hajič as a spelling checker and lemmatization dictionary. MorfFlex CZ 2.1 is a part of the PDT-C 2.0 release https://hdl.handle.net/11234/1-5813. It is a minor upgrade from MorfFlex CZ 2.0, with the tagset unchanged, but with some additions and corrections for full compatibility with PDT-C 2.0 morphological annotation. MorfFlex is a flat list of lemma-tag-wordform triples. For each wordform, full inflectional information is coded in a positional tag. Wordforms are organized into entries (paradigm instances or paradigms in short) according to their formal morphological behavior. The paradigm (set of wordforms) is identified by a unique lemma. Apart from traditional morphological categories, the description also contains some semantic, stylistic and derivational information. For more details see a comprehensive specification of the Czech morphological annotation https://ufal.mff.cuni.cz/techrep/tr64.pdf .
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
czech_morfflex_2.1
Technické parametry
Výsledek volně dostupný na adrese http://hdl.handle.net/11234/1-5833.
Ekonomické parametry
2,000,000
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova