Evaluating a German Sketch Grammar: A Case Study on Noun Phrase Case
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F08%3A00024199" target="_blank" >RIV/00216224:14330/08:00024199 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Evaluating a German Sketch Grammar: A Case Study on Noun Phrase Case
Original language description
Word sketches are part of the Sketch Engine corpus query system. They represent automatic, corpus-derived summaries of the words' grammatical and collocational behaviour. Besides the corpus itself, word sketches require a sketch grammar, a regular expression-based shallow grammar over the part-of-speech tags, to extract evidence for the properties of the targeted words from the corpus. The paper presents a sketch grammar for German, a language which is not strictly configurational and which shows a considerable amount of case syncretism, and evaluates its accuracy, which has not been done for other sketch grammars. The evaluation focuses on NP case as a crucial part of the German grammar. We present various versions of NP definitions, so demonstratingthe influence of grammar detail on precision and recall.
Czech name
Vyhodnocení "sketch grammar" pro Němčinu: Připadová studie jmenných frází
Czech description
Word sketches jsou součástí korpusového manažeru Sketch Engine. Reprezentují shrnutí gramatického a kolokačního chování slov, automaticky odvozené z korpusu. Pro vytvoření word sketches je kromě korpusu zapotřebí rovněž tzv. sketch grammar, mělká gramatika založená na regulárních výrazech nad morfologickými značkami. Tento článek představuje sketch grammar pro Němčinu, jazyk s poměrně volným slovosledem, který vykazuje značné známky sykretismu, a vyhodnocuje její úspěšnost, což dosud nebylo provedeno pro žádnou jinou sketch grammar. Vyhodnocení se zaměřuje na jmenné fráze jakožto zásadní část německé gramatiky. Představujeme různé verze definic jmenných frází a jejich vliv na přesnost a úplnost výsledků.
Classification
Type
D - Article in proceedings
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of the Sixth International Language Resources and Evaluation (LREC'08)
ISBN
2-9517408-4-0
ISSN
—
e-ISSN
—
Number of pages
7
Pages from-to
—
Publisher name
European Language Resources Association (ELRA)
Place of publication
Marrakech, Morocco
Event location
Marrakech, Morocco
Event date
May 25, 2008
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—