Coping with unruly language: non-standard usage in a corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F18%3A10385135" target="_blank" >RIV/00216208:11210/18:10385135 - isvavai.cz</a>
Výsledek na webu
<a href="http://vg07.met.vgwort.de/na/612d2e2820e34c5cae7564131e335a91?l=https://heiup.uni-heidelberg.de/reader/download/361/361-69-81153-2-10-20180606.pdf" target="_blank" >http://vg07.met.vgwort.de/na/612d2e2820e34c5cae7564131e335a91?l=https://heiup.uni-heidelberg.de/reader/download/361/361-69-81153-2-10-20180606.pdf</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.17885/heiup.361.509" target="_blank" >10.17885/heiup.361.509</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Coping with unruly language: non-standard usage in a corpus
Popis výsledku v původním jazyce
A language as used in real situations may differ substantially from its standard form. Before the entire range of NLP methods and tools can be applied to non-canonical variants of a language, appropriate categories for the analysis of deviant forms and constructions are needed, together with texts annotated by these categories. A discussion of non-standard language is followed by two case studies. The first study proposes a taxonomy of morphosyntactic categories as an attempt to analyze non-standard forms in non-native learners' Czech. The second study focuses on the role of a rule-based grammar. and lexicon as tools for the detection and diagnostics of non-standard words and constructions in the process of building and using a parsebank.
Název v anglickém jazyce
Coping with unruly language: non-standard usage in a corpus
Popis výsledku anglicky
A language as used in real situations may differ substantially from its standard form. Before the entire range of NLP methods and tools can be applied to non-canonical variants of a language, appropriate categories for the analysis of deviant forms and constructions are needed, together with texts annotated by these categories. A discussion of non-standard language is followed by two case studies. The first study proposes a taxonomy of morphosyntactic categories as an attempt to analyze non-standard forms in non-native learners' Czech. The second study focuses on the role of a rule-based grammar. and lexicon as tools for the detection and diagnostics of non-standard words and constructions in the process of building and using a parsebank.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-10185S" target="_blank" >GA16-10185S: Čeština nerodilých mluvčích z pohledu teoretického a komputačního</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Grammar and Corpora 2016
ISBN
978-3-946054-84-9
ISSN
—
e-ISSN
neuvedeno
Počet stran výsledku
17
Strana od-do
271-287
Název nakladatele
Heidelberg University Publishing
Místo vydání
Heidelberg
Místo konání akce
Mannheim
Datum konání akce
8. 11. 2016
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—