New tools for working with the ORAL series corpora of spoken Czech : AchSynku and MluvKonk
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F15%3A10319671" target="_blank" >RIV/00216208:11210/15:10319671 - isvavai.cz</a>
Výsledek na webu
<a href="http://korpus.sk/~slovko/2015/Proceedings_Slovko_2015.pdf" target="_blank" >http://korpus.sk/~slovko/2015/Proceedings_Slovko_2015.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
New tools for working with the ORAL series corpora of spoken Czech : AchSynku and MluvKonk
Popis výsledku v původním jazyce
This paper introduces two simple web-based tools whose aim is to make it easier to work with the ORAL series spontaneous spoken language corpora of the Czech National Corpus. Both strive to overcome and circumvent some of the limitations, either in the data themselves or in their visualization, currently faced by linguists who use them for research. AchSynku is a variant search tool which aims to compensate for the lack of lemmatization in spoken corpora by suggesting, based on a word form input by theuser, a list of variant and related forms occurring in the target corpora. MluvKonk is a visualization environment which turns single-line concordances into a multi-tier layout with one speaker per tier. This makes it easier to follow the structure of amulti-party conversation, including turn-switching and overlaps. Though ultimately destined to be superseded by more systemic solutions, both applications are under active development and feedback is welcome, because these ulterior soluti
Název v anglickém jazyce
New tools for working with the ORAL series corpora of spoken Czech : AchSynku and MluvKonk
Popis výsledku anglicky
This paper introduces two simple web-based tools whose aim is to make it easier to work with the ORAL series spontaneous spoken language corpora of the Czech National Corpus. Both strive to overcome and circumvent some of the limitations, either in the data themselves or in their visualization, currently faced by linguists who use them for research. AchSynku is a variant search tool which aims to compensate for the lack of lemmatization in spoken corpora by suggesting, based on a word form input by theuser, a list of variant and related forms occurring in the target corpora. MluvKonk is a visualization environment which turns single-line concordances into a multi-tier layout with one speaker per tier. This makes it easier to follow the structure of amulti-party conversation, including turn-switching and overlaps. Though ultimately destined to be superseded by more systemic solutions, both applications are under active development and feedback is welcome, because these ulterior soluti
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Natural Language Processing, Corpus Linguistics, Lexicography
ISBN
978-3-942303-32-3
ISSN
—
e-ISSN
—
Počet stran výsledku
12
Strana od-do
90-101
Název nakladatele
RAM-Verlag
Místo vydání
Lüdenscheid
Místo konání akce
Bratislava
Datum konání akce
21. 10. 2015
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—