On the efficiency of manual and semi-automatic detection of neologisms
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F19%3A10392654" target="_blank" >RIV/00216208:11210/19:10392654 - isvavai.cz</a>
Alternative codes found
RIV/68378092:_____/19:00504724
Result on the web
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=hCu7kS4zSG" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=hCu7kS4zSG</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
K efektivitě manuální a poloautomatické excerpce neologismů
Original language description
Článek prezentuje jednoduchou metodu poloautomatické excerpce neologismů: jednoduchý skript v jazyce Python zpracuje textový soubor, přičemž využije český morfologický tagger, a všechna slova, která tagger nerozezná, označí jako potenciální neologismy. Seznam potenciálních neologismů musí být zkontrolován ručně. Tato metoda byla aplikována na soubor textů, které byly rovněž vyexcerpovány ručně, tj. v současnosti uplatňovanou metodou, při níž excerptor pročítá text a označuje výrazy, které považuje za potenciální neologismy. Srovnání výsledků ruční a poloautomatické excerpce jasně ukazuje, že skript pro poloautomatickou excerpci vykazuje výrazně lepší výsledky než excerpce ruční, a to jak z hlediska rychlosti práce, tak z hlediska její efektivity.
Czech name
K efektivitě manuální a poloautomatické excerpce neologismů
Czech description
Článek prezentuje jednoduchou metodu poloautomatické excerpce neologismů: jednoduchý skript v jazyce Python zpracuje textový soubor, přičemž využije český morfologický tagger, a všechna slova, která tagger nerozezná, označí jako potenciální neologismy. Seznam potenciálních neologismů musí být zkontrolován ručně. Tato metoda byla aplikována na soubor textů, které byly rovněž vyexcerpovány ručně, tj. v současnosti uplatňovanou metodou, při níž excerptor pročítá text a označuje výrazy, které považuje za potenciální neologismy. Srovnání výsledků ruční a poloautomatické excerpce jasně ukazuje, že skript pro poloautomatickou excerpci vykazuje výrazně lepší výsledky než excerpce ruční, a to jak z hlediska rychlosti práce, tak z hlediska její efektivity.
Classification
Type
J<sub>ost</sub> - Miscellaneous article in a specialist periodical
CEP classification
—
OECD FORD branch
60203 - Linguistics
Result continuities
Project
—
Continuities
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Others
Publication year
2019
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Naše řeč
ISSN
0027-8203
e-ISSN
—
Volume of the periodical
102
Issue of the periodical within the volume
1
Country of publishing house
CZ - CZECH REPUBLIC
Number of pages
12
Pages from-to
64-75
UT code for WoS article
—
EID of the result in the Scopus database
—