K (polo)automatické excerpci neologismů

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68378092%3A_____%2F17%3A00485907" target="_blank" >RIV/68378092:_____/17:00485907 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
K (polo)automatické excerpci neologismů
Popis výsledku v původním jazyce
Článek shrnuje základní informace o tématu poloautomatické excerpce neologismů a snaží se poskytnout vhled do této problematiky. Je rozdělen do dvou hlavních částí. Ve druhém oddílu je srovnána automatická a poloautomatická excerpce neologismů s tradičnějším přístupem, který spočívá v ručním vyhledávání neologismů (tj. pročítání textů a vyhledávání potenciálních neologismů). V oddílu třetím jsou pak popsány základní principy nástrojů pro (polo)automatické vyhledávání neologismů v textech a jsou poskytnuty vybrané příklady takových nástrojů. Tyto nástroje jsou typicky založeny na předdefinovaných seznamech slov, která nemají být považována za neologismy. Ve třetím oddílu je dále tematizována problematika možných vylepšení takových nástrojů, mj. možnost vyloučení vlastních jmen či zkratek nebo možnost vyfiltrování překlepů a chyb. Článek se pokouší upozorňovat na nedostatky jak těchto dílčích funkcí, tak automatické excerpce neologismů samotné.
Název v anglickém jazyce
On Semi-Automatic Detection of Neologisms
Popis výsledku anglicky
The present article attempts to provide some basic information on, and insight into, the topic of semi-automatic detection of neologisms. The paper is divided into two major parts, developed mainly in sections 2 and 3, the former contrasts automatic and semi-automatic detection of neologisms with the more traditional method of searching for neologisms manually (‘reading and marking’). The latter explores the principles underlying the workings of neologism detection tools, while providing examples of such typically exclusion-list based tools, some of them deemed as prototypes. Section 3 furthermore comments on the additional algorithms and functions of some of the tools, viz. the exclusion of proper names (pertaining to named entity recognition), or of abbreviations, and the automatic filtering out of typos and errors. The paper pinpoints the weaknesses and drawbacks of some of these functions as well as of the semi-automatic detection of neologisms per se.

Klasifikace

Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
60203 - Linguistics

Návaznosti výsledku

Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název periodika
Jazykovědné aktuality
ISSN
1212-5326
e-ISSN
—
Svazek periodika
54
Číslo periodika v rámci svazku
3/4
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
13
Strana od-do
34-46
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—

Podobné výsledky(10)

K efektivitě manuální a poloautomatické excerpce neologismů K efektivitě manuální a poloautomatické excerpce neologismů Italské a vybrané francouzské neologismy z oblasti informatiky a nových médií (1990-1996)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

K (polo)automatické excerpci neologismů

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)