Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Tēzaurs.lv – the experience of building a multifunctional lexical resource

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F23%3AZRR9Q9NK" target="_blank" >RIV/00216208:11320/23:ZRR9Q9NK - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://www.scopus.com/inward/record.uri?eid=2-s2.0-85171388807&partnerID=40&md5=0285490d60065d8f39cdc47996d54330" target="_blank" >https://www.scopus.com/inward/record.uri?eid=2-s2.0-85171388807&partnerID=40&md5=0285490d60065d8f39cdc47996d54330</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Tēzaurs.lv – the experience of building a multifunctional lexical resource

  • Popis výsledku v původním jazyce

    "In this paper, we describe our findings from developing the lexicographic platform Tēzaurs.lv, extending it from a traditional explanatory dictionary into a multifunctional resource for structured lexical data. Tēzaurs.lv is the largest Latvian dictionary with more than 390,000 entries, which emerged as a compilation from nearly 300 prior dictionaries and other sources. Recently, it has been extended with Latvian WordNet data, effectively making it also a synonym dictionary and a translation dictionary. Each entry can contain multiple lexemes with their grammatical information and inflection tables, enabling search on inflection forms and spelling variants. For the new requirements, we have developed a lexical database system and a collaborative online editor toolkit, which are also used for two other major Latvian dictionaries. While previously the data model and tools were based on what the end user would see in a dictionary entry, the current infrastructure is designed with a highly structured lexical data model. This avoids duplication and helps to ensure consistency if entries or word senses are edited or merged, and it supports the usage of this data in computational linguistics. © 2023 Lexical Computing CZ s.r.o.. All rights reserved."

  • Název v anglickém jazyce

    Tēzaurs.lv – the experience of building a multifunctional lexical resource

  • Popis výsledku anglicky

    "In this paper, we describe our findings from developing the lexicographic platform Tēzaurs.lv, extending it from a traditional explanatory dictionary into a multifunctional resource for structured lexical data. Tēzaurs.lv is the largest Latvian dictionary with more than 390,000 entries, which emerged as a compilation from nearly 300 prior dictionaries and other sources. Recently, it has been extended with Latvian WordNet data, effectively making it also a synonym dictionary and a translation dictionary. Each entry can contain multiple lexemes with their grammatical information and inflection tables, enabling search on inflection forms and spelling variants. For the new requirements, we have developed a lexical database system and a collaborative online editor toolkit, which are also used for two other major Latvian dictionaries. While previously the data model and tools were based on what the end user would see in a dictionary entry, the current infrastructure is designed with a highly structured lexical data model. This avoids duplication and helps to ensure consistency if entries or word senses are edited or merged, and it supports the usage of this data in computational linguistics. © 2023 Lexical Computing CZ s.r.o.. All rights reserved."

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

  • Návaznosti

Ostatní

  • Rok uplatnění

    2023

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    "Proc. Electron. lexicogr. 21st cent. Conf."

  • ISBN

  • ISSN

    2533-5626

  • e-ISSN

  • Počet stran výsledku

    19

  • Strana od-do

    410-428

  • Název nakladatele

    Lexical Computing CZ s.r.o.

  • Místo vydání

  • Místo konání akce

    Singapore

  • Datum konání akce

    1. 1. 2023

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku