Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Entity Recognition Using Contextual Embeddings

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F19%3A00332765" target="_blank" >RIV/68407700:21230/19:00332765 - isvavai.cz</a>

  • Nalezeny alternativní kódy

    RIV/68407700:21730/19:00332765

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Entity Recognition Using Contextual Embeddings

  • Popis výsledku v původním jazyce

    In this paper, we present a Named entity recognition sequence labeling task using contextual embeddings such as ELMO or BERT. We compare the result using traditional BiLSTM or BiLSTM-CRF models using word embeddings with the approaches taking advantage of contextual embeddings. These embeddings are trained on large corpora which helps the model to understand the language even if the task-specific dataset is limited. Additionally, the contextual nature of the representation allows us to describe the same word with a different representation regarding the context. For that purpose, we test the models on a commonly used dataset CONLL 2003 and a relatively small in-house-labeled dataset of conversations between bot and a user.

  • Název v anglickém jazyce

    Entity Recognition Using Contextual Embeddings

  • Popis výsledku anglicky

    In this paper, we present a Named entity recognition sequence labeling task using contextual embeddings such as ELMO or BERT. We compare the result using traditional BiLSTM or BiLSTM-CRF models using word embeddings with the approaches taking advantage of contextual embeddings. These embeddings are trained on large corpora which helps the model to understand the language even if the task-specific dataset is limited. Additionally, the contextual nature of the representation allows us to describe the same word with a different representation regarding the context. For that purpose, we test the models on a commonly used dataset CONLL 2003 and a relatively small in-house-labeled dataset of conversations between bot and a user.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

  • Návaznosti

    S - Specificky vyzkum na vysokych skolach

Ostatní

  • Rok uplatnění

    2019

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Proceedings of the International Student Scientific Conference Poster – 23/2019

  • ISBN

    978-80-01-06581-5

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    2

  • Strana od-do

    183-184

  • Název nakladatele

    ČVUT FEL, Středisko vědecko-technických informací

  • Místo vydání

    Praha

  • Místo konání akce

    ČVUT FEL, Technická 2, Praha 6

  • Datum konání akce

    23. 5. 2019

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku