TTK: A toolkit for Tunisian linguistic analysis
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F25%3AWR4HASXC" target="_blank" >RIV/00216208:11320/25:WR4HASXC - isvavai.cz</a>
Výsledek na webu
<a href="https://www.scopus.com/inward/record.uri?eid=2-s2.0-85181954060&doi=10.1016%2fj.csl.2023.101617&partnerID=40&md5=ae9e550665373072d2146228fae7a9cc" target="_blank" >https://www.scopus.com/inward/record.uri?eid=2-s2.0-85181954060&doi=10.1016%2fj.csl.2023.101617&partnerID=40&md5=ae9e550665373072d2146228fae7a9cc</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1016/j.csl.2023.101617" target="_blank" >10.1016/j.csl.2023.101617</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
TTK: A toolkit for Tunisian linguistic analysis
Popis výsledku v původním jazyce
Over the last two decades, many efforts have been made to provide resources to support the Arabic Natural Language Processing (NLP). Some of these resources target specific NLP tasks such as word tokenization, parsing, or sentiment analysis, while others attempt to tackle numerous tasks at once. In this paper, we present ¡¡TTK¿¿, a toolkit for Tunisian linguistic analysis. It consists of a collection of linguistic analysis tools for orthographic normalization, sentence boundaries detection, word tokenization, morphological analysis, parsing and named entity recognition. This paper focuses on the design and implementation of TTK tools. © 2024 Elsevier Ltd
Název v anglickém jazyce
TTK: A toolkit for Tunisian linguistic analysis
Popis výsledku anglicky
Over the last two decades, many efforts have been made to provide resources to support the Arabic Natural Language Processing (NLP). Some of these resources target specific NLP tasks such as word tokenization, parsing, or sentiment analysis, while others attempt to tackle numerous tasks at once. In this paper, we present ¡¡TTK¿¿, a toolkit for Tunisian linguistic analysis. It consists of a collection of linguistic analysis tools for orthographic normalization, sentence boundaries detection, word tokenization, morphological analysis, parsing and named entity recognition. This paper focuses on the design and implementation of TTK tools. © 2024 Elsevier Ltd
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Computer Speech and Language
ISSN
0885-2308
e-ISSN
—
Svazek periodika
86
Číslo periodika v rámci svazku
2024
Stát vydavatele periodika
US - Spojené státy americké
Počet stran výsledku
24
Strana od-do
1-24
Kód UT WoS článku
—
EID výsledku v databázi Scopus
2-s2.0-85181954060