EnTam: An English-Tamil Parallel Corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F13%3A10194841" target="_blank" >RIV/00216208:11320/13:10194841 - isvavai.cz</a>
Výsledek na webu
<a href="http://ufal.mff.cuni.cz/~ramasamy/parallel/html/" target="_blank" >http://ufal.mff.cuni.cz/~ramasamy/parallel/html/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
EnTam: An English-Tamil Parallel Corpus
Popis výsledku v původním jazyce
We have collected English-Tamil bilingual data from some of the publicly available websites for NLP research involving Tamil. The standard set of processing has been applied on the the raw web data before the data became available in sentence aligned English-Tamil parallel corpus suitable for various NLP tasks. The parallel corpora cover texts from bible, cinema and news domains.
Název v anglickém jazyce
EnTam: An English-Tamil Parallel Corpus
Popis výsledku anglicky
We have collected English-Tamil bilingual data from some of the publicly available websites for NLP research involving Tamil. The standard set of processing has been applied on the the raw web data before the data became available in sentence aligned English-Tamil parallel corpus suitable for various NLP tasks. The parallel corpora cover texts from bible, cinema and news domains.
Klasifikace
Druh
R - Software
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
R - Projekt Ramcoveho programu EK
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
UFAL-DATA-EnTam-2.0
Technické parametry
http://ufal.mff.cuni.cz/~ramasamy/parallel/html/
Ekonomické parametry
The data is available for research.
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova v Praze