Treq - Translation Equivalents Database 2.0

The result's identifiers

Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F17%3A10366980" target="_blank" >RIV/00216208:11210/17:10366980 - isvavai.cz</a>
Result on the web
<a href="https://wiki.korpus.cz/doku.php/manualy:treq" target="_blank" >https://wiki.korpus.cz/doku.php/manualy:treq</a>
DOI - Digital Object Identifier
—

Alternative languages

Result language
čeština
Original language name
Databáze překladových ekvivalentů Treq 2.0
Original language description
Treq je sbírka oboustranných česko-cizojazyčných slovníků, vytvořených automaticky z paralelního korpusu InterCorp. Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++. Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční. Ve verzi 2.0 můžeme kromě jednotlivých slov vyhledávat i víceslovnou jednotku a využít při hledání regulární výrazy. Můžeme si také vybrat, zda má být výsledek založen na překladech beletristického jádra, jednotlivých kolekcí, nebo všech textů v InterCorpu. Databáze vychází z 9. vydání korpusu InterCorp.
Czech name
Databáze překladových ekvivalentů Treq 2.0
Czech description
Treq je sbírka oboustranných česko-cizojazyčných slovníků, vytvořených automaticky z paralelního korpusu InterCorp. Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++. Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční. Ve verzi 2.0 můžeme kromě jednotlivých slov vyhledávat i víceslovnou jednotku a využít při hledání regulární výrazy. Můžeme si také vybrat, zda má být výsledek založen na překladech beletristického jádra, jednotlivých kolekcí, nebo všech textů v InterCorpu. Databáze vychází z 9. vydání korpusu InterCorp.

Classification

Type
R - Software
CEP classification
—
OECD FORD branch
60203 - Linguistics

Result continuities

Project
<a href="/en/project/LM2015044" target="_blank" >LM2015044: Czech National Corpus</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

Publication year
2017
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

Internal product ID
Treq 2.0
Technical parameters
https://github.com/czcorpus/Treq
Economical parameters
Aplikace je nasazena na http://treq.korpus.cz , průměrný počet uživatelských interakcí vyhodnocených Treqem se pohybuje okolo 450 denně.
Owner IČO
00216208
Owner name
Univerzita Karlova v Praze

Similar results(10)

Treq - Translation Equivalents Database InterCorp, a Parallel Corpus of 40 Languages Treq tool in the process of establishing Polish-Czech translation pairs

What are you looking for?

Quick search

Smart search

Treq - Translation Equivalents Database 2.0

The result's identifiers

Alternative languages

Classification

Result continuities

Others

Data specific for result type

Similar results(10)

What are you looking for?

Quick search

Smart search

Result description

The result's identifiers

The result's identifiers

Alternative languages

Alternative languages

Classification

Classification

Result continuities

Result continuities

Others

Others

Data specific for result type

Data specific for result type

Similar results(10)