Russian Shoah Phonetic Transcription Module
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000046" target="_blank" >RIV/49777513:23520/05:00000046 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Russian Shoah Phonetic Transcription Module
Original language description
Russian Shoah phonetic transcription module is used to convert spontaneous Russian textual testimonies of holocaust survivors to their phonetic (i.e. pronunciation) forms in a fully automatic way. It is employed when building and running automatic Russian testimonies-oriented keyword/topic spotting systems; it supplies the manual orthographic annotations with their corresponding phonetic forms. The module comprises about 115 Russian expert phonetic transcription rules including inter- and cross-word voice assimilation rules, rules for consonant palatalization and simplifying consonant groups, rules for transcribing vowel groups and rules for intervocalic attenuation. Multiple transcriptions of ambiguous Russian contexts are also supported. The expert rules have been verified by means of an automatic data mining method using the real data from the Russian testimonies.
Czech name
Shoah - Modul fonetické transkripce ruštiny
Czech description
Modul fonetické transkripce ruštiny slouží k automatickému převodu spontánních ruských výpovědí svědků holocaustu z textové do fonetické (tj. výslovnostní) podoby. Využívá se při vývoji a provozování systémů automatického vyhledávání klíčových slov a topiků v těchto výpovědích – doplňuje manuální ortografické anotace o jejich fonetickou podobu. Modul obsahuje přibližně 115 ruských expertních fonetických pravidel, včetně speciálních pravidel pro vnitroslovní i mezislovní spodobu znělosti, pravidelpro palatalizaci konsonantů a zjednodušování skupin konsonantů, pravidel pro přepis skupin vokálů a pravidel pro intervokalické oslabování. Modul podporuje také pra
Classification
Type
X - Unclassified
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/LC536" target="_blank" >LC536: Integrated center for natural language processing</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2005
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů