Czech Shoah Phonetic Transcription Module
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000056" target="_blank" >RIV/49777513:23520/05:00000056 - isvavai.cz</a>
Alternative codes found
RIV/49777513:23520/05:00000057
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Czech Shoah Phonetic Transcription Module
Original language description
Czech Shoah phonetic transcription module is used to convert spontaneous Czech textual testimonies of holocaust survivors to their phonetic (i.e. pronunciation) forms in a fully automatic way. It is employed when building and running automatic testimonies-oriented keyword/topic spotting systems; it supplies the manual orthographic annotations with their corresponding phonetic forms. The module comprises about 155 Czech expert phonetic transcription rules including special inter- and cross-word voice assimilation rules, articulation assimilation rules, rules for transcribing diphthongs, rules for simplifying consonant groups, and optionally also rules for transcribing syllabic consonants and a special phonetic unit - glottal stop. Multiple transcriptions of ambiguous Czech context are also supported. The expert rules have been verified by means of an automatic data mining method using the real data from the Czech testimonies.
Czech name
Shoah - Modul fonetické transkripce češtiny
Czech description
Modul fonetické transkripce češtiny slouží k automatickému převodu spontánních českých výpovědí svědků holocaustu z textové do fonetické (tj. výslovnostní) podoby. Využívá se při vývoji a provozování systémů automatického vyhledávání klíčových slov a topiků v těchto výpovědích – doplňuje manuální ortografické anotace o jejich fonetickou podobu. Modul obsahuje přibližně 155 českých expertních fonetických pravidel, včetně speciálních pravidel pro vnitroslovní i mezislovní spodobu znělosti, pravidelasimilace artikulační, pravidel pro přepis diftongů, pravidel pro zjednodušování souhláskových shluků a volitelně také pravidel pro přepis slabi
Classification
Type
X - Unclassified
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/LC536" target="_blank" >LC536: Integrated center for natural language processing</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2005
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů