Slovak Shoah Phonetic Transcription Module
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000048" target="_blank" >RIV/49777513:23520/06:00000048 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Slovak Shoah Phonetic Transcription Module
Original language description
Slovak Shoah phonetic transcription module is used to convert spontaneous Slovak textual testimonies of holocaust survivors to their phonetic (i.e. pronunciation) forms in a fully automatic way. It is employed when building and running automatic testimonies-oriented keyword/topic spotting systems; it supplies the manual orthographic annotations with their corresponding phonetic forms. The module comprises about 150 Slovak expert phonetic transcription rules including special inter- and cross-word voiceassimilation rules, rules for "softening" consonants and simplifying consonant groups, rules for transcribing short and long syllabic consonants, rules for transcribing diphthongs, and optionally also rules for transcribing a special phonetic unit - glottal stop. Multiple transcriptions for ambiguous Slovak context are also supported. The expert rules have been verified by means of an automatic data mining method using the real data from the Slovak testimonies.
Czech name
Shoah - Modul fonetické transkripce slovenštiny
Czech description
Modul fonetické transkripce slovenštiny slouží k automatickému převodu spontánních slovenských výpovědí svědků holocaustu z textové do fonetické (tj. výslovnostní) podoby. Využívá se při vývoji a provozování systémů automatického vyhledávání klíčových slov a topiků v těchto výpovědích – doplňuje manuální ortografické anotace o jejich fonetickou podobu. Modul obsahuje přibližně 150 slovenských expertních fonetických pravidel, včetně speciálních pravidel pro vnitroslovní i mezislovní spodobu znělosti, pravidel změkčování konsonantů a zjednodušování skupin konsonantů, pravidel pro přepis krátkých a dlouhých slabikotvorných konsonantů, pravidel tr
Classification
Type
X - Unclassified
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/LC536" target="_blank" >LC536: Integrated center for natural language processing</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2006
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů