O prozodických modelech specifických pro jednotlivé řečníky pro automatickou segmentaci vícestranných mítinků na dialogové akty
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000148" target="_blank" >RIV/49777513:23520/06:00000148 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/49777513:23520/06:00500995
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
On Speaker-Specific Prosodic Models for Automatic Dialog Act Segmentation of Multi-Party Meetings
Popis výsledku v původním jazyce
We explore speaker-specific prosodic modeling for dialog act segmentation of speech from the ICSI Meeting Corpus. We ask whether features beyond pauses help individual speakers, and whether some speakers benefit from prosody models trained on only theirspeech. We find positive results for both questions, although the second is more complex. Feature analysis reveals that duration is the most used feature type, followed by pause and pitch features. Results also suggest a difference between native and nonnative speakers in feature usage patterns. We conclude that features beyond pauses are useful for dialog act segmentation in natural conversation, and that for some speakers, speaker-specific training yields further gains.
Název v anglickém jazyce
On Speaker-Specific Prosodic Models for Automatic Dialog Act Segmentation of Multi-Party Meetings
Popis výsledku anglicky
We explore speaker-specific prosodic modeling for dialog act segmentation of speech from the ICSI Meeting Corpus. We ask whether features beyond pauses help individual speakers, and whether some speakers benefit from prosody models trained on only theirspeech. We find positive results for both questions, although the second is more complex. Feature analysis reveals that duration is the most used feature type, followed by pause and pitch features. Results also suggest a difference between native and nonnative speakers in feature usage patterns. We conclude that features beyond pauses are useful for dialog act segmentation in natural conversation, and that for some speakers, speaker-specific training yields further gains.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/1M0567" target="_blank" >1M0567: Centrum aplikované kybernetiky</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2006
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Interspeech
ISSN
1990-9772
e-ISSN
—
Svazek periodika
2006
Číslo periodika v rámci svazku
—
Stát vydavatele periodika
DE - Spolková republika Německo
Počet stran výsledku
4
Strana od-do
2014
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—