Projekt SG7/7/2023. Model of automatic transcription of a historical document using the platform Transkribus and PERO.cz
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F47813059%3A19240%2F23%3AA0001367" target="_blank" >RIV/47813059:19240/23:A0001367 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz
Original language description
V projektu SGS byly dosaženy užitečné výsledky pro výzkum transkripce a pro vzděláváni na SU. Projekt byl zaměřen na pokračování experimentů s transkripcí rukopisného historického textu s velice slibným výsledkem. Transkribováná byla rukopisní kniha psaná německým kurentem. Výsledek transkripce je věřejne dostupný na stránce platformy Transkribus. Dále byly zkoumány možnosti automatické transkripce archivních dokumentů, ktoré jsou psány psacími stroji. (V archivech je takových materiálů ca 50-80%) 1. Provedena heuristika vhodných tiskopisných sbírek, které lze použít pro vytvoření nového přepisovacího modelu v platformě Transkribus. (Hledání bylo provedeno i v rámci praktické části diplomové práce). Výsledných 10 sbírek bylo oskenováno v archivu v Jeseníku (cca 12 stran z každé knihy), k čemuž byl použit skenovací stan ScanTent, který byl zapůjčen Slezskou univerzitou.Výsledné skeny byli poté nahrány do platformy Transkribus Expert Client. S každým dokumentem se pracovalo zvlášť. Nejprve u každé proběhla automatická segmentace, poté se manuálně přepisoval text ve zhruba 4 stran z každé knihy a s těmi se dále pracovalo v rámci přepisů. 2. Zkoušení nového programu pro přepis dokumentů, InkCapture. Písemné hodnocení nástroje transkripce InkCapture. (Připojeno) Vybrání vhodného rukopisu, který lze použít pro potřeby skenu. Poté registrace uživatele v programu a následná práce s přepsanými skeny. Sepsáno souhrné hodnocení ohledně celé platformy InkCapture." Nástroj PERO.cz nebyl dostupný.
Czech name
Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz
Czech description
V projektu SGS byly dosaženy užitečné výsledky pro výzkum transkripce a pro vzděláváni na SU. Projekt byl zaměřen na pokračování experimentů s transkripcí rukopisného historického textu s velice slibným výsledkem. Transkribováná byla rukopisní kniha psaná německým kurentem. Výsledek transkripce je věřejne dostupný na stránce platformy Transkribus. Dále byly zkoumány možnosti automatické transkripce archivních dokumentů, ktoré jsou psány psacími stroji. (V archivech je takových materiálů ca 50-80%) 1. Provedena heuristika vhodných tiskopisných sbírek, které lze použít pro vytvoření nového přepisovacího modelu v platformě Transkribus. (Hledání bylo provedeno i v rámci praktické části diplomové práce). Výsledných 10 sbírek bylo oskenováno v archivu v Jeseníku (cca 12 stran z každé knihy), k čemuž byl použit skenovací stan ScanTent, který byl zapůjčen Slezskou univerzitou.Výsledné skeny byli poté nahrány do platformy Transkribus Expert Client. S každým dokumentem se pracovalo zvlášť. Nejprve u každé proběhla automatická segmentace, poté se manuálně přepisoval text ve zhruba 4 stran z každé knihy a s těmi se dále pracovalo v rámci přepisů. 2. Zkoušení nového programu pro přepis dokumentů, InkCapture. Písemné hodnocení nástroje transkripce InkCapture. (Připojeno) Vybrání vhodného rukopisu, který lze použít pro potřeby skenu. Poté registrace uživatele v programu a následná práce s přepsanými skeny. Sepsáno souhrné hodnocení ohledně celé platformy InkCapture." Nástroj PERO.cz nebyl dostupný.
Classification
Type
V<sub>souhrn</sub> - Summary research report
CEP classification
—
OECD FORD branch
50804 - Library science
Result continuities
Project
—
Continuities
S - Specificky vyzkum na vysokych skolach
Others
Publication year
2023
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Number of pages
4
Place of publication
SU OPAVA
Publisher/client name
SU FPF
Version
—