Závěrečná zpráva SGS. Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz. SGS/7/2023
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F47813059%3A19240%2F23%3AA0001377" target="_blank" >RIV/47813059:19240/23:A0001377 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Závěrečná zpráva SGS. Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz. SGS/7/2023
Popis výsledku v původním jazyce
Záverečná správa z výskumu v rámci Študentskej grantovej súťaže (SGS) na Slezskej univerzite v Opave. Projekt byl zaměřen na pokračování experimentů s transkripcí rukopisného historického textu s velice slibným výsledkem. Transkribováná byla rukopisní kniha psaná německým kurentem. Byly zkoumány možnosti automatické transkripce archivních dokumentů, ktoré jsou psány psacími stroji. (V archivech je takových materiálů ca 50-80%). Provedena heuristika vhodných tiskopisných sbírek, které lze použít pro vytvoření nového přepisovacího modelu v platformě Transkribus. Výsledných 10 sbírek bylo oskenováno v archivu v Jeseníku (cca 12 stran z každé knihy), k čemuž byl použit skenovací stan ScanTent, který byl zapůjčen Slezskou univerzitou. Výsledné skeny byli poté nahrány do platformy Transkribus Expert Client. Zkoušení nového programu pro přepis dokumentů, nástroj InkCapture. Písemné hodnocení nástroje transkripce InkCapture. Sepsáno souhrné hodnocení ohledně celé platformy InkCapture." Nástroj PERO.cz nebyl dostupný.
Název v anglickém jazyce
SGS final report. Model of automatic transcription of a historical document using the platform Transkribus and PERO.cz. SGS/7/2023
Popis výsledku anglicky
Final research report within the Student Grant Competition (SGS) at the Silesian University in Opava. The project was focused on continuing experiments with transcription of handwritten historical text with very promising results. A handwritten book written by a German kurent was transcribed. The possibilities of automatic transcription of archival documents written by typewriters were investigated. (There are about 50-80% of such materials in archives). Heuristics of suitable typewritten collections were performed, which can be used to create a new transcription model in the Transkribus platform. The resulting 10 collections were scanned in the archive in Jeseník (about 12 pages from each book), for which the ScanTent scanning tent, which was loaned by the Silesian University, was used. The resulting scans were then uploaded to the Transkribus Expert Client platform. Testing of a new program for transcribing documents, the InkCapture tool. Written evaluation of the InkCapture transcription tool. A summary evaluation has been written regarding the entire InkCapture platform." The PERO.cz tool was not available.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
50804 - Library science
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů