Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F47813059%3A19240%2F23%3AA0001367" target="_blank" >RIV/47813059:19240/23:A0001367 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz

  • Popis výsledku v původním jazyce

    V projektu SGS byly dosaženy užitečné výsledky pro výzkum transkripce a pro vzděláváni na SU. Projekt byl zaměřen na pokračování experimentů s transkripcí rukopisného historického textu s velice slibným výsledkem. Transkribováná byla rukopisní kniha psaná německým kurentem. Výsledek transkripce je věřejne dostupný na stránce platformy Transkribus. Dále byly zkoumány možnosti automatické transkripce archivních dokumentů, ktoré jsou psány psacími stroji. (V archivech je takových materiálů ca 50-80%) 1. Provedena heuristika vhodných tiskopisných sbírek, které lze použít pro vytvoření nového přepisovacího modelu v platformě Transkribus. (Hledání bylo provedeno i v rámci praktické části diplomové práce). Výsledných 10 sbírek bylo oskenováno v archivu v Jeseníku (cca 12 stran z každé knihy), k čemuž byl použit skenovací stan ScanTent, který byl zapůjčen Slezskou univerzitou.Výsledné skeny byli poté nahrány do platformy Transkribus Expert Client. S každým dokumentem se pracovalo zvlášť. Nejprve u každé proběhla automatická segmentace, poté se manuálně přepisoval text ve zhruba 4 stran z každé knihy a  s těmi se dále pracovalo v rámci přepisů. 2. Zkoušení nového programu pro přepis dokumentů, InkCapture. Písemné hodnocení nástroje transkripce InkCapture. (Připojeno) Vybrání
 vhodného rukopisu, který lze použít pro potřeby skenu. Poté registrace uživatele v
 programu a následná práce s přepsanými skeny. Sepsáno souhrné hodnocení
ohledně celé platformy InkCapture." Nástroj PERO.cz nebyl dostupný.

  • Název v anglickém jazyce

    Projekt SG7/7/2023. Model of automatic transcription of a historical document using the platform Transkribus and PERO.cz

  • Popis výsledku anglicky

    In the SGS project, useful results for transcription research and for education at SU have been achieved. The project was focused on the continuation of experiments with the transcription of a manuscript historical text with a very promising result. A manuscript book written by a German curent was transcribed. The transcription result is publicly available on the Transkribus platform page. Furthermore, the possibilities of automatic transcription of archival documents, which are written by typewriters, were investigated. (There are about 50-80% of such materials in the archives) 1. Heuristics of suitable printed collections that can be used to create a new transcription model in the Transkribus platform have been performed. (The search was also carried out as part of the practical part of the diploma thesis). The resulting 10 collections were scanned in the archive in Jeseník (approx. 12 pages from each book), for which a ScanTent scanning tent was used, which was loaned by the University of Silesia. The resulting scans were then uploaded to the Transkribus Expert Client platform. Each document was worked on separately. First, automatic segmentation took place for each, then the text was manually transcribed in approximately 4 pages from each book and these were further worked on within the framework of transcriptions. 2. Trying a new document transcribing program, InkCapture. Written evaluation of the InkCapture transcription tool. (Attached) Selecting a suitable manuscript to use for scanning purposes. Then user registration in the program and subsequent work with transcribed scans. A summary assessment of the entire InkCapture platform has been written." The PERO.cz tool was not available.

Klasifikace

  • Druh

    V<sub>souhrn</sub> - Souhrnná výzkumná zpráva

  • CEP obor

  • OECD FORD obor

    50804 - Library science

Návaznosti výsledku

  • Projekt

  • Návaznosti

    S - Specificky vyzkum na vysokych skolach

Ostatní

  • Rok uplatnění

    2023

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Počet stran výsledku

    4

  • Místo vydání

    SU OPAVA

  • Název nakladatele resp. objednatele

    SU FPF

  • Verze