Smart digiline - machine learning for digitization of printed heritage
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00094943%3A_____%2F24%3AN0000019" target="_blank" >RIV/00094943:_____/24:N0000019 - isvavai.cz</a>
Result on the web
<a href="https://hdl.handle.net/11104/0361339" target="_blank" >https://hdl.handle.net/11104/0361339</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.52036/1335793X.2024.2.32-36" target="_blank" >10.52036/1335793X.2024.2.32-36</a>
Alternative languages
Result language
čeština
Original language name
Smart digilinka - strojové učení pro digitalizaci tištěného dědictví
Original language description
Účel – Cílem projektu „Smart digilinka – strojové učení pro digitalizaci tištěného dědictví“ je vytvoření nástrojů pro automatizovanou tvorbu metadat digitalizovaných dokumentů – zejména knih a periodik. Článek popisuje tento projekt a jeho výstupy a také stručně popisuje vznik popisných metadat v procesu digitalizace knihovních fondů. Metoda – Metadata budou z obrazových souborů extrahována pomocí nástrojů strojového učení a výsledky budou upravovány prostřednictvím zpětné vazby, kterou poskytnou uživatelé, což jsou v tomto případě pracovníci knihoven, kteří vytvářejí metadata k digitalizovaným dokumentům. Výsledky – Výsledky projektu budou tři nástroje a dvě metodiky. Nástroj Exposea slouží k automatickému vyrovnání předloh, což usnadní manipulaci s velkými, fyzicky poškozenými předlohami. Nástroj Metakat umožňuje vytvářet automatizované metadatové popisy jednotlivých stran digitalizovaných dokumentů a také analytických úrovní dokumentu (kapitoly pro monografie a články pro periodika). Pro trénování systému automatické extrakce metadat byly vytvořeny sady ručně anotovaných stran a kapitol, na nichž by se mohl systém učit extrahovat metadata. Navazující nástroj Metacheck dokáže vytvářet a odesílat zpětnou vazbu pro zlepšení kvality vytvořených metadat. Dalšími dvěma výstupy projektu jsou Metodika scelování po částech skenovaných předloh a Metodika kontroly kvality v digitalizační lince. Celkovým výsledkem je Smart Digilinka, která představuje kombinaci všech nástrojů, implementovanou formou poloprovozu na digitalizačním pracovišti, které využívá systém ProArc. Originalita/hodnota – Projekt Smart Digilinka umožní významně zrychlit a obohatit proces vytváření metadat k digitalizovaným dokumentům, čímž se také zkrátí doba jejich digitalizace a doba, za kterou se mohou dostat k uživatelům.
Czech name
Smart digilinka - strojové učení pro digitalizaci tištěného dědictví
Czech description
—
Classification
Type
J<sub>ost</sub> - Miscellaneous article in a specialist periodical
CEP classification
—
OECD FORD branch
60500 - Other Humanities and the Arts
Result continuities
Project
<a href="/en/project/DH23P03OVV066" target="_blank" >DH23P03OVV066: Smart digiline - machine learning for digitization of printed heritage</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2024
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
IT lib
ISSN
1336-0779
e-ISSN
1335-793X
Volume of the periodical
2024
Issue of the periodical within the volume
2
Country of publishing house
SK - SLOVAKIA
Number of pages
5
Pages from-to
32-36
UT code for WoS article
—
EID of the result in the Scopus database
—