Tools for accessing of printed texts from 19th century and the first half of the 20th century
Public support
Provider
Ministry of Culture
Programme
Applied research and development of national and cultural identity Programme? (in short, ?NAKI?)
Call for proposals
NAKI 1 (SMK02011DF001)
Main participants
Národní knihovna České republiky<br>Univerzita Karlova / Filozofická fakulta
Contest type
VS - Public tender
Contract ID
11/2011/OVV
Alternative language
Project name in Czech
Nástroje pro zpřístupnění tištěných textů 19. století a první poloviny 20. století
Annotation in Czech
1. Vytvoření aplikace pro práci se znalostními bázemi starších vrstev českého jazyka a tvorba znalostních bází 2. Vytvoření pěti slovníků, odpovídajících starším pravopisným pravidlům (19. a 1. polovina 20. stol.) a nástroje pro transliteraci 3. Vytvoření jednoduchého lemmatizátoru pro 19. stol. (předmětem projektu nebude řešení problematiky synonym) 4. Analýza typů fraktury používaných v první polovině 19. stol. pro tisk jazykově českých publikací a vývoj nástroje pro podporu rozpoznávání jazykově českých textů tištěných frakturou.
Scientific branches
R&D category
AP - Applied research
CEP classification - main branch
AF - Documentation, librarianship, work with information
CEP - secondary branch
AI - Linguistics
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50803 - Information science (social aspects)<br>50804 - Library science<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project contributed to the achievement of the main goal by a higher quality of treatment and by providing access to printed texts of the 19th and the first half of the 20th century: SW tools were created for lemmatization, for efficient search in texts, for the transliteration of earlier word forms and for the support of the recognition of older Czech texts printed in the Czech Fracture font.
Solution timeline
Realization period - beginning
Feb 10, 2011
Realization period - end
Dec 31, 2015
Project status
U - Finished project
Latest support payment
Apr 15, 2015
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP16-MK0-DF-U/02:1
Data delivery date
Dec 14, 2016
Finance
Total approved costs
19,685 thou. CZK
Public financial support
19,685 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK