All
All

What are you looking for?

All
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Tools for accessing of printed texts from 19th century and the first half of the 20th century

Project goals

1. An application creation to work with knowledge databases of old Czech language layers and knowledge basis development 2. 5 special dictionaries creation, which will correspond with older spelling rules and tools for transliteration creation 3. Simplelemmatization tool creation for 19th century (the project is not dealing with synonyms) 4. Analysis of fracture types used in the first half of 19th century for printing Czech language origin texts and special tool for OCR support of Czech fracture printed documents development.

Keywords

librarianshipknowledge toolsOCRprinted texts from 19th century

Public support

  • Provider

    Ministry of Culture

  • Programme

    Applied research and development of national and cultural identity Programme? (in short, ?NAKI?)

  • Call for proposals

    NAKI 1 (SMK02011DF001)

  • Main participants

    Národní knihovna České republiky
    Univerzita Karlova / Filozofická fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    11/2011/OVV

Alternative language

  • Project name in Czech

    Nástroje pro zpřístupnění tištěných textů 19. století a první poloviny 20. století

  • Annotation in Czech

    1. Vytvoření aplikace pro práci se znalostními bázemi starších vrstev českého jazyka a tvorba znalostních bází 2. Vytvoření pěti slovníků, odpovídajících starším pravopisným pravidlům (19. a 1. polovina 20. stol.) a nástroje pro transliteraci 3. Vytvoření jednoduchého lemmatizátoru pro 19. stol. (předmětem projektu nebude řešení problematiky synonym) 4. Analýza typů fraktury používaných v první polovině 19. stol. pro tisk jazykově českých publikací a vývoj nástroje pro podporu rozpoznávání jazykově českých textů tištěných frakturou.

Scientific branches

  • R&D category

    AP - Applied research

  • CEP classification - main branch

    AF - Documentation, librarianship, work with information

  • CEP - secondary branch

    AI - Linguistics

  • CEP - another secondary branch

  • 10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
    50803 - Information science (social aspects)
    50804 - Library science
    60201 - General language studies
    60202 - Specific languages
    60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Project results evaluation

    The project contributed to the achievement of the main goal by a higher quality of treatment and by providing access to printed texts of the 19th and the first half of the 20th century: SW tools were created for lemmatization, for efficient search in texts, for the transliteration of earlier word forms and for the support of the recognition of older Czech texts printed in the Czech Fracture font.

Solution timeline

  • Realization period - beginning

    Feb 10, 2011

  • Realization period - end

    Dec 31, 2015

  • Project status

    U - Finished project

  • Latest support payment

    Apr 15, 2015

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP16-MK0-DF-U/02:1

  • Data delivery date

    Dec 14, 2016

Finance

  • Total approved costs

    19,685 thou. CZK

  • Public financial support

    19,685 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK