Optical Character Recognition for Audio-Visual Broadcast Transcription System

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F20%3A00008347" target="_blank" >RIV/46747885:24220/20:00008347 - isvavai.cz</a>
Výsledek na webu
<a href="https://ieeexplore.ieee.org/document/9237867" target="_blank" >https://ieeexplore.ieee.org/document/9237867</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/CogInfoCom50765.2020.9237867" target="_blank" >10.1109/CogInfoCom50765.2020.9237867</a>

Alternativní jazyky

Jazyk výsledku
angličtina
Název v původním jazyce
Optical Character Recognition for Audio-Visual Broadcast Transcription System
Popis výsledku v původním jazyce
This paper investigates the use of optical character recognition (OCR) for system of audio-visual broadcast transcription. Characters were recognized from video frames by open-source program OCR Tesseract. The OCR in this program (from version 4) is based on Recurrent Neural Networks (RNN) and it uses text post-processing by bigram language model. However, the resulting recognized text contains a number of errors. In some images, the text is not detected and recognized correctly or it is not detected at all. We have designed and tested image pre-processing and text post-processing methods for OCR error reduction. The word error rate (WER) was reduced from 29,4% to 15,4%.
Název v anglickém jazyce
Optical Character Recognition for Audio-Visual Broadcast Transcription System
Popis výsledku anglicky
This paper investigates the use of optical character recognition (OCR) for system of audio-visual broadcast transcription. Characters were recognized from video frames by open-source program OCR Tesseract. The OCR in this program (from version 4) is based on Recurrent Neural Networks (RNN) and it uses text post-processing by bigram language model. However, the resulting recognized text contains a number of errors. In some images, the text is not detected and recognized correctly or it is not detected at all. We have designed and tested image pre-processing and text post-processing methods for OCR error reduction. The word error rate (WER) was reduced from 29,4% to 15,4%.

Klasifikace

Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

Projekt
<a href="/cs/project/TH03010018" target="_blank" >TH03010018: DeepSpot - Multilingvální technologie pro detekci a včasné upozornění</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název statě ve sborníku
11th IEEE International Conference on Cognitive Infocommunications, CogInfoCom 2020 - Proceedings
ISBN
978-172818213-1
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
229-232
Název nakladatele
IEEE
Místo vydání
Finsko
Místo konání akce
Virtual (on-line), Mariehamn- Finland
Datum konání akce
1. 1. 2020
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000662230900038

Podobné výsledky(10)

An In-depth Analysis of OCR Errors for Unconstrained Vietnamese Handwriting OCR error correction using correction patterns and self-organizing migrating algorithm An Efficient Unsupervised Approach for OCR Error Correction of Vietnamese OCR Text

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Optical Character Recognition for Audio-Visual Broadcast Transcription System

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)