MediaWiki:Gotisk skrift

Skift til: navigering, søgning

Optisk tekstgenkendelse (OCR) af fraktur, som er en i 1500-tallet fra Tyskland indført standardiseret form for trykt gotisk skrift, kan gøres med følgende programmer:

Tesseract

Et gratis DOS-baseret program udviklet for længe siden af HP, som også kan udnyttes af programmet gImage Reader.

Installation

De pakkede gz-filer udpakkes af for eks. 7-zip, så de får navnene dan.traineddata, dan-frak.traineddata, deu-frak.traineddata og swe-frak.traineddata og kopieres til den installerede tessdata-filmappe.

Brug af programmet

En kommandopromt åbnes og der skiftes til den rette filmappe med kommandoen:

cd c:\Program Files (x86)\Tesseract-OCR

Fra kommandopromten startes programmet med følgende syntaks:

tesseract.exe imagename outputbase [-l lang] [configfile [[+|-]varfile]...]

Inputfilen (imagename) skal være en i forvejen indscannet fil i (for eksempel) tiff-format.

Instruktion

Recognition Server

Programmet FineReader fra software-firmaet Abbyy er afløst af det online-tilgængelige program Recognition Server 4.0 (680 MB), som udbydes med en gratis testlicens til 50 sider eller en professionel til for eksempel 2500 sider for 149€ eller 10000 sider for 299€.