Forskel mellem versioner af "MediaWiki:Gotisk skrift"

Skift til: navigering, søgning
m
m
Linje 2: Linje 2:
  
 
== [[wp:de:Tesseract (Software)|Tesseract]] ==
 
== [[wp:de:Tesseract (Software)|Tesseract]] ==
Et gratis DOS-baseret program udviklet for længe siden af HP, som hentes her:
+
Et gratis DOS-baseret program udviklet for længe siden af HP, som også kan udnyttes af programmet gImage Reader.
  
 
==== Installation ====
 
==== Installation ====
Linje 14: Linje 14:
 
De pakkede gz-filer udpakkes af for eks. [http://7-zip.org 7-zip], så de får navnene <code>dan.traineddata</code>, <code>dan-frak.traineddata</code>, <code>deu-frak.traineddata</code> og <code>swe-frak.traineddata</code> og kopieres til den installerede tessdata-filmappe.
 
De pakkede gz-filer udpakkes af for eks. [http://7-zip.org 7-zip], så de får navnene <code>dan.traineddata</code>, <code>dan-frak.traineddata</code>, <code>deu-frak.traineddata</code> og <code>swe-frak.traineddata</code> og kopieres til den installerede tessdata-filmappe.
  
==== Brug ====
+
* http://sourceforge.net/projects/gimagereader/files/latest/download (gImage Reader)
Programmet startes ved at åbne en kommandopromt og fra en passende filmappe taste en kommando med følgende syntaks:
+
 
 +
==== Brug af programmet ====
 +
En kommandopromt åbnes og der skiftes til den rette filmappe med kommandoen:
 +
 
 +
<code>cd c:\programmer (x86)\tesseract-ocr</code>
 +
 
 +
Fra kommandopromten startes programmet med følgende syntaks:
  
 
<code>tesseract.exe ''imagename outputbase [-l lang] [configfile [[+|-]varfile]...]''</code>
 
<code>tesseract.exe ''imagename outputbase [-l lang] [configfile [[+|-]varfile]...]''</code>
  
 
Inputfilen (imagename) skal være en i forvejen indscannet fil i (for eksempel) [[TIFF|tiff]]-format.
 
Inputfilen (imagename) skal være en i forvejen indscannet fil i (for eksempel) [[TIFF|tiff]]-format.
 +
 +
==== Instruktion ====
 +
* [[ws:de:Hilfe:Tesseract-Texterkennung]]
 +
* http://www.lwl.org/waa-download/pdf/Installation%20OCR%20Software.pdf
 +
* http://succeed-project.eu/wiki/index.php/Tesseract_3.02
  
 
== Recognition Server ==
 
== Recognition Server ==

Versionen fra 8. dec 2015, 00:19

Optisk tekstgenkendelse (OCR) af fraktur, som er en i 1500-tallet fra Tyskland indført standardiseret form for trykt gotisk skrift, kan gøres med følgende programmer:

Tesseract

Et gratis DOS-baseret program udviklet for længe siden af HP, som også kan udnyttes af programmet gImage Reader.

Installation

De pakkede gz-filer udpakkes af for eks. 7-zip, så de får navnene dan.traineddata, dan-frak.traineddata, deu-frak.traineddata og swe-frak.traineddata og kopieres til den installerede tessdata-filmappe.

Brug af programmet

En kommandopromt åbnes og der skiftes til den rette filmappe med kommandoen:

cd c:\programmer (x86)\tesseract-ocr

Fra kommandopromten startes programmet med følgende syntaks:

tesseract.exe imagename outputbase [-l lang] [configfile [[+|-]varfile]...]

Inputfilen (imagename) skal være en i forvejen indscannet fil i (for eksempel) tiff-format.

Instruktion

Recognition Server

Programmet FineReader fra software-firmaet Abbyy er afløst af det online-tilgængelige program Recognition Server 4.0 (680 MB), som udbydes med en gratis testlicens til 50 sider eller en professionel til for eksempel 2500 sider for 149€ eller 10000 sider for 299€.