Forskel mellem versioner af "MediaWiki:Gotisk skrift"

Skift til: navigering, søgning
 
m
Linje 1: Linje 1:
 
Optisk tekstgenkendelse ([[Optical character recognition|OCR]]) af ''[[Fraktur (typografi)|fraktur]]'', som er en i 1500-tallet fra [[Tyskland]] indført standardiseret form for trykt [[Gotisk (skrift)|gotisk skrift]], kan gøres med følgende programmer:
 
Optisk tekstgenkendelse ([[Optical character recognition|OCR]]) af ''[[Fraktur (typografi)|fraktur]]'', som er en i 1500-tallet fra [[Tyskland]] indført standardiseret form for trykt [[Gotisk (skrift)|gotisk skrift]], kan gøres med følgende programmer:
  
== [[mw:Tesseract (Software)|Tesseract]] ==
+
== [[wp:de:Tesseract (Software)|Tesseract]] ==
Et gratis DOS-baseret program
+
Et gratis DOS-baseret program udviklet for længe siden af HP, som hentes her:
  
 +
* http://code.google.com/p/tesseract-ocr/downloads/list (installations filer)
 +
** http://tesseract-ocr.googlecode.com/files/tesseract-ocr-setup-3.02.02.exe (Windows-installation af version 3.02)
 +
** http://tesseract-ocr.googlecode.com/files/deu-frak.traineddata.gz (fraktur øvelsesdata på tysk)
 +
** http://tesseract-ocr.googlecode.com/files/swe-frak.traineddata.gz (fraktur øvelsesdata på svensk)
 +
** http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.dan.tar.gz (dansk sprog)
 +
* http://github.com/tesseract-ocr/tesseract/releases (version 3.04 fås her men skal udpakkes manuelt)
 +
 +
De pakkede gz-filer udpakkes af et specielt program.
 +
Efter installation åbnes en kommandopromt, hvor programmet fra en passende filmappe startes med følgende kommando:
 +
 +
<code>tesseract.exe ''imagename outputbase [-l lang] [configfile [[+|-]varfile]...]''</code>
 +
 +
Inputfilen (imagename) skal være en i forvejen indscannet fil i (for eksempel) [[TIFF|tiff]]-format.
  
 
== Recognition Server ==
 
== Recognition Server ==

Versionen fra 7. dec 2015, 23:08

Optisk tekstgenkendelse (OCR) af fraktur, som er en i 1500-tallet fra Tyskland indført standardiseret form for trykt gotisk skrift, kan gøres med følgende programmer:

Tesseract

Et gratis DOS-baseret program udviklet for længe siden af HP, som hentes her:

De pakkede gz-filer udpakkes af et specielt program. Efter installation åbnes en kommandopromt, hvor programmet fra en passende filmappe startes med følgende kommando:

tesseract.exe imagename outputbase [-l lang] [configfile [[+|-]varfile]...]

Inputfilen (imagename) skal være en i forvejen indscannet fil i (for eksempel) tiff-format.

Recognition Server

Programmet FineReader fra software-firmaet Abbyy er afløst af det online-tilgængelige program Recognition Server 4.0 (680 MB), som udbydes med en gratis testlicens til 50 sider eller en professionel til for eksempel 2500 sider for 149€ eller 10000 sider for 299€.