Vom Bild zur Textdatei

txt

 

Wussten Sie schon wie einfach es ist, eingescannte Fachartikel, Mustertexte oder andere Skripte in eine Textdatei umzuwandeln?

Programme zur Texterkennung sind sogar bei vielen Windowsversionen vorinstalliert!

 

 

Basics für den Scanvorgang

Um ordentliche Textdateien zu erhalten sollten Ihre eingescannten Dateien von hoher Qualität sein. Dafür sollten Sie folgende Faktoren beachten:

  • Auflösung: Relation von Pixel (Bildpunkte) und Fläche (Einheit: dpi = dots per inch)
  • Farbtiefe: Menge der gleichzeitig darstellbaren Farben (Einheit: Bit = 2^x Farben)
    • 1 Bit: 2 Farben (s/w)
    • 8 Bit: 256 Farben
    • 16 Bit: 65536 Farben …

Diese Faktoren sind für die Qualität einer Vorlage maßgeblich. Dann kommt es darauf an, für was Sie die Vorlage verwenden möchten:

  • Farbfoto einscannen und drucken: mind. 150 dpi und 24-48 Bit
  • Texterkennung: mind. 300 dpi und 1 Bit (s/w Text)

 

Erstellung einer Textdatei

Wenn Sie ein Dokument einscannen, erhalten Sie zunächst eine Grafikdatei. Mithilfe eines sogenannten OCR (Optical Character Recognition)Programms können Sie diese Grafikdatei nun in eine Textdatei umwandeln und sie so bearbeitbar machen. Dafür können Sie das oft vorinstallierte Programm „Microsoft Office Document Imaging“ nutzen:

  1. Dokument einscannen.
  2. Befehle: „Extras“ –> „Texterkennung mit OCR“ bzw. „Datei“ –> „Texterkennung mittels OCR“  (Office Edition 2003 bzw. XP)
  3. Textelemente markieren und in ein Word-Dokument kopieren

 

Wovon Ihr Endergebnis sonst noch abhängt

  • Qualität des Dokuments: Im Idealfall eine hohe Qualität und hoher Kontrast.
  • Schriftart des Dokuments: Optimal sind Standard Schriftarten wie Times New Roman oder Arial. Abstraktere Schriften sind schwerer zu erkennen.
  • Schriftgröße: Bei einer Schriftgröße >10 ist eine Auflösung von 300dpi ausreichend. Bei kleineren Schriftarten ist eine höhere Auflösung notwendig.
Login
Yop Polls
Wie kommen Sie mit Ihren Kollegen aus?
eFiliale Startseite 160x600