Gescanntes pdf dokument editierbaren text umwandeln
Ich habe hier ein PDF-Dokument, welches eingescannte Buchseiten enthält. Acrobat Reader behandelt diese Seiten natürlich als Komplettbilder.
Gibt es eine Möglichkeit, diesen Text über ein OCR-System editierbar zu machen? Wenn ja, mit welchem System?
Und bevor ihr fragt. Ich habe das Buch nicht mehr vorliegen und kann es auch nicht mehr beschaffen.
3 Antworten zur Frage
Videos zum Thema
YouTube Videos
Gescanntes PDF-Dokument in editierbaren Text umwandeln
ich habe da ein paar Hausmittel gefunden, die dir hilfreich sein könnten. Würde mich freuen, wenn du mir ein Feedback gibst, welche Methode du benutzt hast, und welches Ergebnis zufriedenstellend war.
Link:Wie kann ein PDF-Dokument wieder in Text/Word/HTML etc. konvertiert werden?
p.
Versuchs mal hiermit:
ABBYY FineReader 8.0 Professional Edition
ABBYY - Software für OCR, ICR, OMR, Data Capture, Linguistik
Download | ZDNet.de -
Wenn du von Adobe den Acrobat hast, dann kannst du die PDF Dateien direkt bearbeiten, Text und Bilder. Ich meine nicht den Acrobat Reader. Andernfalls soll Omnipage gut sein, aber bedenke dass keines dieser OCR Proggys 100% taugt. Du musst letztendlich immer noch nachkorrigieren.
Ich habe einen anderen Weg gewählt und die Datei erst nochmal ausgedruckt und dann mit Hilfe der OCR meines Scanners neu digitalisiert. Hat ganz ordentliche Ergebnisse geliefert.