OCR-scannen.

Uit de AppleStore "PDFScanner" geplukt, met als doel documenten te digitaliseren met tekstherkenning zodat hierop kan worden gezocht. Op zich werkt dit prima mits de documenten goed gecontrasteerd zijn (witte achtergrond-zwarte letter). Bij bijvoorbeeld krantenknipsels werkt OCR dan ook niet. Bij "PDRScanner" geïnformeerd of aanpassing van het gegenereerde tekstbestand mogelijk is, maar dit bestand is zogenaamd hidden in de pdf opgeslagen en dus niet benaderbaar. Een door mijzelf verzonnen oplossing, een extra papiertje met getypte trefwoorden mee scannen, werkt wel maar is enorm bewerkelijk (typen en printen) omdat het in mijn geval om heel veel krantenartikelen gaat. Mijn vraag: is er bij iemand een "truc" bekend om voor OCR onleesbare tekst leesbaar te maken (eventueel alleen zelf toegevoegde trefwoorden) of wellicht heb ik de verkeerde software gekozen, alhoewel ik met "VueScan" dezelfde problemen heb. Voor de volledigheid: ik gebruik de CanoScan 9000F. Oja, met "Voorvertoning" kan digitaal tekst aan de pdf worden toegevoegd en "PDFScanner" voorziet in de mogelijkheid om achteraf aan het pdf-bestand OCR toe te voegen, maar de toegevoegde tekst wordt ook niet herkend, helaas!! (sterker nog, ná deze actie is de toegevoegde tekst uit het pdf-bestand verdwenen). Alvast bedankt voor reacties!

Reacties

Log In of Registreer om te reageren.