Skenované PDF vyzerá ako dokument, ale pre počítač je to často len obrázok stránky. OCR sa snaží z obrázka rozpoznať text a uložiť ho do upraviteľného DOCX.
Čo zlepšuje výsledok
Najlepšie výsledky majú ostré skeny, rovné strany, dostatočný kontrast a správne vybrané jazyky. Pri slovenčine pomáha zapnúť slovenčinu a podľa dokumentu aj češtinu alebo angličtinu.
Ak je dokument rozmazaný, nízke rozlíšenie alebo obsahuje ozdobné písmo, OCR môže zlyhať alebo vytvoriť chybné znaky.
Kedy použiť OCR a kedy PDF editor
Ak PDF obsahuje textovú vrstvu, často stačí PDF editor. Ak text nejde označiť a strana je len obrázok, najprv použite OCR.
Po OCR je vhodné výsledný DOCX skontrolovať, opraviť diakritiku, čísla, sumy a mená. Pri účtovných údajoch nikdy nespoliehajte iba na automatické rozpoznanie.
Bezpečnosť a súkromie
OCR nástroj má jasne uvádzať, či spracovanie prebieha v prehliadači alebo na serveri, aké sú limity veľkosti a ako dlho zostávajú dočasné súbory.
Pri citlivých dokumentoch je dobré po dokončení zmazať dočasné exporty a uložiť iba finálny pracovný výstup.
Časté otázky
Je ocr pdf do wordu: kedy pomôže a kedy treba ručnú kontrolu právne alebo účtovné poradenstvo?
Nie. OnlineOffice poskytuje pracovné nástroje a podklady. Dôležité výstupy je potrebné skontrolovať podľa konkrétnej situácie.

