Çfarë është Njohja e Karakteristikës Optike (OCR)?

Njohja e Karakteristikës Optike (OCR) i referohet softuerit që krijon një version dixhital të një dokumenti të shtypur, të shtypur ose të shkruar me dorë që kompjuterët mund të lexojnë pa pasur nevojë të shtypni manualisht ose të futni tekstin. OCR zakonisht përdoret në dokumentet e skanuara në formatin PDF , por gjithashtu mund të krijojë një version të lexueshëm të tekstit brenda një skedari imazhesh.

Çfarë është OCR?

OCR, i njohur edhe si njohje me tekst, është teknologjia softuerike që transformon karaktere të tilla si numra, shkronja dhe pikësimi (të quajtur edhe glyphs) nga dokumentet e shkruara ose të shkruara në një formë elektronike më të lehtë të njohur dhe të lexuar nga kompjuterët dhe programet e tjera softuerike. Disa programe OCR bëjnë këtë si një dokument skanuar ose fotografuar me një aparat fotografik dixhital dhe të tjerët mund ta aplikojnë këtë proces në dokumente që janë skanuar më parë ose fotografuar pa OCR. OCR lejon përdoruesit të kërkojnë brenda dokumenteve PDF, të redaktoni tekstin dhe të riformulojnë dokumentet.

Çfarë përdoret për OCR?

Për kërkim të shpejtë, çdo ditë të skanimit, OCR nuk mund të jetë një punë e madhe. Nëse bëni një sasi të madhe të skanimit, mundësia për të kërkuar brenda PDF-ve për të gjetur atë që ju nevojitet mund të kursejë mjaft kohë dhe e bën funksionalitetin e OCR-së në programin tuaj të skanimit më të rëndësishëm. Këtu janë disa gjëra të tjera që OCR ndihmon me:

Pse përdor OCR?

Pse jo vetëm të marrë një foto, apo jo? Sepse ju nuk do të jeni në gjendje të modifikoni ndonjë gjë ose të kërkoni tekstin sepse do të ishte vetëm një imazh. Skanimi i dokumentit dhe zbatimi i softuerit OCR mund ta kthejnë atë skedar në diçka që mund të modifikoni dhe të jeni në gjendje të kërkoni.

Historia e OCR

Ndërsa përdorimi më i hershëm i njohjes së tekstit daton në 1914, zhvillimi dhe përdorimi i gjerë i teknologjive të lidhura me OCR filloi me zell në vitet 1950, veçanërisht me krijimin e fonteve shumë të thjeshtuar që ishin më të lehta për t'u konvertuar në tekst të lexueshëm në mënyrë digjitale. E para nga këto shkronja të thjeshta është krijuar nga David Shepard dhe zakonisht i njohur si OCR-7B. OCR-7B është ende në përdorim sot në industrinë financiare për fontin standard të përdorur në kartat e kreditit dhe kartat e debitit. Në vitet 1960, shërbimet postare në disa vende filluan të përdorin teknologjinë OCR për të shpejtuar shumë renditjen e postës, përfshirë Shtetet e Bashkuara, Britaninë e Madhe, Kanadanë dhe Gjermaninë. OCR është ende teknologjia kryesore e përdorur për të zgjidhur postën për shërbimet postare në mbarë botën. Në vitin 2000, njohja kryesore e kufijve dhe aftësive të teknologjisë OCR është përdorur për të zhvilluar programet CAPTCHA të përdorura për të ndaluar botët dhe spammers.

Gjatë dekadave, OCR është rritur më i saktë dhe më i sofistikuar për shkak të avancimeve në fusha të lidhura me teknologjinë, si inteligjenca artificiale , të mësuarit në makinë dhe vizionin kompjuterik. Sot, softueri OCR përdor njohjen e modelit, zbulimin e funksioneve dhe nxjerrjen e tekstit për të transformuar dokumentet më shpejt dhe më saktë se kurrë më parë.