Reklama

Ak chcete prevádzať akýkoľvek tlačený text na digitálny text, ktorý môžete kopírovať, vkladať, upravovať a vyhľadávať, musíte použiť skenery Optical Character Recognition (OCR).

Ak sa rozhodnete skenovať alebo nasnímať fotografiu dokumentu, uloží sa vo formáte ako JPEG alebo PDF. Softvér OCR potom môžu rozoznať písmená a čísla v týchto dokumentoch a previesť ich na a prehľadávateľné PDF 4 metódy na vytváranie a úpravu súborov PDF zadarmoZo všetkých bežných typov súborov, ktoré sa nachádzajú v našom počítačovom svete, je PDF pravdepodobne jedným z najviac reštriktívnych a zároveň je k dispozícii pre všetkých (predovšetkým na čítanie) ... Čítaj viac , alebo do súboru, ktorý môžete upravovať v programoch, ako je Microsoft Word.

Problém je v tom, že niektoré OCR skenery fungujú omnoho lepšie ako iné, s tým najlepším, že sú na peňaženke dosť ťažké.

Napríklad Omnipage18 stojí 150 dolárov, ale obzvlášť dobre rozoznáva rôzne jazyky. Adobe Acrobat Pro DC stojí oko-zalievanie 400 dolárov, ale má neuveriteľnú presnosť.

instagram viewer
ABBYY FineReader stojí 150 dolárov, ale je fantastický pri konverzii dokumentov, ako sú časopisy a brožúry, na text, ktorý je možné prehľadávať. Neskôr v tomto článku budeme testovať online ponuku spoločnosti ABBYY.

Ak však hľadáte bezplatné alternatívy, ktoré môžete Stiahnuť ▼ a používať na Windows alebo OS X, mali by ste vyskúšajte tieto nástroje OCR 5 najlepších nástrojov OCR na extrahovanie textu z obrázkovKeď budete mať papieriky, ako získate všetok vytlačený text prevedený na niečo, čo bude digitálny program schopný rozpoznať a indexovať? Udržujte dobrý softvér OCR v blízkosti. Čítaj viac . Ale ak by ste radšej použili bezplatne, on-line Nástroj OCR, čítajte ďalej, pretože sme vyskúšali niekoľko najlepších, s výsledkami uvedenými nižšie.

Test

Zdá sa, že väčšina ľudí teraz používa svoje smartfóny, aby ich preverili Naskenujte a spravujte svoje potvrdenia, ušetrite miesto, papier a časPapierové potvrdenky sa ľahko stratia a je ťažké ich nájsť, keď ich najviac potrebujete. Našťastie prechod na digitálne vyrieši obidva tieto problémy. Čítaj viac , Rozhodol som sa použiť Aplikácia Evernote na skenovanie (Zadarmo pre iOS a Android). Naskenoval som prvú stránku Richarda Dawkina Horolezectvo je nepravdepodobné, aby sme videli, aké výsledky by sme mohli dosiahnuť pri veľmi jednoduchom formátovaní. Tiež som naskenoval stránku Tim Ferriss 4-hodinový šéfkuchár vyskúšať skenery s trochu komplikovanejším formátovaním. Každý z týchto súborov som uložil ako súbor PDF.

Testovanie online OCR

Tieto dokumenty boli potom spracované niektorými z údajne najlepších online nástrojov OCR, aby sa zistilo, ako dobre sa im darilo.

Online OCR zadarmo [už nie je k dispozícii]

Našťastie nie je potrebná žiadna registrácia na používanie OCR online zadarmo. A na mňa bol dvojnásobne veľký dojem, keď som videl ich požiadavku zachovať formátovanie a rozloženie dokumentu.

Online OCR zadarmo

Web tvrdí, že je schopný podporovať vstupy PDF, GIF, BMP, JPEG, TIFF a PNG. Výstupy môžu byť buď DOC, textový dokument PDF, RTF a TXT. Bohužiaľ sa mi nepodarilo zistiť, či majú limit veľkosti súboru.

Základný dokument do formátu PDF
Prevedené úplne dokonale. Nie je už čo povedať! Sme preč a veľmi dobrý začiatok.

Základný dokument k DOC
Zdá sa, že skutočné slová sa bezchybne premenili, okrem „tmy“ z „Mount Rushmore“ nejako AWOL. Formátovanie je však iný príbeh. Veľa čiariek bolo nahradených podčiarkami a do bodov celého dokumentu boli vložené náhodné medzery. Keď však neskôr uvidíte, ako sa prémiovému softvéru darilo v tomto teste, nejde o zlé úsilie vôbec.

Komplexný dokument do formátu PDF
Prevedenie dokumentu trvalo neuveriteľných 120 sekúnd! Po dokončení bol všetok text skonvertovaný s presnosťou približne 95%, hoci text v samostatnom poli v pravom hornom rohu stránky nebol vyhľadateľný. Tiež niekoľko ďalších znakov v PDF bolo nesprávne.

Komplexný dokument pre DOC
Tentokrát konverzia trvala iba 10 sekúnd a text sa znova skonvertoval s presnosťou približne 95%. Vyskytli sa nejaké zvláštne problémy s medzerami a softvér mal problémy s konverziou písma v pravom hornom rohu dokumentu a vynechal niekoľko znakov sem a tam.

verdikt
Ak chcete prevádzať jednoducho formátované dokumenty do formátu PDF, je to fantastický nástroj. Pokiaľ ide o konverziu na DOC, výsledky nemali o čom písať domov.

i2OCR uvádza niekoľko pôsobivých tvrdení. Nástroj rozpoznáva viac ako 60 jazykov, dokáže spracovať rozmiestnenie vo viacerých stĺpcoch (odstránením formátovania), nemá žiadne obmedzenia veľkosti súborov, dokáže prevádzať nahrané súbory a z adries URL. Na používanie tohto nástroja sa nemusíte zaregistrovať.

Služba funguje jednoduchým extrahovaním textu z obrázka a následným výstupom neformátovaného textu. Akékoľvek chyby v zobrazení vedľa seba môžete rýchlo opraviť pred kopírovaním textu do iných programov alebo stiahnutím vo formáte DOC, PDF alebo HTML.

Poznámka: Keď som sa pokúsil nahrať svoje dokumenty PDF, i2OCR ich odmietol, takže som ich musel previesť do formátu JPEG (vytvorením snímky obrazovky a následným odovzdaním súborov).

Základný dokument pre obyčajný textSnímka obrazovky 2016-02-11 o 12.30,28
Vzhľadom na spôsob, akým tento nástroj funguje, je všetko formátovanie stratené, hoci prevod z obrázka na text bol takmer dokonalý. Vyskytli sa niektoré malé chyby, napríklad medzery medzi odsekmi, a niektoré čiarky boli nahradené bodkami, ale jedná sa o malé kúsky.

Zložitý dokument na obyčajný textSnímka obrazovky 2016-02-11 o 12,39,48
Väčšina textu bola prevedená bez príliš veľkého množstva chýb, okrem názvu a receptu v pravom hornom rohu, čo bolo pre tento nástroj nečitateľné. Spôsob, akým boli stĺpce prevedené na obyčajný text, nebol ani zďaleka ideálny. Ak chcete, aby bola táto konverzia funkčná, bolo by potrebné veľa času na preskupenie riadkov do súvislých viet.

verdikt
Pre základné dokumenty funguje i2OCR skvele. Schopnosť editovať text pred stiahnutím je tiež veľmi príjemná. Pre zložitejšie dokumenty je však konverzia stále dosť presná, ale spôsob, akým je text vytlačený, vám život nesmierne uľahčí.

Online OCR v súčasnosti podporuje 46 rôznych jazykov a dokáže prevádzať súbory PDF, JPG, BMP, TIFF a GIF do formátu Word, Excel alebo obyčajný text. Stránka tvrdí, že „konvertované dokumenty vyzerajú presne ako originálne - tabuľky, stĺpce a grafika“.

Verzia, ktorú môžete použiť bez registrácie, vám umožňuje prevádzať až 15 obrázkov za hodinu (limit 5 MB). Ak sa zaregistrujete k účtu, môžete si okrem tohto limitu kúpiť viac stránok a zároveň môžete prevádzať viacstránkové dokumenty a archívy ZIP.

Výsledky online OCR

Základný dokument k DOC
Základný dokument bezchybne konvertoval na rozdiel od rímskej číslice ja nie je vyzdvihnutý. Ako sľúbila stránka, formátovanie bolo presne také, aké boli v knihe. Kudos k tomuto nástroju.

Komplexný dokument pre DOC
Potom, čo ma sklamali predchádzajúce nástroje OCR pri konverzii komplexného dokumentu, bol som online OCR veľmi ohromený. Ako vidíte vyššie, rozloženie bolo takmer dokonalé. Opäť však recept nebol vyzdvihnutý príliš dobre, ale akékoľvek menšie chyby boli zanedbateľné.

verdikt

Absolútne fantastické výsledky z online OCR. Jediná nevýhoda, ktorú vidím, je, že neexistuje spôsob, ako previesť konvertované dokumenty vo formáte PDF, pretože uvedené výstupné formáty zahŕňajú iba DOCX, XLSX a TXT.

Ako už bolo spomenuté, spoločnosť ABBYY je jedným z lídrov na trhu softvéru OCR a stojí asi 150 dolárov za celý svoj program na stiahnutie. Ponúkajú a 10stránková bezplatná skúšobná verzia za ich online nástroj (vyžaduje sa registrácia). V prípade predplatného 5 dolárov vám ich online nástroj umožní každý mesiac previesť 200 stránok.

ABBYY FineReader Online

Akceptované súbory môžu mať veľkosť až 100 Mb v ktoromkoľvek z týchto formátov: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP a PNG. ABBYY tiež rozpoznáva takmer 200 jazykov. Výstupy sú obzvlášť pôsobivé, s výberom medzi DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 a EPUB.

Počas skúšky môžete vyskúšať aj niekoľko funkcií BETA. Prvou je možnosť prekladu dokumentu do iného jazyka. Druhým je exportovanie konvertovaného dokumentu do účtu cloudového úložiska, či už to je Dropbox, Disk Google, Evernote, Microsoft OneDrive alebo Box.

Základný dokument pre DOCX
Celkové výsledky boli dobré, ale nie úžasné, pretože sa jedná o prémiový produkt. Zamenili sa viaceré čiarky a obdobia, niekoľko prevrátených čiariek sa nahradilo hviezdičkou, chýbalo niekoľko veľkých písmen a jedno slovo (literalista) bolo napísané nesprávne.

Komplexný dokument pre DOCX
Po konverzii bolo v dokumente veľmi málo chýb v dokumente (na rozdiel od OCR, ktorý opäť zápasil s fontom tohto receptu!), Ale formátovanie nechalo veľa požadovanej.

Výsledok ABBYY

Tieto tri stĺpce nejako zaberali dve stránky, so stredným stĺpcom iba objaví sa na druhej strane. Ak ste chceli skutočne robiť čokoľvek s týmto konvertovaným dokumentom, nakoniec by ste si vytiahli vlasy.

Základný dokument do formátu PDF
Pri kontrole konvertovaného súboru PDF sa mi nepodarilo nájsť vôbec žiadnu chybu. Možno sme zistili, kde spoločnosť ABBYY vyniká. Fantastické výsledky.

Komplexný dokument do formátu PDF
Opäť sa mi nepodarilo nájsť žiadne chyby v tomto prevedenom súbore. ABBYY samozrejme vie, ako previesť do formátu PDF mimoriadne dobre.

verdikt
Ak ste radi zaplatili pár dolárov, zdá sa, že konverzia do formátu PDF s touto službou a bytím funguje fenomenálne dobre možnosť synchronizácie konvertovaných súborov do cloudového úložiska je obzvlášť užitočná, ak skenujete veľký objem Dokumenty. Podobne ako v prípade iných možností však program ABBYY ešte stále nezistil, ako bezchybne previesť dokumenty na dokument DOC pre ľahkú editáciu.

Konečný výsledok

Ak, rovnako ako väčšina ľudí, práve chcete skenovať niekoľko článkov z časopisov a niektoré účty pre domácnosť, tieto dokumenty nebudete musieť upravovať. Preto bude pre vás vhodný priamy prevod do formátu PDF, pretože v týchto dokumentoch budete stále môcť prehľadávať. Z tohto dôvodu bol bezplatný online OCR určite najlepším bezplatným nástrojom, ktorý sme testovali. Avšak, ak ste ochotní zaplatiť 5 dolárov mesačne za takmer dokonalosť, FineReader online od spoločnosti ABBYY bol o niečo presnejší.

Pokiaľ ide o konverziu dokumentov na DOC, nepodarilo sa nám nájsť žiadne dokonalé riešenie, ale zďaleka najlepšie výsledky pochádzajú z Online OCR. Konverzia nebola dokonalá, ale integrita formátovania bola zväčša nedotknutá a chyby boli zanedbateľné. Ak porovnáme tieto výsledky s „prémiovou“ ponukou od spoločnosti ABBYY, nemôžete pomôcť, ale môžete byť ohromení.

Nezahrali sme Schopnosti OCR služby Disk Google v tomto príspevku; trochu pre všadeprítomnosť spoločnosti Google, ale viac pre to, že sme tam chceli otestovať niekoľko ďalších bezplatných služieb OCR online.

Záleží na vás: Aké ďalšie nástroje OCR online by ste odporučili našim čitateľom? A ktoré ste vyskúšali, že ste už nikdy viac nepoužívali?

Rob Nightingale má titul z filozofie na University of York vo Veľkej Británii. Viac ako päť rokov pôsobil ako manažér sociálnych médií a konzultant a zúčastňoval sa workshopov v niekoľkých krajinách. Za posledné dva roky bol Rob tiež autorom technológií a je MakeUseOf sociálnym mediálnym manažérom a editorom bulletinov. Zvyčajne ho nájdete pri cestovaní...