Aplikace OCR: rozpoznávání textu, seznamy, vývojáři, váha programu, spustitelné funkce, funkce, funkce a zpětná vazba uživatelů.

Papír jako hlavní nositel informací postupně ztrácí svůj význam. Namísto papírových dokumentů použijte elektronickou verzi, pokud je to možné. Ale jak přeložit elektronické archivy do stávajících archivů? K vyřešení tohoto problému byly vytvořeny speciální programy pro rozpoznání textu.

Co jsou programy OCR a jak fungují

Tyto softwarové produkty využívající technologie ORC (rozpoznávání optických znaků) nebo technologie ICR (rozpoznávání znaků). V ruštině jsou tyto zkratky přeloženy jako "optické" nebo "inteligentní rozpoznávání znaků". Programy, které používají OCR, fungují takto. Fotografie s textem přijatým ze skeneru je rozdělena do mnoha fragmentů. Pro každý z nich program vytváří několik předpokladů. Kontrolami a jejich srovnáním s normami poskytuje každý fragment odhad odpovídající míře shody. Při výběru největšího z nich program "vidí" symbol a zobrazí ho v poli zabudovaného textového editoru.


IRC pracuje stejným způsobem, ale umělé neuronové sítě se používají ke zpracování znaků. Hlavní výhodou této metody je kompaktnost programů a neustálé učení. To vám umožní efektivně rozpoznat slova napsaná člověkem velkými písmeny. Tato technologie však není schopna "číst" pevný ručně psaný text. Pro každý z existujících operačních systémů, jejich vlastníOCR aplikací. Nejoblíbenější pro Windows je:
  • ABBYY FineReader;
  • OmniPage;
  • Readiris;
  • program Samsung Scan OCR;
  • Kromě softwaru pro počítače existuje mnoho služeb pro rozpoznávání textů online. Mezi nejznámější patří FineReader Online, OnlineOCR, FreeOCR.


    ABBYY FineReader 14

    Tento softwarový produkt byl vyvinut domácí společností ABBYY, je jedním z nejlepších aplikací, které používají OCR. Základem programu je původní motor nazvaný Finereader Engine. Poskytuje následující funkce:
  • Rychlé rozpoznávání tištěného textu s přesností větší než 98%. Netrpělivost na kvalitu původního obrazu. To vám umožní identicky rozpoznat text fotografií pořízených skenerem nebo fotoaparátem.
  • Technologie ADRT umožňuje rozpoznat nejen text, ale i jeho formátování: písmo, odrážky, odstavce, sloupce.
  • Možnost vícevláknového zpracování obrazu. To vám umožní používat všechna jádra procesoru (max. 4) pro urychlení procesu rozpoznávání.
  • Podporuje více než 190 jazyků, včetně těch, které používají abecedu jinou než latinu nebo cyrilika (japonština, čínština, arabština).
  • Vestavěný textový editor umožňuje zkontrolovat výsledek rozpoznávání nebo upravit.
  • Interakce se sadou Office. Umožňuje exportovat rozpoznaný text v aplikaci Microsoft Word a Exel pro další zpracování.
  • Schopnost studovat program. Tato funkce umožňuje naučit program "číst" určité písmeno. Například neštandardní písmo nebo dopisy psané rukama.
  • Práce s PDF. FineReader dokáže rozpoznat text, který typ souboru a „šít“ několik naskenovaných obrázků do formátu PDF nebo PDF /A.
  • Hlavní nevýhodou tohoto programu je cena. Nekonečná licence pro základní verzi bude stát 7 tisíc rublů. Verze "Business" a "Enterprise" - v 12 a 39 tisíc rublů, resp. Chcete-li použít program nejen doma, můžete si stáhnout z torrent tracker rozbité 11. a 12. verzi produktu.
    Požadavky:
  • Procesor 32 - nebo 64-bit, s 1 GHz a podporuje instrukční sadu SSE 2. (Intel Celeron M a lépe, AMD Athlon 64 a vyšší).
  • RAM: 1 GB. V případě, že procesor má více než jedno jádro, potřeba každých dalších 512 MB.
  • Video: všechna, která podporuje rozlišení 1024 x 800.
  • , na pevném disku: 3 GB pro instalaci a provoz.
  • Skener: podporuje ovladače TWAIN a WIA.
  • OS: Windows 788110.
  • Stanovisko o FineReader 14

    Mluví o FineReader pozitivní, zdůrazňují výhody schopnost výrobku rozpoznat text z špatných papírových předloh, pohodlné a jednoduché rozhraní a vysoká rychlost zpracování obrazu. Mezi problémy, které vznikají při použití OCR-program, někteří říkají, že nesprávně nick manažer pracující obraz. Například: Nedostatečná práce na úpravě jasu naskenovaného obrazu.

    OmniPage 18

    Hlavním konkurentem společnosti FineReader na ruském trhu programů ORC. Funkčností je velmi podobná protivníkovi, ale má několik rozdílů:
  • Schopnost spuštěnísnímání a rozpoznávání pomocí skeneru.
  • Podpora 4 jádry. To snižuje čas detekce a převést více obrázků najednou.
  • Vytvoření digitální knihovny pro bukrydera (Kindle e-knihy.
  • Automatická detekce určitých jazycích.
  • Mezi nedostatky programu může být poznamenáno, nízkou rychlost, srovnatelnou s 10. verzi FineReader, a náklady na kopírování licence - $ 150.
    Požadavky:
  • Procesor: x32 nebo x64-bit s 1 GHz, Intel Pentium lepší, AMD Athlon a lepší.
  • Paměť: 512 MB.
  • Video: všechna, která podporuje rozlišení 1024 x 800 a barevná hloubka 16 bitů.
  • ​​
  • Pevný disk: 11 GB pro instalaci všech komponent a 100 MB pro práci.
  • : skeneru ovladače podporuje dva, WIA a ISIS.
  • OS: Windows XP SP2 SP3Vista x32 /x6478.
  • Stanovisko o OmniPage

    říkají o svém znechucení, protože problém je ve všech částech programu, a to od krásné, ale nesrozumitelné rozhraní a končí se špatnou informaci o pozadí. Tento produkt není přizpůsoben pro práci ve WinXP. To může dělat práci, ale budou muset strávit nějaký čas. OmniPage má problémy s uznáním. Například, to je snadné rozpoznat jednoduchý černý text na list papíru s čísly, stoly obdržel od skeneru. Při použití snímků z fotoaparátu nebo přesnost rozpoznávání mobilního telefonu klesne o 70%, což je velmi nepohodlné při zpracování velkých dokumentů.

    , 18-Iverze se nemusí spustit z důvodu chyb v kódu. Chcete-li tento problém vyřešit, nainstalujte opravu 1801.

    Přečíst Iris Pro 17

    Celý článek Iris - je OCR-program za méně peněz (8000 až 12000) lze přirovnat k funkčnosti a výkonu FineReader. Professional verze má následující funkce:
  • Kompletní práce s PDF: uznání souborů do databáze, komprese řeči a textu.
  • Podpora 140 jazyků.
  • Rozpoznání papírových tabulek a textů s možností exportu do Exel a Word.
  • Získání snímků z libovolného modelu skeneru.
  • K dispozici je také firemní verze, která umožňuje chránit soubory PDF pomocí vodoznaků a zpracovávat dokumenty o délce větší než 50 stran. Požadavky na systém:
  • Procesor: x86 nebo x64 s 1 GHz nebo vyšší.
  • RAM: 1 GB.
  • Video: všechna, která podporuje rozlišení 1024 x 800.
  • na pevném disku: 400 MB pro instalaci.
  • Skener: podporuje ovladače TWAIN, WIA.
  • Operační systém: Windows 7810 x32 /x64.
  • Stanovisko o READIRIS

    Mluví o tomto programu rozpoznávání OCR-textového jako dobrý a rychlý PDF konvertor Word s řadou problémů:
  • Pokročilé rozhraní, ve kterém nováček není snadné pochopit.
  • Při změně oblasti skenování automaticky skenujete dokument.
  • Špatná technická podpora.
  • Někdy program není aktivován kvůli chybám v kódu programu.
  • Program Samsung Scan OCR - Co je to program?

    Jedná se o bezplatný software, který je dodáván s multifunkčním zařízenímZařízení "3 v 1" (tiskárna, skener, kopírka) společnosti Samsung. Byl vyvinut ve spolupráci se společností Iris, vytvořenou ReadIris Pro, optimalizovanou pro práci s multifunkčním zařízením výrobce. Z původního zařízení "Reader" má skener Samsung ORC rozhraní, funkčnost a velikost oříznutí - na pevném disku trvá 40 MB.

    Online služby

    Jsou alternativou aplikací stacionárního rozpoznávání textu náročných na zdroje. Například OCR je FineReader. Vlastnosti systémů podobných projektů umožňují rozpoznat text z obrázků mnohem rychleji než na samostatném počítači. Mezi službami, které se zabývají přijímáním textu z fotografií, můžete rozlišovat tři z nejvhodnějších: FineReaderOnline, FreeOCR, OnlineOCR.
    Prvním je přímý vývoj stacionární verze výrobku. Po registraci dostane nový uživatel 10 stránek pro zpracování a 5 každý měsíc. Toto omezení můžete zrušit zakoupením ročního předplatného pro 3200550017800 rublů pro 20005000 a 10 000 stran. Pokud má uživatel licenci pro FineReader 14, musí se zaregistrovat a aktivovat pro použití v online verzi. V takovém případě obdrží počet stránek odpovídajících typu zakoupené licence: Standard (2000), Business (5000) nebo Enterprise (10 000).
    Služba onlineOCR.com vám umožňuje převést 15 obrázků za hodinu (omezení pro neregistrované uživatele) do textu a uložit je jako soubory .docx, .xlsx nebo .txt. Po registraci bude k dispozici:
  • Uložení .pdf .doc, .xlx, .rtf.
  • Převést vícestranové soubory PDF.
  • Počet stránekzvýší na 50.
  • V případě, že stránka není dost, mohou koupit několik kusů 50-50000.
    Návrh FreeOCR.com odlišné od jejich předchozích plných volně a bez omezení počtu stran zpracovaných. site OCR-engine, který podporuje ruské, ukrajinské, turecké, vietnamské, a všechny evropské jazyky - celkem 29. Jedinou nevýhodou tohoto portálu je pracovat pouze s grafikou, které jsou zaváděny postupně, protože zpracování fronty se nepředpokládá tvůrcům. Zobrazuje rozpoznávané informace bez formátování ve formátu TXT.

    Stanovisko o online-OCR služby

    Tyto stránky jsou potřebné v případech, kdy stahování a instalaci úplné ORC-program proveditelný. Chcete-li například abstraktně vložit několik citátů z knihy nebo časopisu. Mezi nevýhody známých izolovaných lokalit zdarma (FineReader) a slabé funkčnost (FreeOCR, OnlineOCR). Shrneme-li, můžeme říci, že uznání programu OCR-text obrázek nebo PDF soubory vytvořené mnoho, a v tomto článku jsou jen nejznámější. Programy OCR pro skenery tedy budou moci každý uživatel zvolit podle požadavků a rozpočtu. Nebo použijte jednu z mnoha bezplatných OCR služeb.

    Související publikace