Tekstintunnistusohjelmat
- 4379
- 1153
- Marcos Schaden Jr.
Pääsääntöisesti, jos kyse on skannatun tekstin (OCR, symbolien optinen tunnistaminen) tunnistamiseksi, useimmat käyttäjät muistavat ainoan tuotteen - abbyy finereader, joka epäilemättä on johtaja tällaisten ohjelmistojen joukossa Venäjällä ja yksi johtajista maailma.
Siitä huolimatta Finereader ei ole ainoa tällainen ratkaisu: Tekstien tunnistamiseen on ilmaisia ohjelmia, verkkopalveluita samoihin tarkoituksiin, ja lisäksi sellaisia toimintoja on myös joissakin tuntemasi ohjelmissa, jotka ovat jo asennettuna tietokoneellesi. Yritän kirjoittaa kaikesta tästä tässä artikkelissa. Kaikki ohjelmat, joita pidetään työssä Windows 7: ssä, 8: ssa ja XP: ssä.
Tekstintunnistusjohtaja - Abbyy Finereader -ohjelma
Tietoja Finereaderista (lausutaan palonlukijaksi), luultavasti suurin osa teistä on kuullut. Tämä ohjelma on paras tai yksi parhaimmista korkealaatuisesta tekstintunnistuksesta venäjällä. Ohjelma maksetaan ja kotikäyttölisenssin hinta on vähän alle 2000 ruplaa. On myös mahdollista ladata koekäytön versio tai käyttää online -tekstin tunnistamista Abbyy Fine Reader Online -sivustolla (voit tunnistaa useita sivuja ilmaiseksi - maksua vastaan). Kaikki tämä on saatavana kehittäjän virallisella verkkosivustolla http: // www.Abbyinen.rulla.
Finereaderin kokeiluversion asennus ei aiheuttanut ongelmia. PO voidaan integroida Microsoft Office- ja Windows -kapellimestarin kanssa, jotta tunnistuksen käynnistäminen on helpompaa. Vapaan kokeiluversion rajoituksista - 15 käyttöpäivää ja kyky tunnistaa enintään 50 sivua.
Koska minulla ei ole skanneria, käytin kuvaa huonosta laatuisesta puhelinkamerasta varmennusta varten, jossa minulla oli vähän muokattu kontrasti. Laatu ei ole hyvä, katsotaanpa kuka pystyy käsittelemään.
Finereader voi vastaanottaa tekstin graafisen kuvan suoraan skannerilta, graafisista tiedostoista tai kamerasta. Minun tapauksessani se riitti kuvatiedoston avaamiseen. Tulos tyytyväinen - vain pari virhettä. Minun on sanottava heti, että tämä on paras seuraus kaikista todistettuista ohjelmista, kun työskentelet tämän näytteen kanssa - samanlainen tunnustamisen laatu oli vain ilmaisella verkkopalvelulla ilmaisella online -OCR: llä (mutta tässä arvostelussa puhumme vain ohjelmistoista, ei online -tunnustus).
Suoraan sanottuna kyrillisissä teksteissä Finereader, luultavasti ei ole kilpailijoita. Ohjelman edut eivät ole vain tekstintunnistuksen laatu, vaan myös laaja toiminnallisuus, muotoilun tuki, pätevä vienti moniin muodoihin, mukaan lukien Word Docx, PDF ja muut mahdollisuudet. Siten, jos OCR -tehtävät ovat sitä, mitä kohtaat jatkuvasti, älä kadu suhteellisen pientä määrää rahaa ja tämä maksaa kokonaan: Säästät valtavan määrän aikaa, saat nopeasti laadullisen tuloksen Finereaderiin. Muuten, en mainosta mitään - uskon todella, että niiden, joiden on tunnustettava yli tusinan sivun, pitäisi miettiä tällaisen ostamista.
CuneEform - ilmainen tekstintunnistusohjelma
Arviointiini Venäjän toiseksi suosituin OCR -ohjelma on ilmainen Cuneear, joka voidaan ladata viralliselta verkkosivustolta http: // CognitiveForms.RU/Products/CuneEform/.
Ohjelman asennus on myös hyvin yksinkertainen, se ei yritä asentaa mitään kolmannen osapuolen ohjelmistoja (kuten paljon ilmaisia ohjelmistoja). Rajapinta on tiivistä ja ymmärrettävää. Joissakin tapauksissa helpoin tapa käyttää mestaria, jolle valikon ensimmäinen kuvakkeista on tarkoitettu.
Finereaderissa käyttämänä näytteen avulla ohjelma ei pystynyt selviytymään tai tarkemmin sanottu. Toinen yritys tehtiin kuvakaappauksella itse tämän ohjelman sivuston tekstistä, jota oli kuitenkin lisättävä (se tarvitsee skannauksia, joiden resoluutio on 200 dpi ja sitä, hän ei lue kuvakaappauksia, joiden paksuus 1: n paksuus -2 pikselin fonttiviivat). Täällä hän selviytyi hyvin (osaa tekstistä ei tunnustettu, koska vain Venäjän kieli valittiin).
Siksi voidaan olettaa, että CuneEform on mitä sinun pitäisi kokeilla, varsinkin jos sinulla on laadullisesti skannattuja sivuja ja haluat tunnistaa ne ilmaiseksi.
Microsoft Onenote - ohjelma, joka sinulla voi olla
Microsoft Office -koostumuksella, joka alkaa versiosta 2007 ja päättyy nykyiseen 2013, on ohjelma muistiinpanojen pitämiseksi - OneNote. Se sisältää myös tekstintunnistustoiminnot. Aseta sen käyttäminen vain skannattu tai mikä tahansa muu tekstin kuva huomautukseen, napsauta siinä olevaa hiiren oikeaa näppäintä ja käytä kontekstivalikkoa. Huomaa, että oletusarvoisesti englanti on asetettu tunnustamiseksi.
En voi sanoa, että teksti tunnustetaan täydellisesti, mutta niin pitkälle kuin voin arvioida, se on jonkin verran parempi kuin Cuneiform. Ohjelman plus, kuten jo mainittiin. Vaikka sen käyttö on tietysti, jos on välttämätöntä työskennellä suuren määrän skannattujen asiakirjojen kanssa, ei todennäköisesti ole kätevää, pikemminkin se sopii käyntikorttien nopeaan tunnistamiseen.
Omnipage Ultimate, Omnipage 18 - siellä on oltava jotain erittäin hienoa
En tiedä kuinka hyvä ohjelma OmniPage -tekstien tunnistamiseksi: Kokeiluversioita ei ole, en halua ladata jonnekin. Mutta jos sen hinta on perusteltua, ja versiossa maksetaan noin 5000 ruplaa henkilökohtaista käyttöä varten eikä lopullista, tämän pitäisi olla jotain vaikuttavaa. Ohjelmasivu: http: // www.Vivahde.Com/for-yksilöt/sivutuote/omnipage/indeksi.Htm
Jos tutustut ominaisuuksiin ja arvosteluihin, mukaan lukien venäläisten etsivien julkaisujen, se toteaa, että OmniPage todella tarjoaa korkealaatuisen ja tarkan tunnustamisen, mukaan lukien venäläisesti, suhteellisen helposti purkaa korkealaatuisimmat skannaukset ja tarjoaa joukon lisätyökaluja. Puutteista, jotka eivät ole sopivimpia, etenkin aloittelijakäyttäjälle, erotetaan. Tavalla tai toisella, Länsimarkkinoiden kaikkitomilla on suora kilpailija Finereaderille ja englanninkielisissä arvosanoissa, he taistelevat keskenään, ja siksi mielestäni ohjelman tulisi olla arvoinen.
Tämä on kaukana kaikista tämän tyyppisistä ohjelmista, on myös erilaisia vaihtoehtoja pienille ilmaisille ohjelmille, mutta kokeiltuaan niitä löysin niille kaksi pääasiallista haittaa: kyrillinen aakkoset tai erilainen, ei liian hyödyllinen termeillä asennusta, ja siksi päätti olla mainitsematta niitä täällä.