Prepoznajte skenirano besedilo v Wordu. Kako pretvoriti skenirani dokument v format Microsoft Word

domov / Prosti čas

Če ste izbrali hiter način pisanja teoretičnega poglavja, o katerem smo govorili v odstavku 2.1., brez skeniranja dokumentov najverjetneje ne boste mogli. V nasprotnem primeru lahko to točko preskočite in si začnete zapisovati gradivo, ki ga najdete v knjižnici.

Preden začnete skenirati, se morate odločiti, kaj točno želite uporabiti pri pisanju svojega dela. Če želite to narediti, morate najprej pregledati razpoložljivo literaturo in s svinčnikom označiti potrebne točke.

Ko sem prvič skeniral članek iz revije za svojo prvo nalogo, se mi je zdela naloga neverjetno težka. Kot rezultat večurnega dela s skenerjem in FineReaderjem je bil rezultat nesmisel, ki je ni bilo mogoče urejati. Na koncu sem moral vse tipkati ročno. Da se vam to ne bi zgodilo, si podrobneje oglejmo vse tehnične vidike skeniranja.

Za skeniranje bomo seveda potrebovali skener. Ni ti ga treba kupiti. Lahko si na primer nekaj časa sposodite od prijatelja. Uporabljam skener CanoScan Lide 60 Čeprav to ni najnovejši model, mi je ta kompaktna, hitra in enostavna “naprava” zelo všeč. Če si izposodite skener, morate za njegovo delovanje najprej namestiti gonilnik. Gonilnike in navodila za namestitev lahko vedno najdete na namestitveni disk, ki je priložen napravi ali pa ga lahko prenesete s spletne strani proizvajalca. Po namestitvi gonilnika povežite optični bralnik z računalnikom s povezovalnim kablom. Zdaj lahko začnete neposredno skenirati.

Toda najprej malo teorije. Vedeti morate, da je postopek skeniranja sestavljen iz dveh stopenj:

1. Neposredno skeniranje dokumenta. Na tej stopnji skener posname fotografijo površine skeniranega dokumenta in shrani sliko v računalnik kot običajno datoteko .jpg .gif ali v drugem formatu;

2. Prepoznavanje dokumentov. To je postopek pretvorbe besedila iz slike, posnete s skenerjem, v običajni test, ki ga lahko nato shranite v Word in uredite. Prepoznavanje poteka brez sodelovanja optičnega bralnika z uporabo posebnega programa (najbolj priljubljen je Adobe FineReader). Na ta način lahko najprej skenirate več listov besedila in jih shranite kot sliko, preden jih pretvorite v besedilo.

Torej, začnimo prva faza - skeniranje:

– zaženite gonilnik optičnega bralnika: Start - Vsi programi - Canon - ScanGear(Navajam ime gonilnika za svoj skener). Prikaže se okno gonilnika:

– odprite pokrov optičnega bralnika in postavite knjigo, revijo ali njen izvod z besedilom obrnjenim navzdol, čim bolj enakomerno glede na robove delovne površine optičnega bralnika:

Pri tem je zelo pomembno zagotoviti, da pokrov optičnega bralnika čim tesneje pritisne na skenirani dokument in tako prepreči, da bi zunanja svetloba dosegla delovno površino optičnega bralnika, ki je v stiku z dokumentom;

– opravite potrebne nastavitve v gonilniku optičnega bralnika. Prvi korak je nastavitev ločljivosti, pri kateri bo dokument skeniran. Ločljivost je indikator, ki določa stopnjo podrobnosti predmeta pri skeniranju in je določena v pikah na palec (dpi ali dpi). Višja kot je ločljivost, boljša je kakovost slike. Toda pri skeniranju besedilnih dokumentov nima smisla nastavljati največje ločljivosti, saj bo to neuporabno. Poleg tega skeniranje pri višjih ločljivostih traja dlje. Priporočam nastavitev ločljivosti med 400-500 dpi. S to nastavitvijo so slike dovolj kakovostne za dobro razpoznavnost, sam postopek skeniranja pa ne traja veliko časa. Predlagam, da si ogledate posnetek zaslona nastavitev mojega tiskalnika:

Najprej morate iti na "Napredni način". Vir bo vedno "tablica"(ploski skener). Bolje je nastaviti barvni način "Črno in belo", ker za optično branje besedila ne potrebujemo barv, kar bo zmanjšalo velikost izhodnih slik. Resolucija, kot sem rekel, bi morala biti določena 400 dpi. Velikost izhodne slike – zahtevana “A4”. Zdaj lahko varno pritisnete gumb "Skeniraj". Moj skener je zasnovan tako, da najprej shrani skenirane slike notranji pomnilnik, in šele ob zapiranju okna gonilnika ponudi njihovo shranjevanje v računalnik. Vse kar moram storiti je, da navedem lokacijo, kamor bodo shranjeni rezultati dela.

Na koncu bi morali imeti datoteke te vrste:

Ko takšno sliko povečate, mora biti besedilo jasno vidno.

Druga faza – priznanje prejete slike in jih pretvorite v besedilo. Kot sem že rekel, bo to zahtevalo poseben program - FineReader. Prenesite program s te povezave (32MB). Arhivsko geslo – spletna stran. Različica, ki jo predlagam, ne zahteva namestitve (prenosna). V programski mapi bo veliko različnih datotek, vendar potrebujete samo eno - FineReader.exe. Dvojni klik na to datoteko bo zagnal program v vašem računalniku.

Ta različica programa je precej stara. Z njim sem naredil vse spodnje posnetke zaslona. Če ta različica FineReader ti ne gre - izberi novejšega.

Okno FineReader ima naslednjo obliko:

Ko nastavite jezik, v katerem so bili natisnjeni dokumenti, ki ste jih predhodno skenirali, lahko začnete s prepoznavanjem. Če besedilo vsebuje dva jezika hkrati (na primer rusko in angleško), ustrezno namestite.

Če želite začeti prepoznavanje, kliknite na puščico desno od prvega gumba Skeniraj- in potem - Odpri sliko:

Odpre se okno za izbiro slike. Odprite mapo, v katero ste shranili optično prebrane slike, kliknite CTRL+A(angleščina) na tipkovnici in pritisnite gumb Odprto.

Po tem na levi v oknu FineReader Prikazale se bodo sličice dodanih datotek, v sredini - vklopljeno ta trenutek izbrana skica je povečana, spodaj je še večja povečava, desno pa rezultat prepoznave:

Na primer, posnel sem samo dve sliki. Prvi od njih je označen na zgornjem posnetku zaslona; Kot lahko vidite, je bila slika skenirana navpično; da bi prepoznali besedilo, je treba sliko najprej obrniti za 90 stopinj. Če želite to narediti, uporabite gumba in . Naslednji korak je, da programu poveste, kateri del slike mora prepoznati, in tudi nastavite vrsto podatkov, ki naj bodo izpisani: besedilo, tabela ali slika. Za to obstajajo gumbi: . Na primer, če morate označiti besedilni blok, z levo tipko miške kliknite , nato z levo miškino tipko kliknite v zgornji levi kot besedilnega bloka in ga, držite levi gumb, povlecite v spodnji desni kot. Na primer, v celoti sem pripravil eno sliko za prepoznavanje:

Kot lahko vidite, so vsi besedilni bloki v zgornjem primeru označeni z zeleno, slike pa rdeče. Na enak način so pripravljene tudi tabele za razpoznavanje. Temu je namenjen gumb. Za pomik na naslednjo fotografijo z levim klikom na njeno sličico na levi. Na ta način so vse slike, pridobljene s skeniranjem, pripravljene za razpoznavo. Ko je priprava slik končana, jih morate vse izbrati. Če želite to narediti, z levo tipko miške kliknite prazen prostor na plošči s sličicami (imenuje se Plastična vrečka) in pritisnite Ctrl+A(angleščina) na tipkovnici. Nato kliknite na gumb in počakajte, da FineReader pretvori slike v besedilo. Po tem lahko nastalo besedilo shranite v Word z gumbom, po kliku na katerega se odpre okno. V njem morate izbrati obliko shranjevanja - Microsoft Word in potrdite polje, da shranite vse strani:

Po pritisku na gumb v redu bo program ustvaril Wordov dokument in vanjo vstavi besedilo s prepoznanih strani v vrstnem redu, v katerem se nahajajo na plošči s sličicami (Paket). Nastali dokument takoj shranite v mapo v datotečni strukturi vaše diplomske naloge in že lahko začnete urejati. Kako se to naredi, je opisano v mojem brezplačen tečaj.

In še zadnja točka. Če ste skenirali časopis ali revijo, je tam besedilo pogosto podano v obliki stolpcev (kot v zgornjem primeru). Te stolpce v Wordu je treba pretvoriti v enega. Izberite besedilo v stolpcih in zaženite ukaz: Oblika – Stolpci – Ena – OK. Šele po tem lahko nastavite pokončno usmerjenost v nastavitvah strani, oblazinjenje robov, pisavo itd.

Kako skenirati dokument in ga prepoznati v MS Wordu

ABBYY FineReader Online Na spletu prepoznamo skenirane dokumente in digitalne fotografije.

Zdaj je vse plačano:

10 strani 3,00 $
30 strani 8,00 $
100 strani 20,00 $
300 strani 50,00 $
1000 strani 70,00 $

ABBYY FineReader - najboljši program v tej domeni. Zdaj obstaja njegova spletna različica. To bo priročno za tiste, ki ga ne potrebujejo zelo pogosto. V računalnik vam ni treba naložiti dodatnega programa (vsak zasede vire, nato pa se sistem začne upočasnjevati).

prepoznavanje večjezičnih dokumentov (do 3 jezike hkrati): angleški, ruski, francoski, nemški, španski, ukrajinski ... (skupaj 37 jezikov);
Datoteke lahko prepoznate v katerem koli od naslednjih formatov:
1. *.jpg (*.jpeg)
2. *.tif (*.tiff)
3. *.pcx
4. *.dcx
5. *.bmp
6. *.png
7. *.djvu, *.djv
8. *.pdf
pretvorbo v formate
1. Besedilni dokument (*.txt)
2. Dokument RTF (*.rtf)
3. Dokument PDF (*.pdf)
4. Dokument PDF/A (*.pdf)
Ko je dokument uspešno prepoznan in shranjen v obliki po vaši izbiri, ga lahko prenesete iz zgodovine opravil. Tukaj si lahko ogledate status svojega dela:
1. V obdelavi – počakati morate, da strežnik prepozna vašo sliko;
2. Prepoznano – obdelava dokumenta je končana in lahko prenesete rezultat prepoznave;
3. Napaka pri prepoznavanju – dokument ni bil prepoznan;
4. Nizka kakovost prepoznavanja. Naloga je bila opravljena brezplačno - dokument je bil prepoznan z velikim številom napak.
5. prepoznani dokumenti so shranjeni na strežniku 72 ur in so na voljo za prenos iz zgodovine naročil v vašem profilu,
6. Če vam bolj ustreza, če prejmete povezavo za prenos po e-pošti, preprosto potrdite polje »Pošlji povezavo do rezultata prepoznavanja po e-pošti« in počakajte na pismo, da je bil vaš dokument prepoznan.

https:// drive.google.com

Prepoznavanje besedila je na voljo v Google Dokumentih.
Podprti so 29 jezikov, vključno z ruskimi formati .GIF, .PNG in .PDF 10 Mb. PDF datoteka ne več kot 10 strani.

Pojdite v Google Dokumente ali v Google Mail.
Z miško povlecite sliko ali datoteko PDF v okno brskalnika (v Google Chrome vsekakor deluje).
Na dnu se prikaže okno, na vrhu pa je majhen meni.
Označite polja poleg 2 spodnjih elementov (kot je prikazano na sliki):
- V - Pretvorite besedilo iz datotek PDF in slik
- V - Potrdite nastavitve pred vsakim zagonom
Zaprite okno in znova naložite sliko.
Zdaj pri nalaganju ponuja prepoznavanje besedila, morate samo določiti jezik.
Nato je bila slika shranjena kot slika, če pa jo odprete z urejevalnikom besedil, bo pod sliko prepoznano besedilo.

https:// img2txt.com

img2txt Storitev prepoznavanja slik.
Storitev je v ruščini, popolnoma brezplačna.
Na spletu se zelo hitro prepozna. Res je, da so me postavili v vrsto, vendar sem bil prvi v vrsti, kjer sem preveril napake. Majhen delček besedila odlične kakovosti (posnel sem posnetek zaslona z njihove spletne strani, kakšna boljša kakovost?) je povzročil 2 napaki v vsaki besedi. Storitev bo izboljšana. Lahko pričakujete dober rezultat. V Ukrajini so bili vedno dobri programerji.

https://www. onlineocr.net

Spletni OCR Storitev za prepoznavanje besedila.

Izvorni formati

JPG/JPEG
TIF/TIFF
TIFF več strani,
Večstranski PDF.

V dokumentu z več stranmi lahko strani prepoznate selektivno.

Pretvori v formate

Dokument PDF (*.pdf)
Dokument Microsoft Word (*.doc)
Dokument Microsoft Excel (*.xls)
Dokument HTML (*.html)
Dokument RTF (*.rtf)
Besedilni dokument (*.txt) Ustvarjena datoteka bo popolnoma ponovila strukturo izvornega dokumenta (tabele, stolpci, pisave itd.)
Rezultat
Datoteke z rezultati prepoznavanja v vaši spletni virtualni pisarni jih prenesite na HDD, uredite, pošljite po pošti in natisnite.
Omejitev
1. Velikost datoteke ne sme presegati 20 Mb.
2. Da bi dobili visokokakovosten rezultat prepoznavanja, ločljivost slike ne sme biti manjša od 200 DPI.

Navodila

Če želite skenirani dokument prevesti v Word, morate prepoznati besedilo na njem. Če želite to narediti, uporabite program, kot je ABBYY FineReader, namenjen reševanju takšnih težav. Poleg tega lahko z uporabo vmesnika tega programa tudi skenirate dokumente. Kot analog programa FineReader lahko uporabite programe, kot so CuneiForm, Readiris Pro, Free OCR, SimpleOCR itd.

Enkrat z desno miškino tipko kliknite shranjeno sliko, izberite »Odpri z ...« in na seznamu programov, ki se prikaže, izberite Fine Reader, ki ste ga pred kratkim namestili. Po potrebi izberite potrditveno polje »Uporabi za vse podatke za datoteke te vrste«. Sliko lahko tudi preprosto skenirate z uporabo odprt program z izbiro “Skeniraj in preberi” in slika iz naprave se uvozi neposredno v delovno področje. Če želite to narediti, najprej v nastavitvah določite parametre za delovanje optičnega bralnika v programskem načinu Fine Reader.

V oknu programa, ki se odpre, izberite »Prepoznaj besedilo«. Počakajte, da program prebere dokument. Če rezultati operacije ne ustrezajo vašim zahtevam, spremenite nastavitve skeniranja in prepoznavanja ter ponovite postopek.

Nastali dokument shranite v kateri koli obliki, ki jo podpira Microsoft Office Word. Zaprite program Fine Reader, pojdite v mapo, kjer je bil shranjen vaš dokument.

Odprite datoteko s programom MS Office Word ali katerim koli drugim urejevalnikom besedil, v katerem vam je udobno delo. Naredite potrebne spremembe v datoteki in shranite rezultate.

Opomba

Posebno pozornost posvetite nastavitvam skeniranja, najbolje je, da vnaprej nastavite potrebne parametre.

Koristen nasvet

Program prenesite samo z uradne spletne strani Abbyy.

Optični bralniki in večfunkcijske naprave (MFP) so globoko zasidrane v življenju uporabnikov računalnikov. Za uspešno delo Pri uporabi teh naprav je treba upoštevati določena pravila.

Boste potrebovali

- skener;
- Adobe Reader.

Navodila

Prepričajte se, da je optični bralnik povezan in da so nameščeni vsi potrebni gonilniki za to napravo. Odprite pokrov optičnega bralnika ali večnamenske naprave in ga postavite zahtevani dokument tako da je stran, ki jo skenirate, obrnjena navzdol. Kliknite gumb, ki začne postopek skeniranja, in počakajte, da se operacija zaključi.

Nekatere večnamenske naprave omogočajo nadzor uporabe opreme posebni programi. Zaženite ta pripomoček in kliknite gumb "Skeniraj". Ko je ta postopek končan, se samodejno odpre mapa, v katero je bil shranjen skenirani dokument.

Nekatera programska oprema ne shrani skeniranih podatkov samodejno. Običajno se v takih primerih odpre program, namenjen branju dokumentov. Če se soočate s to vrsto MFP, potem ko odprete skenirani dokument, pritisnite kombinacijo tipk Ctrl in S, izberite mapo, v katero želite shraniti sliko, in vnesite ime datoteke.

Izbira programsko opremo v celoti leži na vaših ramenih. Običajno se za delo z njim uporabljajo programi DjvuReaser ali Adobe Reader. Ko nastavljate možnosti skeniranja, se prepričajte, da ste izbrali obliko, ki je prava za vas.

Uredite dokument takoj po končanem postopku skeniranja. Izrežite le tisti del, ki je potreben. S posebnimi programi popravite sliko. Odstranite črne črte, če se pojavijo po skeniranju. Priskrbeti Visoka kvaliteta optično prebranih dokumentih izberite ustrezne nastavitve za MFP. Bolje je uporabiti 8-bitno barvo slike, število pik na palec pa vsaj 150.

Koristen nasvet

Pri skeniranju fotografij je bolje uporabiti nastavitve, ki zagotavljajo najboljšo kakovost končne slike.

Viri:

kako skenirati dokument na računalniku

Optični bralnik je zasnovan za ustvarjanje digitalnih kopij slik. Skeniran dokument lahko shranite kot risbo ali jo pretvorite besedilo format. Vse je odvisno od tega, kakšen končni rezultat želi uporabnik dobiti in katere aplikacije uporablja za delo.

Navodila

Optični bralnik privzeto shrani zajete slike kot datoteke .jpg, .bmp ali .tiff – to je grafični format. S tovrstnimi datotekami lahko delate v grafičnih urejevalnikih: spremenite ločljivost, kontrast, svetlost dokumenta ali uporabite druge vizualni učinki. Format .pdf za različne platforme ponuja nekoliko drugačne možnosti za obdelavo slik, a še vedno morate za delo s skeniranim dokumentom v besedilnem formatu uporabiti bodisi ločeno funkcijo skener, oz posebna aplikacija za prepoznavanje besedila.

Raziščite možnosti svojega skener. Za številne modele razvijalci ponujajo pripomoček za pretvorbo skenirane slike v besedilo; priložen je napravi in se nahaja na namestitvenem disku. Na jedilniku skener Ta možnost se imenuje »prepoznavanje besedila« ali OCR (optično prepoznavanje znakov). Če ta možnost ni na voljo, namestite aplikacijo tretje osebe, kot je Fine Rider.

Izberite v meniju skener ali programirajte ustrezen gumb in počakajte, da se skeniranje zaključi. Po tem se lahko informacije iz dokumenta samodejno prevedejo v besedilo formatirajte in odprite ali pa boste morali izvesti več dodatnih korakov.

Če je bilo besedilo izvoženo v datoteko .txt, shranite dokument kot običajno ali kopirajte vsebino in jo prilepite v dokument druge oblike, na primer .doc (.docx). Če še vedno vidite besedilo kot sliko, izberite korak »Prepoznaj« in počakajte, da se postopek zaključi. Po tem izberite ukaz »Izvozi« ali kopirajte prepoznano besedilo in ga prilepite v dokument v obliki, ki vam ustreza.

Kakovost »prevoda« besedila iz skener v veliki meri odvisna od izbranih nastavitev ločljivosti. Višja kot je ločljivost, natančnejšo kopijo bo naredil skener. Ko boste sliko pretvorili v besedilo, so najboljše nastavitve srednje ločljivosti. Če je ločljivost prenizka, kopija ne bo zelo jasna in zato bo besedilo težje prepoznati. Če je ločljivost previsoka, bo odvečni šum otežil tudi pretvorbo grafike v besedilo.

Viri:

kako prevesti besedilo iz

Microsoft Word svojim uporabnikom ponuja zelo priročno možnost, ki omogoča prevajanje vnesenega besedila. besedilo. Ni vam več treba brskati po slovarjih in iskati prevodov besed ali uporabljati prevajalskih programov. Vse kar morate storiti je, da zaženete Word.

Boste potrebovali

- računalnik;
- Internet.

Navodila

Zaženite Microsoft Word v računalniku. Različica tega programa mora biti vsaj 2003.

Vnesite besedilo, ki zahteva prevod, in ga preverite za črkovalne napake. Vsaka netočnost lahko oteži besedilo za program ali popači njegov pomen. Izberite besedilo, ki ste ga vnesli, in v glavnem meniju kliknite zavihek »Pregled«. V meniju, ki se odpre, izberite »Prevajanje«. Po tem se na levi strani prikaže okno »Referenčni materiali«.

Program za optično prepoznavanje besedila. ABBYY FineReader lahko prepozna besedilo iz skeniranih papirnatih dokumentov, datotek PDF in dokumentov, posnetih z digitalnim fotoaparatom. Besedilne dokumente, ki jih program prepozna, lahko dodatno urejate z aplikacijami Microsoft Office. Po potrebi se med prepoznavanjem besedila ohrani celotna struktura oblikovanja dokumenta. FineReader deluje z vsemi priljubljenimi modeli sodobnih skenerjev in večnamenskih naprav (MFP). Če mora uporabnik skenirati in prepoznati veliko število strani besedila, program omogoča poseben način za delo z avtomatskimi skenerji (skener z avtomatskim podajalnikom papirja). Program lahko prepozna besedilo v datotekah naslednjih formatov: PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG, DjVu, obdelava bo izvedena po potrebi digitalne slike za izboljšanje kakovosti optičnega prepoznavanja besedila (sliko lahko obrežete, očistite nepotrebnih elementov, odpravite netočnosti, popačenja črt, zavrtite ali zrcalite).

Program je celovita aplikacija za delo z besedilnimi dokumenti. Njegov glavni namen je optično prepoznavanje znakov. Ustvarjalec programa je rusko podjetje ABBYY Software (vodja v svetu na področju sistemov za prepoznavanje). Aplikacija hitro in natančno prevede skenirane dokumente v format, ki ga je mogoče urejati, pri čemer ohrani vse izvirne podrobnosti vira. FineReader lahko prepozna datoteke PDF, digitalne fotografije in papirnate dokumente. Program natančno reproducira videz izvirnega vira, podpira prepoznavanje besedila v 186 jezikih in omogoča neposreden izvoz v aplikacije Microsoft Office.

Z uporabo aplikacije so možna opravila, kot so: ustvarjanje in urejanje elektronskih dokumentov na podlagi papirnih virov, prevajanje dokumentov slabe kakovosti v obliko, ki jo je mogoče urejati, obdelava dokumentov s kompleksno vsebinsko strukturo, vključno s tabelami, ilustracijami, diagrami itd., iskanje in urejanje besedila. se rešujejo v poljubnih oblikah. Po mnenju večine strokovnjakov je program najboljši na svojem področju.

Če govorimo o praksi uporabe tega programa v RuNetu, potem mnogi uporabniki že dolgo poznajo ta program Fine Reader (ruski prevod imena), katerega glavni namen je izvesti tako imenovano optično prepoznavanje besedila. Preprosto povedano, s pomočjo tega programa je mogoče vsako besedilo, natisnjeno na papir, pretvoriti v enega od elektronske formate. Najnovejša različica Program ne vsebuje le posodobljenega in bolj priročnega vmesnika, temveč tudi izboljšano funkcionalnost.

Pravzaprav lahko vsa osnovna dejanja izvedemo z enim klikom miške, s katerim ob zagonu programa izberemo eno izmed ponujenih dejanj. Med njimi so možnost skeniranja dokumentov v format .doc, pretvorba fotografij, skeniranje v Excel, shranjevanje slik in njihovo skeniranje, prepoznavanje slik itd. Da bi izboljšali uporabnost programa, smo povečali delovno področje in gumbi, ki sprožijo to ali ono dejanje, so zdaj razširjeni v stranski vrstici.

Da ne bi zmedli uporabnika, so privzeto vse datoteke, ki jih odpre, samodejno prepoznane. Če je potrebno, lahko izkušeni uporabnik temeljito prilagodi funkcionalnost FineReader. In delo s slikami je bilo zaradi novega dialoga zelo poenostavljeno. Uporaba aplikacije vam omogoča prepoznavanje dokumentov, napisanih v več kot enem jeziku, pretvorbo datotek PDF, prepoznavanje črtnih kod in izvajanje morfoloških iskanj. In čeprav to še zdaleč ni popoln seznam njegovih zmogljivosti, lahko samo to spodbudi mnoge uporabnike, da trajno namestijo Fine Reader in ga uporabljajo po potrebi.

In če povzamemo zgoraj navedeno, lahko na kratko opišemo funkcionalnost: ta program se uporablja za optično prepoznavanje različnih besedilnih dokumentov. Pri prepoznavanju besedila program ohrani prvotno oblikovanje in zasnovo dokumenta (barvno besedilo, besedilo na ozadju slik, različni slogi pisav, oblivanje besedila okoli slik, tabel itd.). FineReader lahko dela s skeniranimi papirnatimi dokumenti (podprto je delo s skoraj vsemi priljubljenimi modeli optičnih bralnikov in večnamenskih naprav), z zajetimi dokumenti digitalni fotoaparati, prepozna besedilo in grafiko iz datotek PDF. Prav tako izvozi rezultate optičnega prepoznavanja besedila v priljubljene pisarniške aplikacije: Word, Excel, PowerPoint, Lotus Word Pro, Corel WordPerfect, OpenOffice. Prepoznano besedilo lahko shranite v različnih formatih: PDF, PDF/A, DOCX, XLSX, RTF, DOC, XLS, CSV, TXT, HTML, Unicode TXT, Word ML, LIT, DBF.

Prepoznavanje besedila je zelo priročna funkcija. Ni vam več treba pretipkavati velikih količin knjig in člankov. Za učitelje, študente in raziskovalce so takšne programske aplikacije pravo darilo. Oglejmo si različne aplikacije in ugotovimo, kateri program za prepoznavanje besedila s slike je najboljši.

Kako deluje

Optično prepoznavanje znakov (OCR) je zmožnost pretvorbe besedila iz grafične oblike (fotografija, skeniranje, pdf) v običajni format. Pretvorjeno besedilo je mogoče urejati.
Vsaka rastrska slika je sestavljena iz pik. Programska oprema za prepoznavanje prepozna črke na sliki in jih pretvori v besedilo. Analizirana je struktura dokumenta. Bloki besedila so označeni. Nato se narišejo črte, ki so razdeljene na besede in nato na simbole. Vsak znak se primerja z vzorci. Po tem se postavljajo hipoteze o tem, za kakšen simbol gre. Na njihovi podlagi program analizira različne variante delitev vrstic na besede in besed na znake. Število takih hipotez je ogromno. Na koncu se program odloči in izda besedilo.

Pregled programske opreme

Običajno lahko vse aplikacije razdelimo v tri kategorije:

Plačano.
Prost.
Spletna storitev s.

Oglejmo si več možnosti iz vsakega razdelka.

Plačljivi in brezplačni programi

OCR CuneiForm

Brezplačni program za prepoznavanje besedila pri skeniranju, ki ga lahko prenesete tukaj.

Aplikacijo je leta 1993 razvilo podjetje Cognitive Technologies. Ena njegovih glavnih značilnosti v tistem času je bila sposobnost prepoznavanja mešanice ruščine in angleški jeziki. Leta 2009 je bila dodana veja, ki omogoča prepoznavanje mešanice drugih jezikov. Programski izdelek je bil dobavljen s skenerji in večnamenskimi napravami vodilnih proizvajalcev: Hewlet-Pachard, Epson, Xerox itd. Zadnja različica je bila izdana leta 2009.
Po prenosu in namestitvi poskušamo prepoznati besedilo. Vzemimo ta članek kot primer.

Programski vmesnik je preprost, meni je v ruščini.

Kliknite ikono mape in naložite sliko. Pritisnite gumb za prepoznavanje.

Rezultat ni impresiven. Večbarvno besedilo ni prepoznano.

Kljub navedeni uporabi različnih slovarjev je bila tudi angleščina slabo prepoznavna.

Glede na vse, popolna fotografija lahko prevedemo v simbole, vendar nižja kot je kakovost izvirne slike, nižja je kakovost rezultata.
Treba je opozoriti, da je to edini rusificirani program za prepoznavanje besedila za skeniranje, ki je bil brezplačno prenesen na zakonit način. Vsi drugi noter najboljši scenarij imajo brezplačno poskusno obdobje.

RiDoc

Program za prepoznavanje besedila s fotografije ali iz skenerja z brezplačnim preizkusom 30 dni. Prenesete ga lahko tukaj.

Aplikacija ima dobro funkcionalnost in dostopen vmesnik. Če želite naložiti sliko, kliknite gumb "Odpri".

Sledi gumb »Prepoznaj«.

Kot rezultat dobimo končni rezultat. Odprete ga lahko v Wordu ali OpenOffice.

Tukaj je rezultat.

Tudi ne idealno, a veliko bolj kot v prejšnjem primeru.
Dodate lahko tudi vodni žig ali združite več slik.

Preberi Iris

Plačljiv programski izdelek s preizkusno različico 100 strani ali 10 dni. Program optičnega bralnika za prepoznavanje besedila lahko prenesete z uradne spletne strani tukaj.

Razvijalec je belgijsko podjetje IRIS, ustanovljeno leta 1986. Glavna specializacija so tehnologije in izdelki za inteligentno prepoznavanje dokumentov.

Program pretvori sliko, PDF datoteka ali skenirani dokument v besedilno datoteko, ki jo je mogoče v celoti urejati. Izvleče besedilo iz vaših dokumentov, hkrati pa ohrani postavitev izvirne datoteke. Ima naslednje lastnosti:

Pretvorba Wordove datoteke, Excel in PowerPoint v indeksirane datoteke PDF;
pretvorba dokumentov s pomočjo kontekstnega menija;
indikator kakovosti za uvožene dokumente;
samodejno zaznavanje skenerjev;
modul korekcije perspektive.

Programski vmesnik je rusificiran (naveden med namestitvijo) in je precej preprost.

Kliknite gumb »Iz datoteke« in izberite našo sliko. Program ga je samodejno razdelil na dva bloka.

Za prepoznavanje kliknite gumb »Odpri« in določite pot do slike. Format je naveden v zgornji vrstici.

Rezultat je presegel vsa pričakovanja. Ohranjen je celo obris.

Dokument lahko pošljete po pošti ali v oblak. Če želite to narediti, kliknite na zgornji seznam in izberite. Privzeto je shranjen v datoteko.

Ta program stane približno 6.000 rubljev.

ABBYY FineReader

Najbolj znan in promoviran program. Preizkusno različico lahko prenesete tukaj.

Plačani stroški 6.990 rubljev. Ruski razvoj iz leta 1993 še vedno velja za enega najboljših na svetu. Glavne značilnosti:

Prepoznavanje tabel in grafov, matematičnih formul.
Oglejte si pdf in se pomikajte po njem.
Ustvarjanje in neposredno urejanje pdf.
Delo z digitalnim podpisom.
Primerjava dokumentov.
Dodajanje komentarjev.

Program ima veliko funkcij. Vmesnik je rusificiran in dostopen.

Po kliku na gumb »Odpri« in izbiri slike se začne njena samodejna razdelitev na bloke.

Za začetek postopka kliknite ustrezen gumb.

Vse kar ostane je, da izberete, v kateri obliki želite shraniti, in določite mapo, v katero želite shraniti dokument.

Odpremo rezultat. Kot vidite, je priznanje potekalo odlično.

Ponovno primerjajte z ReadIris.

Prva možnost (Finereader) je izvedena brezhibno. Zato morda damo dlan temu programu. Po ceni so primerljivi, zato razlika 600-700 rubljev ne igra posebne vloge.

Prepoznavanje besedila iz fotografij na spletu

IMGonline

Spletna storitev obdelave slik. Spletno mesto ponuja orodja:

Stisnite in spremenite velikost slike
Obrezovanje, obrezovanje
Obdelava vdelanih metapodatkov
Učinki
Izboljšave
Opredelitev barvne palete slik
Pridobivanje ozadja
Ugotavljanje odstotka podobnosti itd.

Priročna stran, ki ponuja veliko možnosti za obdelavo slik. Vmesnik je preprost in jasen.

Ponuja dva programa. Primerjajmo. Naložite datoteko in kliknite V redu.

Nato kliknite na povezavo.

Rezultat ni spodbuden.

Poskusimo drugi program.

Tudi dvomljivo.

Nastavimo dodatni jezik.

Preverimo rezultat.

Malo boljši, a daleč od popolnega.

img2txt

Program za prepoznavanje besedila s fotografij na spletu ne omogoča skeniranja.

Stran deluje od leta 2014. Razvijalci ne načrtujejo nobenih drugih storitev razen trenutne.

Izberite datoteko in kliknite »Naloži«. Nato kliknite »Začni prepoznavanje«.

Tudi rezultat je daleč od popolnega.

Сonvertio

Precej velik plačljiv portal, kjer lahko izkoristite naslednje funkcije:

Pretvorite video, avdio, slike.
Pretvorite PDF v Word, Excel, PowerPoint.
Razdelitev PDF.
Stisnite PDF, PNG itd.

Načelo delovanja je popolnoma podobno, vendar je nastavitev več. Slike lahko povlečete in spustite.

Določite lahko več jezikov in vrsto dokumenta, v katerega se shrani rezultat.

Neregistriranim uporabnikom je na voljo samo 10 strani za prepoznavanje.
Po kliku na captcha izberite "Pretvori".

Kliknite prenos.

Rezultat je presegel vsa pričakovanja.

Izkazalo se je, da imajo tudi preproste spletne storitve možnost zagotavljanja visokokakovostnega prepoznavanja. Tako je Convertio razglašen za jasnega zmagovalca v tej kategoriji. Toda kot vsak odličen izdelek ima tudi ta svojo ceno.

Tako smo si ogledali različna orodja za OCR. Izkazalo se je, da brezplačni lahko pomagajo, vendar kakovost ostaja nenadzorovana. Torej, če morate nenehno prevajati besedilo iz tiskani obliki elektronsko, boste morali odšteti več.