Word'de Taranan Metni Tanıyın. Taranan Bir Belgeyi Microsoft Word Formatına Dönüştürme

Ev / Boş vakit

Paragraf 2.1'de bahsettiğimiz teorik bölümü yazmanın hızlı yolunu seçtiyseniz, büyük olasılıkla belgeleri taramadan yapamayacaksınız. Aksi takdirde bu noktayı atlayıp kütüphanede bulunan materyaller hakkında not almaya başlayabilirsiniz.

Taramaya başlamadan önce çalışmanızı yazarken tam olarak ne kullanmak istediğinize karar vermeniz gerekir. Bunu yapmak için öncelikle mevcut literatüre göz atmanız ve gerekli noktaları bir kalemle vurgulamanız gerekir.

İlk dersim için ilk kez bir dergi makalesini taradığımda, görevi inanılmaz derecede zor buldum. Tarayıcı ve FineReader ile birkaç saat çalışmanın sonucunda çıktı, düzenlenemeyen saçmalıklardan ibaretti. Sonuç olarak her şeyi elle yazmak zorunda kaldım. Bunun başınıza gelmesini önlemek için gelin taramanın tüm teknik yönlerine daha yakından bakalım.

Taramak için elbette bir tarayıcıya ihtiyacımız olacak. Satın almanıza gerek yok. Örneğin bir arkadaşınızdan bir süreliğine bir şey ödünç alabilirsiniz. CanoScan Lide 60 tarayıcı kullanıyorum. Her ne kadar bu en yeni model olmasa da, bu kompakt, hızlı ve kullanımı kolay "cihazı" gerçekten seviyorum. Bir tarayıcı ödünç alırsanız, çalışabilmesi için öncelikle sürücü programını yüklemeniz gerekir. Sürücüler ve kurulum talimatları her zaman şu adreste bulunabilir: kurulum diski Cihazla birlikte verilen veya üreticinin web sitesinden indirilebilen. Sürücüyü yükledikten sonra tarayıcıyı bağlantı kablosunu kullanarak bilgisayarınıza bağlayın. Artık doğrudan taramaya başlayabilirsiniz.

Ama önce küçük bir teori. Tarama işleminin iki aşamadan oluştuğunu bilmelisiniz:

1. Belgeyi doğrudan taramak. Bu aşamada tarayıcı, taranan belgenin yüzeyinin fotoğrafını çeker ve elde edilen görüntüyü normal .jpg .gif dosyası olarak veya başka bir formatta bilgisayara kaydeder;

2. Belge tanıma. Bu, tarayıcı tarafından alınan bir görüntüdeki metni normal bir teste dönüştürme işlemidir; bu daha sonra Word'e kaydedilebilir ve düzenlenebilir. Tanıma, bir tarayıcının katılımı olmadan, özel bir program kullanılarak gerçekleştirilir (en popüler olanı Adobe FineReader'dır). Bu şekilde, önce birkaç metin sayfasını tarayabilir ve bunları metne dönüştürmeden önce görüntü olarak kaydedebilirsiniz.

Öyleyse başlayalım birinci aşama - tarama:

– tarayıcı sürücüsünü başlatın: Başlat - Tüm Programlar - Canon - ScanGear(Tarayıcımın sürücü adını belirtiyorum). Sürücü penceresi görünecektir:

– tarayıcı kapağını açın ve bir kitabı, dergiyi veya bunların bir kopyasını, metin aşağı bakacak şekilde, tarayıcının çalışma yüzeyinin kenarlarına göre mümkün olduğunca eşit bir şekilde yerleştirin:

Burada tarayıcı kapağının taranan belgeye mümkün olduğu kadar sıkı bastırılması, tarayıcının belgeyle temas eden çalışma yüzeyine harici ışığın ulaşmasını önlemesi çok önemlidir;

– tarayıcı sürücüsünde gerekli ayarları yapın. İlk adım, belgenin taranacağı çözünürlüğü ayarlamaktır. Çözünürlük, tarama sırasında bir nesnenin ayrıntı düzeyini belirleyen ve inç başına nokta sayısı (dpi veya dpi) cinsinden belirlenen bir göstergedir. Çözünürlük ne kadar yüksek olursa görüntü kalitesi de o kadar iyi olur. Ancak metin belgelerini tararken maksimum çözünürlüğü ayarlamanın bir anlamı yoktur çünkü bunun hiçbir faydası olmayacaktır. Ayrıca daha yüksek çözünürlüklerde tarama daha uzun sürer. Çözünürlüğü 400-500 dpi arasında ayarlamanızı öneririm. Bu ayarla görüntüler iyi tanınma için yeterli kalitede olur ve tarama işleminin kendisi fazla zaman almaz. Yazıcı ayarlarımın ekran görüntüsüne bakmanızı öneririm:


İlk önce gitmeniz gerekiyor "Gelişmiş mod". Kaynak her zaman olacak "Tablet"(düz yataklı tarayıcı). Renk modunu ayarlamak daha iyidir "Siyah ve beyaz", çünkü metni taramak için renklere ihtiyacımız yok ve bu, çıktı resimlerinin boyutunu azaltacaktır. Dediğim gibi çözünürlük ayarlanmalı 400 dpi. Çıktı görüntü boyutu – gerekli “A4”. Artık düğmeye güvenle basabilirsiniz "Tara". Tarayıcım, taranan görüntüleri ilk önce depolayacak şekilde tasarlanmıştır. Dahili bellek ve yalnızca sürücü penceresini kapatırken bunları bilgisayara kaydetmeyi önerir. Tek yapmam gereken, çalışma sonuçlarının kaydedileceği konumu belirtmek.

Bu türden dosyalara sahip olmalısınız:

Böyle bir görüntüyü büyüttüğünüzde metin açıkça görülebilmelidir.

İkinci aşamatanıma Alınan görüntüleri alın ve bunları metne dönüştürün. Daha önce de söylediğim gibi, bunun için özel bir program gerekecek - İyi okuyucu. Programı bu bağlantıdan indirin (32MB). Arşiv şifresi – web sitesi. Önerdiğim sürüm kurulum gerektirmiyor (taşınabilir). Program klasöründe birçok farklı dosya olacaktır, ancak yalnızca bir tanesine ihtiyacınız vardır - FineReader.exe. Bu dosyaya çift tıklamak, programı bilgisayarınızda başlatacaktır.

Programın bu sürümü oldukça eski. Aşağıdaki tüm ekran görüntülerini bunu kullanarak aldım. Eğer bu sürüm İyi okuyucu işinize yaramaz; daha yenisini seçin.

Pencere İyi okuyucu aşağıdaki forma sahiptir:

Daha önce taradığınız belgelerin yazdırıldığı dili ayarladıktan sonra tanımaya başlayabilirsiniz. Metin aynı anda iki dil içeriyorsa (örneğin Rusça ve İngilizce) kurulumu buna göre yapın.

Tanıma işlemini başlatmak için ilk düğmenin sağındaki oka tıklayın Tara- ve daha sonra - Resmi aç:

Resim seçim penceresi açılacaktır. Taranan görüntüleri kaydettiğiniz klasörü açın, CTRL+A(İngilizce) klavyede ve düğmeye basın Açık.

Bundan sonra pencerenin solunda İyi okuyucu Eklenen dosyaların küçük resimleri ortada görünecektir. şu an seçilen çizim büyütülmüş, aşağıda daha da büyük bir artış ve sağda ise tanıma sonucu görülüyor:

Mesela sadece iki fotoğraf çektim. Bunlardan ilki yukarıdaki ekran görüntüsünde vurgulanmıştır; artık onu tanıyabiliyoruz. Gördüğünüz gibi görüntü dikey olarak tarandı; metnin tanınabilmesi için önce görüntünün 90 derece döndürülmesi gerekiyor. Bunu yapmak için ve düğmelerini kullanın. Bir sonraki adım, programa görüntünün hangi bölümünün tanınması gerektiğini söylemek ve ayrıca çıktısı alınması gereken veri türünü ayarlamaktır: metin, tablo veya resim. Bunun için sırasıyla düğmeler vardır: . Örneğin, bir metin bloğunu işaretlemeniz gerekiyorsa, üzerine sol tıklayın, ardından metin bloğunun sol üst köşesine sol tıklayın ve sol düğmeyi basılı tutarak onu sağ alt köşeye sürükleyin. Örneğin, tanıma için tamamen bir görsel hazırladım:

Gördüğünüz gibi yukarıdaki örnekte tüm metin blokları yeşil renkle, resimler ise kırmızı renkle vurgulanmıştır. Tablolar aynı şekilde tanınmaya hazırlanır. Buton bunun içindir. Bir sonraki fotoğrafa geçmek için soldaki küçük resme sol tıklayın. Bu sayede tarama sonucu elde edilen tüm görüntüler tanınmaya hazır hale gelir. Görsellerin hazırlanması tamamlandıktan sonra hepsini seçmelisiniz. Bunu yapmak için, küçük resim panelindeki boş bir alana sol tıklayın (buna Naylon poşet) ve bas Ctrl+A(İngilizce) klavyede. Daha sonra butona tıklayın ve bekleyin. İyi okuyucu görüntüleri metne dönüştürür. Bundan sonra, ortaya çıkan metni, hangi pencerenin açılacağını tıkladıktan sonra düğmeyi kullanarak Word'e kaydedebilirsiniz. İçinde kaydetmek için formatı seçmeniz gerekiyor - Microsoft Word ve ayrıca tüm sayfaları kaydetmek için kutuyu işaretleyin:

Düğmeye bastıktan sonra TAMAM program oluşturacak Word belgesi ve tanınan sayfalardaki metni, küçük resim panelinde (Toplu) bulundukları sıraya göre ekler. Ortaya çıkan belgeyi hemen tezinizin dosya yapısındaki bir klasöre kaydedin ve düzenlemeye başlayabilirsiniz. Bunun nasıl yapılacağı kitabımda anlatılıyor ücretsiz kurs.

Ve son bir nokta. Bir gazete veya dergiyi taradıysanız, oradaki metin genellikle sütunlar halinde verilir (yukarıdaki örnekte olduğu gibi). Word'deki bu sütunların bir sütuna dönüştürülmesi gerekir. Sütunlardaki metni seçin ve komutu çalıştırın: Biçim – Sütunlar – Bir – Tamam. Ancak bundan sonra Sayfa Yapısı, kenar boşluğu dolgusu, yazı tipi vb.'de Dikey yönlendirmeyi ayarlayabilirsiniz.

Bir belge nasıl taranır ve MS Word'de nasıl tanınır?

ABBYY FineReader Çevrimiçi Taranmış belgeleri ve dijital fotoğrafları çevrimiçi olarak tanırız.

Şimdi her şey ödeniyor:

  • 10 sayfa 3,00$
  • 30 sayfa 8,00$
  • 100 sayfa 20,00$
  • 300 sayfa 50,00$
  • 1000 sayfa 70,00$
ABBYY FineReader - en iyi program bu alanda. Şimdi bunun çevrimiçi bir versiyonu var. Bu, çok sık ihtiyaç duymayanlar için uygun olacaktır. Bilgisayarınıza ekstra bir program yüklemenize gerek yok (her biri kaynak tüketiyor ve ardından sistem yavaşlamaya başlıyor).
  • çok dilli belgelerin tanınması (aynı anda en fazla 3 dil): İngilizce, Rusça, Fransızca, Almanca, İspanyolca, Ukraynaca... (toplamda 37 dil);
  • Aşağıdaki formatlardan herhangi birindeki dosyaları tanıyabilirsiniz:
    1. *.jpg (*.jpeg)
    2. *.tif (*.tiff)
    3. *.pcx
    4. *.dcx
    5. *.bmp
    6. *.png
    7. *.djvu, *.djv
    8. *.pdf
  • formatlara dönüştürme
    1. Metin belgesi (*.txt)
    2. RTF belgesi (*.rtf)
    3. Belge PDF(*.pdf)
    4. Belge PDF/A (*.pdf)
  • Belge başarılı bir şekilde tanınıp seçtiğiniz formatta kaydedildikten sonra iş geçmişinden indirebilirsiniz. Burada işinizin durumunu görebilirsiniz:
    1. İşleme sırasında – sunucu resminizi tanıyana kadar beklemeniz gerekir;
    2. Tanındı – belge işleme tamamlandı ve tanıma sonucunu indirebilirsiniz;
    3. Tanıma hatası – belge tanınmadı;
    4. Düşük tanıma kalitesi. Görev ücretsiz olarak tamamlandı - belge çok sayıda hatayla tanındı.
    5. tanınan belgeler 72 saat boyunca sunucuda saklanır ve profilinizdeki sipariş geçmişinden indirilebilir,
    6. İndirme bağlantısını e-postayla almak sizin için daha uygunsa, “Tanıma sonucunun bağlantısını e-postayla gönder” kutusunu işaretlemeniz ve belgenizin tanındığını belirten mektubu beklemeniz yeterlidir.

https:// Drive.google.com

Metin tanıma Google Dokümanlar'da mevcuttur.
Rusça dahil 29 dil tanınır, JPG, .GIF, .PNG ve .PDF formatları desteklenir, boyutlara kadar belgeler. 10 Mb. PDF dosyası en fazla 10 sayfadır.

  1. Google Dokümanlar'a veya Google Mail'den gidin.
  2. Fareyi kullanarak görüntüyü veya PDF dosyasını tarayıcı penceresine sürükleyin ( Google Chrome kesinlikle işe yarıyor).
  3. Altta bir pencere beliriyor ve üstte küçük bir menü var.
  4. Alttaki 2 öğenin yanındaki kutuları işaretleyin (resimde görüldüğü gibi):
    • V - PDF dosyalarından ve görsellerden metni dönüştürün
    • V - Her önyüklemeden önce ayarları onaylayın
  5. Pencereyi kapatın ve görüntüyü tekrar yükleyin.
  6. Artık yükleme sırasında metni tanımayı teklif ediyor; sadece dili belirtmeniz gerekiyor.
  7. Daha sonra resim resim olarak kaydedildi, ancak bir metin düzenleyiciyle açarsanız resmin altında tanınan metin olacaktır.

https:// img2txt.com

img2txt Görüntü tanıma hizmeti.
Hizmet Rusçadır ve tamamen ücretsizdir.
Çevrimiçi ortamda oldukça hızlı tanır. Doğru, beni sıraya koydular ama ilk sırada ben hata var mı diye kontrol ettim. Mükemmel kalitede küçük bir metin parçası (Web sitelerinden bir ekran görüntüsü aldım, daha kaliteli ne olabilir?) her kelimede 2 hata üretti. Taramalarla çok daha iyi çalışıyor. İyi bir sonuç bekleyebilirsiniz. Ukrayna'da her zaman iyi programcılar olmuştur.

https://www. onlineocr.net

Çevrimiçi OCR Metin tanıma hizmeti.

Kaynak formatları

  1. JPG/JPEG
  2. TIF/TIFF
  3. TIFF çok sayfalı,
  4. PDF'ler çok sayfalı.
Çok sayfalı bir belgede sayfaları seçici olarak tanıyabilirsiniz.

Formatlara dönüştürür

  1. Belge PDF(*.pdf)
  2. Microsoft Word Belgesi (*.doc)
  3. Microsoft Excel belgesi (*.xls)
  4. HTML belgesi (*.html)
  5. RTF belgesi (*.rtf)
  6. Metin belgesi (*.txt) Oluşturulan dosya, kaynak belgenin yapısını (tablolar, sütunlar, yazı tipleri vb.) tam olarak tekrarlayacaktır.

    Sonuç

    Tanıma sonuçlarını içeren dosyalar çevrimiçi sanal ofisinizde, bunları şuraya indirin: Sabit disk, düzenleyin, postayla gönderin ve yazdırın.

    Sınırlama

    1. Dosya boyutu aşılmamalıdır 20 Mb.
    2. Yüksek kaliteli bir tanıma sonucu elde etmek için görüntü çözünürlüğünün en az olması gerekir. 200 DPI.

Talimatlar

Taranan bir belgeyi Word'e çevirmek için üzerindeki metni tanımanız gerekir. Bunu yapmak için ABBYY FineReader gibi bu tür sorunları çözmek üzere tasarlanmış bir program kullanın. Ayrıca bu programın arayüzünü kullanarak belgeleri de tarayabilirsiniz. FineReader programının bir benzeri olarak CuneiForm, Readiris Pro, Free OCR, SimpleOCR vb. programları kullanabilirsiniz.

Kaydedilen görüntüye bir kez sağ tıklayın, "Birlikte aç..." seçeneğini seçin ve beliren programlar listesinde yakın zamanda yüklediğiniz Fine Reader'ı seçin. Gerekirse “Bu türdeki dosyalar için tüm veriler için kullan” onay kutusunu seçin. Ayrıca görüntüyü kullanarak da tarayabilirsiniz. programı aç“Tara ve Oku” seçildiğinde cihazdaki görüntü doğrudan çalışma alanına aktarılır. Bunu yapmak için öncelikle tarayıcının Fine Reader program modunda çalışması için ayarlarda parametreleri belirtin.

Açılan program penceresinde “Metni tanı” seçeneğini seçin. Program belgeyi okurken bekleyin. İşlemin sonuçları gereksinimlerinizi karşılamıyorsa tarama ve tanıma ayarlarını değiştirin ve işlemi yeniden tekrarlayın.

Ortaya çıkan belgeyi Microsoft Office Word tarafından desteklenen herhangi bir biçimde kaydedin. Fine Reader'ı kapatın, belgenizin kaydedildiği klasöre gidin.

Dosyayı MS Office Word'ü veya rahatça çalışabileceğiniz başka bir metin düzenleyiciyi kullanarak açın. Dosyada gerekli değişiklikleri yapın ve sonuçları kaydedin.

Not

Tarama ayarlarına özellikle dikkat edin; gerekli parametreleri önceden ayarlamak en iyisidir.

Yararlı tavsiye

Programı yalnızca resmi Abbyy web sitesinden indirin.

Tarayıcılar ve çok işlevli cihazlar (MFP'ler), bilgisayar kullanıcılarının hayatlarının derinliklerine yerleşmiştir. İçin başarılı çalışma Bu cihazlarda uyulması gereken belirli kurallar vardır.

İhtiyacın olacak

  • - tarayıcı;
  • - Adobe okuyucu.

Talimatlar

Tarayıcının bağlı olduğundan ve bu aygıt için gerekli tüm sürücülerin yüklü olduğundan emin olun. Tarayıcının veya MFP kapağını açın ve gerekli belge taranan taraf aşağı bakacak şekilde. Tarama işlemini başlatan butona tıklayın ve işlemin tamamlanmasını bekleyin.

Bazı MFP'ler ekipmanı aşağıdakileri kullanarak kontrol etmenize olanak tanır: özel programlar. Bu yardımcı programı başlatın ve "Tara" düğmesine tıklayın. Bu işlem tamamlandıktan sonra taranan belgenin kaydedildiği klasör otomatik olarak açılacaktır.

Bazı yazılımlar taranan verileri otomatik olarak kaydetmez. Genellikle bu gibi durumlarda belgeleri okumak için tasarlanmış bir program açılır. Bu tür bir MFP ile karşı karşıya kalırsanız, taranan belgeyi açtıktan sonra Ctrl ve S tuş kombinasyonuna basın. Görüntüyü kaydetmek istediğiniz klasörü seçin ve dosya adını girin.

Seçenek yazılım tamamen omuzlarınıza dayanıyor. Genellikle DjvuReaser veya Adobe Reader programları onunla çalışmak için kullanılır. Tarama seçeneklerinizi ayarlarken size uygun formatı seçtiğinizden emin olun.

Tarama işlemi tamamlandıktan hemen sonra belgeyi düzenleyin. Yalnızca gerekli olan kısmı kesin. Özel programlar kullanarak görüntüyü düzeltin. Tarama sonrasında siyah çubuklar görünüyorsa kaldırın. Sağlamak Yüksek kalite Taranan belgeler için MFP için uygun ayarları seçin. 8 bitlik görüntü rengi kullanmak daha iyidir ve inç başına nokta sayısı en az 150'dir.

Yararlı tavsiye

Fotoğrafları tararken, ortaya çıkan görüntünün en iyi kalitesini sağlamanıza olanak tanıyan ayarları kullanmak daha iyidir.

Kaynaklar:

  • bilgisayarda bir belge nasıl taranır

Tarayıcı, görüntülerin dijital kopyalarını oluşturmak için tasarlanmıştır. Taranan belge çizim olarak kaydedilebilir veya çizime dönüştürülebilir. metin biçim. Her şey kullanıcının hangi sonucu elde etmek istediğine ve iş için hangi uygulamaları kullandığına bağlıdır.

Talimatlar

Tarayıcı, varsayılan olarak yakalanan görüntüleri .jpg, .bmp veya .tiff dosyaları olarak kaydeder; bu bir grafik formatıdır. Grafik düzenleyicilerde bu tür dosyalarla çalışabilirsiniz: belgenin çözünürlüğünü, kontrastını, parlaklığını değiştirin veya başkalarını uygulayın görsel efektler. Platformlar arası .pdf formatı, görüntü işleme için biraz farklı fırsatlar sunar, ancak yine de, metin formatında taranmış bir belgeyle çalışmak için ayrı bir işlev kullanmanız gerekir. tarayıcı, veya özel uygulama metin tanıma için.

Olanaklarınızı keşfedin tarayıcı. Birçok model için geliştiriciler, taranan görüntüyü metne dönüştürmek için bir yardımcı program sağlar; bu, cihazla birlikte verilir ve kurulum diskinde bulunur. Menüde tarayıcı Bu seçeneğe “Metin Tanıma” veya OCR (Optik Karakter Tanıma) adı verilir. Bu seçenek kullanılamıyorsa Fine Rider gibi bir üçüncü taraf uygulamasını yükleyin.

Menüden seç tarayıcı veya ilgili düğmeyi programlayın ve tarama tamamlanana kadar bekleyin. Bundan sonra belgedeki bilgiler otomatik olarak dile çevrilebilir. metin biçimlendirin ve açın, aksi takdirde birkaç ek adım uygulamanız gerekecektir.

Metin bir .txt dosyasına aktarıldıysa belgeyi her zamanki gibi kaydedin veya içeriğini kopyalayıp .doc (.docx) gibi başka bir formattaki belgeye yapıştırın. Eğer metni hala resim olarak görüyorsanız “Tanı” adımını seçin ve işlemin tamamlanmasını bekleyin. Bundan sonra, "Dışa Aktar" komutunu seçin veya tanınan metni kopyalayıp size uygun formatta bir belgeye yapıştırın.

Metnin “çevirisinin” kalitesi tarayıcı büyük ölçüde seçilen çözünürlük ayarlarına bağlıdır. Çözünürlük ne kadar yüksek olursa tarayıcının kopyası o kadar doğru olur. Bir resmi metne dönüştüreceğiniz zaman orta çözünürlük ayarları en iyi seçenektir. Çözünürlük çok düşükse kopya çok net olmayacak ve dolayısıyla metnin tanınması zorlaşacaktır. Çözünürlük çok yüksekse aşırı gürültü de grafiklerin metne çevrilmesini zorlaştıracaktır.

Kaynaklar:

  • metin nasıl çevrilir

Microsoft Word, kullanıcılarına, yazılan metni çevirmenize olanak tanıyan çok kullanışlı bir seçenek sunar. metin. Artık kelime çevirileri bulmak için sözlükleri karıştırmanıza veya çevirmen programlarını kullanmanıza gerek yok. Tek yapmanız gereken Word'ü başlatmak.

İhtiyacın olacak

  • - bilgisayar;
  • - İnternet.

Talimatlar

Bilgisayarınızda Microsoft Word'ü başlatın. Bu programın sürümü en az 2003 olmalıdır.

Çeviri gerektiren metni yazın ve yazım hataları olup olmadığını kontrol edin. Herhangi bir yanlışlık, metni program için zorlaştırabilir veya anlamını bozabilir. Yazdığınız metni seçin ve ana menüdeki “İncele” sekmesine tıklayın. Açılan menüde “Çeviri” seçeneğini seçin. Bundan sonra sayfanın solunda “Referans Materyalleri” penceresi görünecektir.

Optik metin tanıma programı. ABBYY FineReader, taranmış kağıt belgelerdeki, PDF dosyalarındaki ve dijital kamerayla çekilen belgelerdeki metinleri tanıyabilir. Program tarafından tanınan metin belgeleri Microsoft Office uygulamaları kullanılarak daha da düzenlenebilir. Gerekirse metin tanıma sırasında belge tasarımının tüm yapısı korunacaktır. FineReader, modern tarayıcıların ve çok işlevli cihazların (MFP'ler) tüm popüler modelleriyle çalışır. Kullanıcının taraması ve tanıması gerekiyorsa çok sayıda sayfalarca metin içeren program, otomatik tarayıcılarla (otomatik kağıt besleyicili tarayıcı) çalışmak için özel bir mod sağlar. Program aşağıdaki formatlardaki dosyalardaki metni tanıyabilir: PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG, DjVu, gerekirse işlem yapılacaktır dijital görüntüler optik metin tanımanın kalitesini artırmak (görüntü kırpılabilir, gereksiz unsurlardan arındırılabilir, yanlışlıklar, çizgi bozuklukları ortadan kaldırılabilir, döndürülebilir veya yansıtılabilir).

Program, metin belgeleriyle çalışmak için kapsamlı bir uygulamadır. Temel amacı optik karakter tanımadır. Programın yaratıcısı Rus şirketi ABBYY Software'dir (tanıma sistemleri alanında dünya lideri). Uygulama, taranan belgeleri hızlı ve doğru bir şekilde düzenlenebilir bir formata çevirerek kaynağın tüm orijinal ayrıntılarını korur. FineReader PDF dosyalarını, dijital fotoğrafları ve kağıt belgeleri tanıyabilir. Program, orijinal kaynağın görünümünü doğru bir şekilde yeniden üretir, 186 dilde metin tanımayı destekler ve Microsoft Office uygulamalarına doğrudan aktarım sağlar.

Uygulamayı kullanarak, kağıt kaynaklarına dayalı elektronik belgeler oluşturma ve düzenleme, düşük kaliteli belgeleri düzenlenebilir bir formata çevirme, tablolar, resimler, diyagramlar vb. dahil olmak üzere karmaşık içerik yapısına sahip belgeleri işleme, metin arama ve düzenleme gibi görevler. herhangi bir formatta çözülür. Uzmanların çoğuna göre program kendi alanında en iyisidir.

Bu programı Runet'te kullanma pratiğinden bahsedersek, birçok kullanıcı bu programı uzun zamandır biliyordu Fine Reader (adın Rusça çevirisi), asıl amacı sözde optik metin tanımayı gerçekleştirmektir. Basitçe söylemek gerekirse, bu programın yardımıyla kağıda basılmış herhangi bir metin, herhangi bir metinden birine dönüştürülebilir. elektronik formatlar. En son sürüm Program yalnızca güncellenmiş ve daha kullanışlı bir arayüze değil, aynı zamanda geliştirilmiş işlevselliğe de sahiptir.

Aslında tüm temel eylemler, programı başlatırken sunulan eylemlerden birini seçen tek bir fare tıklamasıyla gerçekleştirilebilir. Bunlar arasında belgeleri .doc formatına tarama, fotoğrafları dönüştürme, Excel'e tarama, görüntüleri kaydetme ve tarama, görüntü tanıma vb. özellikler yer almaktadır. Programın kullanılabilirliğini artırmak için çalışma alanı genişletildi ve Bunu veya bu eylemi tetikleyen düğmeler artık kenar çubuğunda genişletildi.

Kullanıcının kafasını karıştırmamak için varsayılan olarak açtığı tüm dosyalar otomatik olarak tanınır. Gerekirse deneyimli bir kullanıcı FineReader işlevinde derin ayarlamalar yapabilir. Yeni diyalog sayesinde görüntülerle çalışmak büyük ölçüde basitleştirildi. Uygulamayı kullanmak, birden fazla dilde yazılmış belgeleri tanımanıza, PDF dosyalarını dönüştürmenize, barkodları tanımanıza ve morfolojik aramalar yapmanıza olanak tanır. Her ne kadar bu, yeteneklerinin tam bir listesi olmaktan uzak olsa da, tek başına bu, birçok kullanıcıyı Fine Reader'ı kalıcı olarak kurmaya ve gerektiğinde kullanmaya teşvik edebilir.

Yukarıdakileri özetlemek gerekirse, işlevselliği kısaca özetleyebiliriz: Bu program, çeşitli metin belgelerinin optik olarak tanınması için kullanılır. Program, metni tanırken belgenin orijinal biçimlendirmesini ve tasarımını korur (renkli metin, resimlerin arka planına karşı metin, farklı yazı tipi stilleri, resimlerin etrafına sarılmış metin, tablolar vb.). FineReader, taranmış kağıt belgelerle çalışabilir (neredeyse tüm popüler tarayıcı modelleriyle ve çok işlevli aygıtlarla çalışma desteklenir), yakalanan belgelerle çalışabilir dijital kameralar, PDF dosyalarındaki metin ve grafikleri tanır. Ayrıca optik metin tanıma sonuçlarını popüler ofis uygulamalarına aktarır: Word, Excel, PowerPoint, Lotus Word Pro, Corel WordPerfect, OpenOffice. Tanınan metin çeşitli formatlarda kaydedilebilir: PDF, PDF/A, DOCX, XLSX, RTF, DOC, XLS, CSV, TXT, HTML, Unicode TXT, Word ML, LIT, DBF.

Metin tanıma çok kullanışlı bir özelliktir. Artık kitaplardan ve makalelerden büyük ciltleri yeniden yazmanıza gerek yok. Öğretmenler, öğrenciler ve araştırmacılar için bu tür yazılım uygulamaları gerçek bir hediyedir. Farklı uygulamalara bakalım ve bir resimdeki metni tanımak için hangi programın en iyi olduğunu belirleyelim.

Nasıl çalışır

Optik Karakter Tanıma (OCR), metni grafik biçiminden (fotoğraf, tarama, pdf) normal bir biçime dönüştürme yeteneğidir. Dönüştürülen metin düzenlenebilir.
Herhangi bir raster görüntü noktalardan oluşur. Tanıma yazılımı bir resimdeki harfleri tanımlar ve bunları metne dönüştürür. Dokümanın yapısı analiz edilir. Metin blokları vurgulanır. Daha sonra kelimelere ve ardından sembollere bölünen çizgiler çizilir. Her karakter kalıplarla karşılaştırılır. Daha sonra ne tür bir sembol olduğuna dair hipotezler ortaya atılıyor. Yazılım bunları temel alarak analiz eder farklı varyantlar Satırları kelimelere ve kelimeleri karakterlere ayırma. Bu tür hipotezlerin sayısı çok fazladır. Sonunda program bir karar verir ve metni çıktı olarak verir.

Yazılıma genel bakış

Geleneksel olarak tüm uygulamalar üç kategoriye ayrılabilir:

Her bölümden çeşitli seçeneklere bakalım.

Ücretli ve ücretsiz programlar

OCR Çivi Formu

Ücretsiz program buradan indirilebilen metin tanımayı taramak için.

Uygulama 1993 yılında Bilişsel Teknolojiler tarafından geliştirilmiştir. O zamanki ana özelliklerinden biri, Rusça ve Rusça karışımını tanıma yeteneğiydi. İngilizce dilleri. 2009 yılında, diğer dillerin karışımının tanınmasına olanak tanıyan bir şube eklendi. Yazılım ürünü, önde gelen üreticilerin tarayıcıları ve MFP'leriyle birlikte sağlandı: Hewlet-Pachard, Epson, Xerox, vb. En son sürüm 2009'da yayınlandı.
İndirip yükledikten sonra metni tanımaya çalışıyoruz. Örnek olarak bu makaleyi ele alalım.

Programın arayüzü basit, menü Rusça.


Klasör simgesine tıklayın ve görüntüyü yükleyin. Tanıma düğmesine basın.


Sonuç etkileyici değil. Çok renkli metin tanınmıyor.


Farklı sözlüklerin kullanılmasına rağmen İngilizce de yeterince tanınmıyordu.


Her şeyi hesaba katarak, mükemmel fotoğraf sembollere çevrilebilir ancak orijinal görüntünün kalitesi ne kadar düşük olursa sonucun kalitesi de o kadar düşük olur.
Bunun, yasal olarak ücretsiz olarak indirilen, tarama için tek Ruslaştırılmış metin tanıma programı olduğuna dikkat edilmelidir. Diğer herkes en iyi durum senaryosuücretsiz deneme süresine sahip olun.

RiDoc

30 günlük ücretsiz deneme süresiyle, bir fotoğraftaki veya tarayıcıdaki metni tanımaya yönelik bir program. Buradan indirebilirsiniz.

Uygulama iyi bir işlevselliğe ve erişilebilir bir arayüze sahiptir. Resmi yüklemek için “Aç” butonuna tıklayın.


Sonraki “Tanı” butonudur.


Sonuç olarak bitmiş sonucu elde ederiz. Word veya OpenOffice'de açılabilir.


İşte sonuç.


Ayrıca ideal değil, ancak önceki duruma göre çok daha fazlası.
Ayrıca filigran ekleyebilir veya birkaç resmi birleştirebilirsiniz.

ReadIris

100 sayfalık veya 10 günlük deneme sürümüne sahip ücretli yazılım ürünü. Metin tanıma için tarayıcı programını buradaki resmi web sitesinden indirebilirsiniz.

Geliştirici, 1986 yılında kurulan Belçika şirketi IRIS'tir. Ana uzmanlık, akıllı belge tanımaya yönelik teknolojiler ve ürünlerdir.

Program bir resmi, PDF dosyasını veya taranmış belgeyi tamamen düzenlenebilir bir metin dosyasına dönüştürür. Orijinal dosyanın düzenini korurken belgelerinizden metni çıkarır. Aşağıdaki özelliklere sahiptir:

  • dönüştürmek Kelime dosyaları, Excel ve PowerPoint'ten indekslenmiş PDF dosyalarına;
  • bağlam menüsünü kullanarak belgeleri dönüştürme;
  • içe aktarılan belgeler için kalite göstergesi;
  • tarayıcıların otomatik tespiti;
  • perspektif düzeltme modülü.

Programın arayüzü Ruslaştırılmıştır (kurulum sırasında belirtilir) ve oldukça basittir.


“Dosyadan” butonuna tıklayın ve görselimizi seçin. Program onu ​​otomatik olarak iki bloğa böldü.


Tanıma için “Aç” düğmesine tıklayın ve görüntünün yolunu belirtin. Format yukarıdaki satırda belirtilmiştir.


Sonuç tüm beklentileri aştı. Anahat bile korunmuştur.


Belgeyi postayla veya buluta gönderebilirsiniz. Bunu yapmak için yukarıdaki listeye tıklayın ve seçin. Varsayılan olarak bir dosyaya kaydedilir.


Bu programın maliyeti yaklaşık 6.000 ruble.

ABBYY FineReader

En ünlü ve tanıtılan program. Deneme sürümünü buradan indirebilirsiniz.

Ödenen maliyet 6.990 ruble. 1993'teki Rusya gelişimi hala dünyanın en iyilerinden biri olarak kabul ediliyor. Ana Özellikler:

  • Tablo ve grafiklerin, matematiksel formüllerin tanınması.
  • PDF'yi görüntüleyin ve gezinin.
  • Yaratılış ve doğrudan pdf düzenleme.
  • Dijital imzayla çalışma.
  • Belgelerin karşılaştırılması.
  • Yorumlar ekleniyor.

Programın birçok özelliği bulunmaktadır. Arayüz Ruslaştırılmış ve erişilebilirdir.


“Aç” butonuna tıklayıp bir resim seçtikten sonra otomatik olarak bloklara bölünme başlar.


İşlemi başlatmak için uygun düğmeye tıklayın.


Geriye kalan tek şey hangi formatta kaydedileceğini seçmek ve belgenin kaydedileceği klasörü belirtmektir.


Sonucu açalım. Gördüğünüz gibi tanıma mükemmel bir şekilde gerçekleşti.


ReadIris ile tekrar karşılaştırın.


İlk seçenek (Finereader) kusursuz bir şekilde yürütülür. Bu nedenle belki de avuç içimizi bu programa veriyoruz. Fiyat olarak karşılaştırılabilirler, bu nedenle 600-700 ruble arasındaki fark özel bir rol oynamıyor.

Çevrimiçi fotoğraflardan metin tanıma

IMGonline

Çevrimiçi görüntü işleme hizmeti. Site aşağıdaki araçları sağlar:

  • Resmi sıkıştırın ve yeniden boyutlandırın
  • Kırpma, kırpma
  • Gömülü meta verileri işleme
  • Etkileri
  • İyileştirmeler
  • Renk paleti resimlerinin tanımı
  • Arka planı alma
  • Benzerlik yüzdesinin belirlenmesi vb.

Görüntü işleme için birçok olanak sunan kullanışlı bir site. Arayüz basit ve anlaşılır.


İki program sunar. Hadi karşılaştıralım. Dosyayı yükleyin ve Tamam'a tıklayın.


Daha sonra bağlantıya tıklayın.


Sonuç cesaret verici değil.


İkinci programı deneyelim.


Ayrıca şüpheli.


Ek bir dil ayarlayalım.


Sonucu kontrol edelim.

Biraz daha iyi ama mükemmel olmaktan uzak.

img2txt

Çevrimiçi fotoğraflardan metin tanıma programı taramaya izin vermiyor.

Site 2014 yılından bu yana faaliyet göstermektedir. Geliştiriciler mevcut hizmetin dışında başka bir hizmet planlamıyor.


Dosyayı seçin ve "Yükle"ye tıklayın. Daha sonra “Tanımayı başlat”a tıklayın.

Sonuç da mükemmel olmaktan uzaktır.

Dönüşüm

Aşağıdaki özelliklerden yararlanabileceğiniz oldukça büyük bir ücretli portal:

  • Videoyu, sesi, resimleri dönüştürün.
  • PDF'yi Word, Excel, PowerPoint'e dönüştürün.
  • PDF Bölme.
  • PDF Sıkıştırma, PNG vb.

Çalışma prensibi kesinlikle benzer, ancak daha fazla ayar var. Resimler sürükleyip bırakılabilir.


Birkaç dili ve sonucun kaydedileceği belge türünü belirtebilirsiniz.


Kayıtlı olmayan kullanıcılar tanınma için yalnızca 10 sayfaya erişebilir.
Captcha'ya tıkladıktan sonra "Dönüştür" seçeneğini seçin.


İndir'i tıklayın.


Sonuç tüm beklentileri aştı.


Basit çevrimiçi hizmetlerin aynı zamanda yüksek kalitede tanınma sağlama yeteneğine sahip olduğu ortaya çıktı. Böylece Convertio bu kategorinin açık ara kazananı ilan edildi. Ancak her harika ürün gibi bunun da bir bedeli var.

Bu yüzden çeşitli OCR araçlarına baktık. Ücretsiz olanların yardımcı olabileceği ortaya çıktı, ancak kalite aynı seviyede değil. Yani, sürekli olarak metni çevirmeniz gerekiyorsa basılı form elektronik olarak daha fazlasını dağıtmanız gerekecek.

İyi günler!



© 2024 rupeek.ru -- Psikoloji ve gelişim. İlkokul. Kıdemli sınıflar