/
Modül:OCR

Modül:OCR

https://www.dece.com.tr/geodi-moduller#ocr

GEODI OCR modülü sadece taranmış dokümanlar değil, resimler ve hatta videolar üzerinde çalışabilir. Bu veri kaynakları içindeki yazıları ve Barcode/QRcode ları aranabilir hale getirir.

OCR modülünü kullanabilmeniz için GEODI OCR Modül lisansına ihtiyacınız vardır. GEODI OCR 2 farklı yöntem sunar. İlk yöntem GEODI OCR altyapısını kullanır, diğer yöntem ABBYY motorunu kullanır. ABBYY seçeneği ek lisans ve kullanım başına ücretler gerektirebilir. GEODI OCR motoru başarım olarak daha iyidir ve lisans harici kullanım ücreti gerektirmez.

 

Kaynaklar için OCR işlemini nasıl ayarlarım?

  • OCR yapılmasını istediğiniz her bir kaynak için aşağıdaki ayarları tamamlamanız gereklidir.

    • Taranmış dokümanları SPDF(Aranabilir PDF) haline getirebilirsiniz. SPDF oluşturma ek yer ve zaman gerektirir. Sonucun PDF olması ile aradığınız kelime PDF üzerinde işaretlenir.

    • Çok büyük belgelerin (Taranmış Proje gibi) OCR yapılması da isteğe bağlıdır.

    • Barcode ve QRCode tanınması sağlanabilir.

    • SPDF üretmeniz toplam süreyi %50 civarında arttırabilir.

  • Proje sihirbazı son sayfasında OCR için genel ayarlar yapılmalıdır. Bu ayarlar bütün kaynakları etkiler.

    • OCR için hangi motorun kullanılacağını belirleyebilirsiniz. (GEODI veya ABBYY).

    • Belgeleriniz içinde yer alan dillere göre ek dil ekleyebilirsiniz.

    • Hızlı OCR ile %50-%70 arasında zaman tasarrufu sağlayabilirsiniz. Hızlı OCR ile başarım çok az düşer ama büyük zaman kazanılır.

 

Kaynak için OCR Ayarları

 

Proje geneli için OCR ayarı

 

Gecikmeli OCR

Bu komut taradığınız projede OCR ayarlarını sonradan aktif etmenize olanak sağlar. OCR için Rescan hizmeti başlatır. OCR kullanılan projenin tarama süresi fazla olduğundan, projeyi OCR’sız tara ve OCR ayarlarını aktif edip arka planda OCR’lanmamışları OCR’la diyerek tarama süresinden tasarruf edilir. Bu komut tekrar tekrar OCRlama yapmıyor. Gereksiz dosya versiyonu artırmama odaklı. Komut arayüzden veya DCC ile çalıştırılabilir.

Arayüzde OCR’lanmamışları OCR’la alanında sorgu kriteri yazarak OCR’lanacak içerikleri kısıtlayabilirsiniz.

Projede OCR ayarları aktif değilse OCR’lanmamışları OCR’la komutunun çalışmasına izin vermez. Bir OCR onarım işlemi bitmeden yenisinin başlatılmasına izin vermez.

Komutu çalıştırdığınızda bir mesaj ekranı açılır. “… içerik OCR için incelenecek. İşlem arka planda yapılacak.. Devam etmek istiyor musunuz? Evet/Hayır”

Komutu DCC ile çalıştırmak için d.TryRescanForOCR("wsName","query") yazılması gerekir. “query” yazılması zorunlu değildir.

Dikkat edilecek bir kaç konu

OCR zaman alan bir işlemdir ve bilgisayarları/sunucuları meşgul edebilir. OCR gerektiren çok sayıda belgeniz varsa bu durumu dikkate almalısınız.

En hızlı seçenek Hızlı OCR aktif, SPDF yapma durumudur.

OCR işleminin başarımı belgelerin tarama çözünürlüğüne ve kalitesine bağlıdır. Ozalit veya çok eski belgelerde, cep telefonu ile eğik çekilmiş resimlerde, tam olarak açılmamış kitap gibi eğri görüntülerde başarı düşer.

GEODI OCR modülünün çalışacağı ortamda C++ Runtime 2015-2019 paketi kurulu olmalıdır.

Detay OCR Ayarları

OCR modülünde teknik ayarlar da bulunur. Bu ayarlar GEODI/Settings/Geodi.OCR dizininde OCRSettings.json dosyası içinden ayarlanabilir. Bu dosya hiç ayar yapılmamış ise .sample uzantılıdır. Bu uzantı silinip .json uzantısı ile kaydedilmelidir. İçeriği yazarken json kurallarına uyulmalıdır.

(Bu değişikliklerin uygulanması için GEODI'nin yeniden başlatılması gerekir)

  • "NoSpellCheck": true/false GEODI'nin içinde bulunan sözlükler veya kendi içindeki sözlükler ile yanlış yazılmış kelimelerde düzeltme yapabilir.

  • "NoConnectedWordCheck": true/false satır sonunda kelime yarım kalınca koyulan "-" işaretinin koyulduğu kelimenin anlamını korumasını sağlar. 

  • "NoEnhance": true/false OCR işlemi yapılacak dokümanlarda ki bozuklukları düzeltir. OCR işlemini yapar ve bulduğu karakterleri orjinal sayfanın üstüne koyar.

  • "Quality" değeri dokümanda bulunan resimlerin kalitesi ile ilgilidir. OCR kalitesini değiştirmez. Değer yükseldikçe OCR zamanı ve SPDF boyutu artar.

  • "MaxPageCount" varsayılan 64. OCR yapılacak sayfa sınırlaması. İlk 64 sayfa yapılır diğer sayfalar işleme tabi olmaz. Olduğu gibi eklenir. Değer büyüdükçe işlem zamanı artar.

 

Eğitim Kapsamı

GEODI Kullanıcısı için

  1. OCR nedir, OCR başarımının arama etkisi, beklentiler

  2. OCR yapılacak belge örneklerinin üzerinden geçme

    1. İyi belge , Kirli belge , cep telefonu ile çekilmiş belge, kitap arası, Barcode ve QRCode örneği

    2. Fotoğraf

    3. Video

  3. Sürükle bırak veya diğer veri ekleme yolları ile işlemin kendiliğinden gerçekleşeceğinin anlatımı

  4. barcode tanıma

  5. OCR işlemi performans konusunda farkındalık

Modül:OCR

 

GEODI Yöneticisi için

  1. GEODI-OCR - ABBY Farkı ve Neden GEODI OCR?

    1. Daha iyi

    2. İşlem başına fiyat istemez..

    3. Bu doküman GEODI OCR'ı kapsar

  2. OCR işlem gücü ister

    1. Her şeyi OCR yapalım derseniz uzun sürecek bir işlem başladı demektir.

  3. OCR Kurulumu

    1. Modül:OCR

    2. GEODI Projesinde bir kaynak için OCR'ı aktive etmek

      1. OCR'ı aktive et

      2. Barcode tanımayı aktive et

    3. GEODI Projesinde Genel OCR ayarları

      1. FastOCR ayarı nedir? → Hız

        1. Nasıl yapılır

        2. Etkisi

      2. SPDF ayarı nedir? → Yetenek

        1. Nasıl yapılır

        2. SPDF faydası, olmazsa ne olur?

        3. Etkisi

      3. TIFF’leri neden sileriz/silmeyiz? → Tasarruf

        1. OCR sonrası gerekli değiller, yer tutarlar.

        2. Kullanıcıya mutlaka sor?

  4. Barcode tanıma

  5. Videolar ile OCR

    1. Maske uygulama, neden?

      1. Kamera izlerinin giderilmesi

      2. Kenarların yok edilmesi

      3. Hangi detayları video OCR ile yakalayabiliriz?

  6. Bütün resimleri OCR’laramak istersek

    1. Geometrik bilgi içeren tif dosyalarının, GeoTIFF, SPDF’i oluşmaz.

    2. SPDF dizini ve meta dosyası farkındalığı.

    3. Farklı dillerde OCR konusu.

  7. Soru ve Cevaplar

**