Modül:OCR
https://www.dece.com.tr/geodi-moduller#ocr
GEODI OCR modülü sadece taranmış dokümanlar değil, resimler ve hatta videolar üzerinde çalışabilir. Bu veri kaynakları içindeki yazıları ve Barcode/QRcode ları aranabilir hale getirir.
OCR modülünü kullanabilmeniz için GEODI OCR Modül lisansına ihtiyacınız vardır. GEODI OCR 2 farklı yöntem sunar. İlk yöntem GEODI OCR altyapısını kullanır, diğer yöntem ABBYY motorunu kullanır. ABBYY seçeneği ek lisans ve kullanım başına ücretler gerektirebilir. GEODI OCR motoru başarım olarak daha iyidir ve lisans harici kullanım ücreti gerektirmez.
Kaynaklar için OCR işlemini nasıl ayarlarım?
OCR yapılmasını istediğiniz her bir kaynak için aşağıdaki ayarları tamamlamanız gereklidir.
Taranmış dokümanları SPDF(Aranabilir PDF) haline getirebilirsiniz. SPDF oluşturma ek yer ve zaman gerektirir. Sonucun PDF olması ile aradığınız kelime PDF üzerinde işaretlenir.
Çok büyük belgelerin (Taranmış Proje gibi) OCR yapılması da isteğe bağlıdır.
Barcode ve QRCode tanınması sağlanabilir.
SPDF üretmeniz toplam süreyi %50 civarında arttırabilir.
Proje sihirbazı son sayfasında OCR için genel ayarlar yapılmalıdır. Bu ayarlar bütün kaynakları etkiler.
OCR için hangi motorun kullanılacağını belirleyebilirsiniz. (GEODI veya ABBYY).
Belgeleriniz içinde yer alan dillere göre ek dil ekleyebilirsiniz.
Hızlı OCR ile %50-%70 arasında zaman tasarrufu sağlayabilirsiniz. Hızlı OCR ile başarım çok az düşer ama büyük zaman kazanılır.
Kaynak için OCR Ayarları
Proje geneli için OCR ayarı
Gecikmeli OCR
Bu komut taradığınız projede OCR ayarlarını sonradan aktif etmenize olanak sağlar. OCR için Rescan hizmeti başlatır. OCR kullanılan projenin tarama süresi fazla olduğundan, projeyi OCR’sız tara ve OCR ayarlarını aktif edip arka planda OCR’lanmamışları OCR’la diyerek tarama süresinden tasarruf edilir. Bu komut tekrar tekrar OCRlama yapmıyor. Gereksiz dosya versiyonu artırmama odaklı. Komut arayüzden veya DCC ile çalıştırılabilir.
Arayüzde OCR’lanmamışları OCR’la alanında sorgu kriteri yazarak OCR’lanacak içerikleri kısıtlayabilirsiniz.
Projede OCR ayarları aktif değilse OCR’lanmamışları OCR’la komutunun çalışmasına izin vermez. Bir OCR onarım işlemi bitmeden yenisinin başlatılmasına izin vermez.
Komutu çalıştırdığınızda bir mesaj ekranı açılır. “… içerik OCR için incelenecek. İşlem arka planda yapılacak.. Devam etmek istiyor musunuz? Evet/Hayır”
Komutu DCC ile çalıştırmak için d.TryRescanForOCR("wsName","query")
yazılması gerekir. “query” yazılması zorunlu değildir.
Dikkat edilecek bir kaç konu
OCR zaman alan bir işlemdir ve bilgisayarları/sunucuları meşgul edebilir. OCR gerektiren çok sayıda belgeniz varsa bu durumu dikkate almalısınız.
En hızlı seçenek Hızlı OCR aktif, SPDF yapma durumudur.
OCR işleminin başarımı belgelerin tarama çözünürlüğüne ve kalitesine bağlıdır. Ozalit veya çok eski belgelerde, cep telefonu ile eğik çekilmiş resimlerde, tam olarak açılmamış kitap gibi eğri görüntülerde başarı düşer.
GEODI OCR modülünün çalışacağı ortamda C++ Runtime 2015-2019 paketi kurulu olmalıdır.
Detay OCR Ayarları
OCR modülünde teknik ayarlar da bulunur. Bu ayarlar GEODI/Settings/Geodi.OCR dizininde OCRSettings.json dosyası içinden ayarlanabilir. Bu dosya hiç ayar yapılmamış ise .sample uzantılıdır. Bu uzantı silinip .json uzantısı ile kaydedilmelidir. İçeriği yazarken json kurallarına uyulmalıdır.
(Bu değişikliklerin uygulanması için GEODI'nin yeniden başlatılması gerekir)
"NoSpellCheck": true/false GEODI'nin içinde bulunan sözlükler veya kendi içindeki sözlükler ile yanlış yazılmış kelimelerde düzeltme yapabilir.
"NoConnectedWordCheck": true/false satır sonunda kelime yarım kalınca koyulan "-" işaretinin koyulduğu kelimenin anlamını korumasını sağlar.
"NoEnhance": true/false OCR işlemi yapılacak dokümanlarda ki bozuklukları düzeltir. OCR işlemini yapar ve bulduğu karakterleri orjinal sayfanın üstüne koyar.
"Quality" değeri dokümanda bulunan resimlerin kalitesi ile ilgilidir. OCR kalitesini değiştirmez. Değer yükseldikçe OCR zamanı ve SPDF boyutu artar.
"MaxPageCount" varsayılan 64. OCR yapılacak sayfa sınırlaması. İlk 64 sayfa yapılır diğer sayfalar işleme tabi olmaz. Olduğu gibi eklenir. Değer büyüdükçe işlem zamanı artar.
Eğitim Kapsamı
GEODI Kullanıcısı için
OCR nedir, OCR başarımının arama etkisi, beklentiler
OCR yapılacak belge örneklerinin üzerinden geçme
İyi belge , Kirli belge , cep telefonu ile çekilmiş belge, kitap arası, Barcode ve QRCode örneği
Fotoğraf
Video
Sürükle bırak veya diğer veri ekleme yolları ile işlemin kendiliğinden gerçekleşeceğinin anlatımı
barcode tanıma
OCR işlemi performans konusunda farkındalık
GEODI Yöneticisi için
GEODI-OCR - ABBY Farkı ve Neden GEODI OCR?
Daha iyi
İşlem başına fiyat istemez..
Bu doküman GEODI OCR'ı kapsar
OCR işlem gücü ister
Her şeyi OCR yapalım derseniz uzun sürecek bir işlem başladı demektir.
OCR Kurulumu
GEODI Projesinde bir kaynak için OCR'ı aktive etmek
OCR'ı aktive et
Barcode tanımayı aktive et
GEODI Projesinde Genel OCR ayarları
FastOCR ayarı nedir? → Hız
Nasıl yapılır
Etkisi
SPDF ayarı nedir? → Yetenek
Nasıl yapılır
SPDF faydası, olmazsa ne olur?
Etkisi
TIFF’leri neden sileriz/silmeyiz? → Tasarruf
OCR sonrası gerekli değiller, yer tutarlar.
Kullanıcıya mutlaka sor?
Barcode tanıma
Videolar ile OCR
Maske uygulama, neden?
Kamera izlerinin giderilmesi
Kenarların yok edilmesi
Hangi detayları video OCR ile yakalayabiliriz?
Bütün resimleri OCR’laramak istersek
Geometrik bilgi içeren tif dosyalarının, GeoTIFF, SPDF’i oluşmaz.
SPDF dizini ve meta dosyası farkındalığı.
Farklı dillerde OCR konusu.
Soru ve Cevaplar
**