Kopya veya Benzer İçerikleri Arama
Kopyaları Ara
Genellikle organizasyondaki belgelerin %40’I kopyalardan oluşur. Kopyalar karışıklığa neden olur ve aramaları zorlaştırır. GEODI bunları bulur ve ortadan kaldırmanıza yardımcı olur.
Kopya yazmanız kopyası olan tüm dokümanları bulacaktır. -kopya ile kopyası olmayanları bulursunuz.
kopya | duplicate → kopyası olanlar
kopya:(geodi sorgusu) → sorguya uyan içeriklerin kopyaları
-kopya → (kopyası olmayanlar)
kopya:(doc:a.pdf) → (a.pdf’in kopyalarını bul)
kopya:"10 ada 20 Parsel Yapı Ruhsatı" (ilgili ifadeyi içeren ilk dokümanın kopyaları)
Kopyaların ayrıştırılması
Kopya içerikler fazla yere yayılmış olabilir. Bir dosyanın onlarca kopyası olabilir. Bunlar aynı kaynakta olabilceği gibi, farklı kaynaklara dağılmış da olabilir.
Kopya kavramını bir içeriğin yedeği, başka yerlerde “gereksiz” şekilde oluşmuş halleri olarak değerlendiriyoruz. Aynı içeriği sakladınız, sonra adını değiştirip yeniden saklandınız, e-posta ekinde size başka yerden geldi, bir PDF bir tane de DOCX hali var ama tümündeki metinler birbirinin aynısı. Amacımız bunlar arasında bir tanesi(Buna orijinal diyoruz) kalacak şekilde seçmek ve imha veya diğer aksiyonlara tabii tutmaktır. Kopya kavramı imaj/resim için de geçerlidir.
Bir kaç soruya yanıt verebilirsek kopya içeriklerden daha kolay kurturtuluruz.
Eğer kopyaları imha etmek istersek hangi dosyalar kalacak? Bu imha edilecekleri seçmemiz, korumak istediğimiz dosyaları dışarıda bırakmamız gerekli.
Hangisi orijinal, yani en gerekli olan hangisi? Orijinali nasıl belirleriz? Kaynak veya Tarih veya başka bir kriter olabilir mi?
Bu amaçla duplicate2: ve original2: sorgularını kullanabilirsiniz. Bu 2 sorgu birbirinin eşleniğidir. Hedef içerik kümesi içinde birisi kopyaları, diğeri de orijinalleri seçer. Bir içerikten 10 kopya olduğunu varsayalım. kopya2 9 tane, original2 ise her zaman 1 tane seçer. Orijinalin hangisi olduğunu ise aşağıda belirtilen seçenekler ile belirlersiniz.
duplicate2:(order:New|Old)
duplicate2:(i:Source,Source2,..)
duplicate2:(ni:Source,Source2,..)
order → Öneml, Önemsiz kaynaklar belirtilmemişse kopyalar arasında hangisinin kopya olduğunu belirler. Old derseniz eskiler kopya varsayılır, New derseniz yeniler kopyadır. Eğer kaynak listesi belirtirseniz bu sıra ile hangisinin kopya olduğu belirlenir.
i: Önemli/Important anlamındadır ve başka bir yerde kopyası/yedeği varsa belirtilen kaynaklardakiler kalsın, diğerleri gitsin anlamındadır.
ni: Önemsiz/Not Important anlamındadır ve başka bir yerde kopyası varsa silebilirsin demektir.
original2:(order:New|Old)
original2:(i:Source,Source2,..)
original2:(ni:Source,Source2,..)
Bu sorgu kopya2 sorgusunun tam eşleniğidir. Yani kopya2 sorgusunun kopya olarak niteledikleri yer almaz sadece orijinaller kalır. Sorgu parametreleri kopya2 sorgusu gibi yorumlanmalıdır. Yani order:New derseniz yeniler kopya sayılır, eskiler orijinal olarak kalırlar.
Bir içeriğin 10 kopyası varsa orijinal her zaman içlerinden bir tanesini getirir.
Benzerleri Ara
benzer:(doc:a.pdf) | similar:(doc:a.pdf)
benzer:”Ankara Kalesi" (ankara kalesi geçen ilk dokümanın benzerleri)
GEODI metin ve resim içerikler arasında benzerlikleri bulur. Verdiğiniz bir resmin veya metnin benzerlerini listeler.
Kopya ve Benzer dokümanlar GEODI arama arayüzünde ve görüntüleyiciler içinde de gösterilir.
Benzerlik aramasında ek olarak aşağıdaki ifadeleri kullanabilirsiniz:
maxcount:<n> - ile dönecek benzer sayısı kısıtlanabilir.
minsimilarity:0.7 - ile benzerlik oranı değiştirilebilir. Varsayılanda=0.7.
excludeDuplicates:true ile kopyalar sonuçtan çıkarılabilir. Varsayılan=false.
Benzerlerin Ayrıştırılması
Pek çok benzer içerisinden arama yerine benzerler arasından tek bir tanesini bulmak istersiniz. Bu yetenek arama deneyimin iyileştirir. Ayrıca “gereksiz” içerikleri imha/karantina gibi bir işlem ile tamamen yok etmenize de yardım eder.
benzer2 benzerler arasında tek bir tanesini getirir. Bu işelmi kopyalar için original2 sorgusu yapar.
benzer2 → %70 üzerinde benzer olanlardan bir tanesi gelir.
benzer2:(distance:0.9) → %90 üzeri benzerlerden bir tanesi gelir.
benzer2:(<sorgu>) sorguya girenler içinde benzer olanlardan bir tanesi gelir.
benzer2:(getnonsimilar:true) ile benzeri olmayanlar da sorguya girerler.