Erzurum Güncel- İndeksleme, belge kolleksiyonları ile ilgili veri tabanlarına çok daha etkin ve verimli ulaşmada kolaylık sağlayıcı 'yeni bir arama motoru' bazındaki çalışmaların sonuna gelindiği bildiridi.
Kullanılmakta olan bilgi miktarının her geçen gün arttığının, bu işlem hızı ve buna bağlı hızlı karar mekanizmalarının etkin çalışması açısından çok önemli bir rol oynadığının, veritabanlarının birincil görevi; belge kolleksiyonlarında bulunan veya bulunamayan bilgileri tek başına toplayabilmiş olması gerektiğin ifadade eden Girne Amerikan Üniversitesi İşletme Fakültesi Dekanı Doç. Dr. Murat Akkaya, “Bu sebep doğrultusunda kurumsal aramanın, bilgiyi alma performansını arttırarak, ek bilgi girdilerinde aşırı yük sorununu beraberinde taşıdığı da bir gerçektir. Geliştirilen motor; arama sonucunu bağımsız olarak filtreleyebilen ve kullanıcı sorgusuyla alakalı bu dökümanları ve uzmanları görüntüleyebilen akıllı bir öneri sistemi geliştirerek yapılmıştır. Arama motorunda tanımlanan uzman listesi, sorgu konusuyla ilgili gerekli bilgiye sahip olan ve bu dokümanları daha önce arayıp okumuş olan kişileri kapsamakta ve bu liste bireylerine ait herhangi bir sorgu sonucunun her seferinde bir öncekine nazaran daha hızlı bir şekilde görüntülenmesini sağlamaktadır. Bu, araştırma eğitim organizasyonlarına odaklanmıştır. Çünkü; günümüzde bilgi, bu tür organizasyonların önemli kaynaklarından biri haline gelmiştir. Bu sebeple; projenin amacı, arama süreçleri sırasında bu tür organizasyonlarda karşılaşılan birçok sorunu çözmek için kullanılabilecek akıllı ve entegre bir bilgi arama sistemi geliştirmek olmuştur” dedi.
'Azra' arama motoru
'Azra' adı verilen bu kurumsal arama motoru, kurumsal aramanın bilgiyi alma performansını arttırarak bilgi aşırı yük sorununu gidermektede olduğununa dikkat çeken Doç. Dr. Akkaya ,Motor; arama sonucunu bağımsız olarak filtreleyebilen ve kullanıcı sorgusuyla alakalı bu dökümanları ve uzmanları görüntüleyebilen akıllı bir öneri sistemi geliştirerek yapıldığını ifade etti.
'Azra' arama motoru nasıl geliştirildi?
‘Azra’ arma motronun nasıl geliştirildiğini anlatan Doç. Dr. Murat Akkaya, doktora öğrencimiz Khalid Awad Altarawneh tarafından, "Yönetim Bilişim Sistemleri" dalında ; An Intelligent Recommender System based on Collaborative Filtering for Enterprise Information Search for Educational Environment isimli tez başlığı ile Lucene'ye dayalı, özellikle arama işlemlerinde kullanıcılardan gelen açık ve net geri bildirimleri yakalayarak performanslarını belirleyen akıllı 'Fuzzy Yaklaşımı' olarak geliştirilmiştir. Sistemin döküman toplama sürecindeki kullandığı indeksleme; 'Lucene.net' tarafından yapılırken, arama uygulaması, bir veri tabanı aracılığıyla güçlü bir bağ halinde bütünleştirilmiştir. Raporlama işlemi, oldukça verimli, ölçeklenebilir, özelleştirilmiş bir arama aracı olan Lucene kullanılarak oluşturulmuştur. Oluşturulan arama aracı; veritabanlarını, PDF belgelerini, sözcük belgelerini, RTF, PPT uzantılı belgeleri, XLS belgelerini ve metin dosyalarını indeksleme ve bu belgeler üzerinden arama yapma yeteneğine sahiptir. Ayrıca kurumsal arama motoru, C # temelli dizin oluşturma, arama teknolojisi ile yazım denetimi, vurgulama ve gelişmiş analiz / simgeleşme yeteneklerine de sahip olacak şekilde tasarlanmıştır. Solr, XML / HTTP ve JSON / Python / Ruby API'leri ile vurgulama, yön bulma, önbellekleme, çoğaltma ve web yönetici arayüzü ile Lucene Core kullanılarak oluşturulmuş yüksek performanslı bir arama sunucusudur. 'Azra' arama sistemi; dizin oluşturmak, bu dizinleri doldurmak ve bu dizinlerde aramak için altyapısında 'Lucene' kullanılmış bir sistemdir. Sistem çıktılarının açıklık kazanması için, bilgi çekme ifadeleri, istisna işleme ve örnekleme programdan çıkarılmıştır. Bu sistemde, arama dizini büyük dosya sisteminde depolanmıştır (dizinleri herhangi bir yere, örneğin bellekte veya veritabanında depolamak mümkündür).Son olarak; bahsi geçen uygulama, tabanda 'Lucene' kullanılarak geliştirilmiş olup, dizin oluşturma ile arama gibi kriterler baz alındığında doğruluk seviyesi en az yüzde 89 olarak ölçülmüştür. Bu uygulama, yapılandırılmamış belgelerden bilgi alımını ve yapılandırılmış bilgi için, geleneksel veritabanı sorgulamasını entegre olarak kullanma, yapılandırılmamış belgeler için de, çeşitli dosya formatlarını dizine ekleyebilme ile çeşitli uygulamalarda arama yapabilme sahiptir. 'Lucene’in taşınabilirliği ve ölçeklendirilebilirliği sayesinde, bahsi geçen sistem son derece özelleştirilebilir bir yapıya sahip olmakla birlikte, 'wild card' aramaları gibi çeşitli anahtar kelime arama sorgularını da desteklemektedir”diye konuştu.