Dağıtık bağlı veri sorgulama motorlarında performans yönetimi


Öğrenci: BURAK YÖNYÜL

Danışman: Rıza Cenk Erdur

Bağlı veri ilkeleri ile veb, sayısı her geçen gün artan dağıtık ve birbirine bağlı veri kümelerinin tek bir veritabanı gibi sorgulanabileceği bir veri uzayına dönüşmüştür. Sorguyu kullanıcıların yerine, bu veri kümeleri üzerine dağıtan ve etkin şekilde sorgulayan birleştirilmiş sorgu motorları ile bu veriden çok daha iyi şekilde yararlanılabilmektedir. Bu tez kapsamında VOID üstverilerini kullanan birleştirilmiş SPARQL sorgulama motoru olan WoDQA üzerinde gerçekleştirilen performans iyileştirme yöntemleri anlatılmaktadır. WoDQA birbirine bağlı veri kümelerinin üstverisini ve üçlü desenleri arasındaki ilişkileri, veri kümesi seçim yöntemine dahil eder. Tez kapsamında WoDQA'nın oluşturduğu birleştirilmiş sorgunun eniyileştirilmesi için sezgisel yöntemler kullanılmıştır ve eniyileştirilen bu sorgunun etkin ve hızlı bir şekilde çalıştırılıp sonuçların da hızlıca elde edilmesi için SPARQL FILTER tabanlı bağlı birleştirme yöntemi uygulanmıştır. Bu yaklaşımlar FedBench değerlendirme kütüphanesi ile değerlendirilmiş ve WoDQA'nın seçim ve işletim yaklaşımları üzerinde olumlu etkisi ortaya konmuştur. Ayrıca birleştirilmiş SPARQL sorgu doğasına uygun bir SPARQL önbellekleme mimarisi gerçekleştirilmiştir. Mimaride SPARQL sorgularının cevapları üçlüler olarak, her bir üçlünün bellekte yalnızca bir kez yer alacağı şekilde tutulmaktadır. Böylece önbellek etkin olarak yönetilerek sorgular hızlıca çalıştırılabilmektedir. Önbellek mimarisi tekil ve birleştirilmiş SPARQL sorguları ile deneysel olarak değerlendirilmiş ve WoDQA'nın performansına olan iyileştirici etkisi ortaya konmuştur.