Çoklu Veri Depo Ortamını Kullanan Alana Özgü Varlık Bağlama Yaklaşımı


Creative Commons License

İNAN E. , YÖNYÜL B. , Tekbacak F.

Akıllı Sistemler ve Uygulamaları Dergisi, cilt.1, ss.46-52, 2018 (Hakemli Üniversite Dergisi)

  • Cilt numarası: 1 Konu: 1
  • Basım Tarihi: 2018
  • Dergi Adı: Akıllı Sistemler ve Uygulamaları Dergisi
  • Sayfa Sayıları: ss.46-52

Özet

Web üzerindeki verilerin çoğu yapısal olmayan bir halde bulunmaktadır ve bu nedenle makinelerin işleyebileceği bir yapıya dönüştürülmesi gerekmektedir. Dolayısıyla yapısal olmayan bu verilerin öncelikle gereksinime göre yapısallaştırılması ve kullanım durumlarını dikkate alarak farklı veri modellerinde saklanması uygun olacaktır. Gereksinimler ve çeşitleri arttıkça tek bir yöntem hepsini çözmede yetersiz kalmaktadır. Buna göre farklı saklama ihtiyaçlarını karşılayan tek bir saklama teknolojisinin kullanılması da uygun olmayacaktır. Farklı tipte şemaya sahip depoların (store) birlikte ve bütünleşik olarak yönetilmesi veritabanı literatüründe multistore ve polystore (çoklu depo) olarak ifade edilmektedir. Bu çalışma kapsamında Varlık Bağlama problemi üzerinde durularak veriler yapısallaştırılacak ve bu veriler farklı veri modellerinde bütünleşik bir ortamda yönetilecektir. Son olarak bütünleştirilmiş bu büyük veri ortamı sorgulanacak ve yöntem belirlenerek incelenecektir.

Most of the data on the web is non-structural, and it is required that the data should be transformed into a machine operable structure. Therefore, it is appropriate to convert the unstructured data into a structured form according to the requirements and to store those data in different data models by considering use cases. As requirements and their types increase, it fails using one approach to perform on all. Thus, it is not suitable to use a single storage technology to carry out all storage requirements. Managing stores with various type of schemas in a joint and an integrated manner is named as “multistore” and “polystore” in the database literature. In this paper, Entity Linking task is leveraged to transform texts into well-formed data and this data is managed by an integrated environment of different data models. Finally, this integrated big data environment will be queried and be examined by presenting the method.