İnternetteki makaleler ve diğer çevrimiçi yazılar gibi içerik miktarı her geçen gün hızla artmaktadır. Bu nedenle, en iyi arama motorlarının bile kullanıcıların isteklerine tam olarak doğru cevapları bulmakta zorlandığı görülmektedir. Kullanıcıların istediği sonuçlar genellikle birden farklı makalelere yayılmış durumdadır ve bu da geleneksel arama motorlarının istenenleri bulmasını imkânsız hale getirmektedir. Mevcut sistemlerdeki mevcut sorun, bilgi erişimi (IR) kısmıdır. Mevcut modeller, belirli bir sayıda belge alırken ilgili bağlamı atlayarak hareket etmektedir. IR için, K-means kümeleme yöntemi ve Random forest sınıflandırıcısı ile TF-IDF benzerlik kısmına küçültülmüş bağlam değerleri eklenmiştir. Bu model, belge kurtarma kısmında yaklaşık %84'lük bir performans elde etmektedir. İkinci kısım olan okuma-anlama (RC) kısmı için ise, deepset'ten pre-trained roberta-base-squad2 isimli hugging face kütüphanesi kullanılmıştır.
Eser Adı (dc.title) | Açık Kaynak Soru-Cevap Sistemi |
Eser Sahibi (dc.contributor.author) | Erdoğan Ege ALTIN |
Tez Danışmanı (dc.contributor.advisor) | AYTUĞ ONAN |
Yayıncı (dc.publisher) | İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü |
Tür (dc.type) | Diğer |
Açıklama (dc.description) | Yüksek Lisans Bitirme Projesi |
Özet (dc.description.abstract) | İnternetteki makaleler ve diğer çevrimiçi yazılar gibi içerik miktarı her geçen gün hızla artmaktadır. Bu nedenle, en iyi arama motorlarının bile kullanıcıların isteklerine tam olarak doğru cevapları bulmakta zorlandığı görülmektedir. Kullanıcıların istediği sonuçlar genellikle birden farklı makalelere yayılmış durumdadır ve bu da geleneksel arama motorlarının istenenleri bulmasını imkânsız hale getirmektedir. Mevcut sistemlerdeki mevcut sorun, bilgi erişimi (IR) kısmıdır. Mevcut modeller, belirli bir sayıda belge alırken ilgili bağlamı atlayarak hareket etmektedir. IR için, K-means kümeleme yöntemi ve Random forest sınıflandırıcısı ile TF-IDF benzerlik kısmına küçültülmüş bağlam değerleri eklenmiştir. Bu model, belge kurtarma kısmında yaklaşık %84'lük bir performans elde etmektedir. İkinci kısım olan okuma-anlama (RC) kısmı için ise, deepset'ten pre-trained roberta-base-squad2 isimli hugging face kütüphanesi kullanılmıştır. |
Kayıt Giriş Tarihi (dc.date.accessioned) | 2023-07-12 |
Açık Erişim Tarihi (dc.date.available) | 2023-07-12 |
Yayın Tarihi (dc.date.issued) | 2023 |
Tek Biçim Adres (dc.identifier.uri) | https://hdl.handle.net/11469/3463 |
Yayın Dili (dc.language.iso) | tr |
Konu Başlıkları (dc.subject) | Makine öğrenmesi |
Konu Başlıkları (dc.subject) | derin öğrenme |