Mesaj Metinlerinin Sınıflandırılması

Günümüzde kısa mesaj(SMS) üzerinden iletişim kurmak yaygınlaşmıştır. Bu yaygınlaşmanın sonucu olarak gelen kutusundaki kısa mesaj sayısı oldukça artmıştır. Zaman zaman hatalı sınıflandırmalar olsa da günümüzde telefonlarda ki istenmeyen(spam) mesaj filtereleri oldukça başarılı şekilde çalışmaktadır. Bu çalışma kapsamında UCI platformunda paylaşılmış olan SMS Spam Collection adındaki veri seti kullanılarak metin sınıflandırma işlemi gerçekleştirilecektir. Veri seti üzerinde metin ön işleme adımları uygulanacaktır. Makine öğrenmesi modelleri olarak Karar Destek Vektörü, Rastgele Orman, Multinominal Naive Bayes, Karar Ağacı, K-En Yakın Komşu kullanılacaktır. Makine öğrenmesi algoritmalarında hiper parametre seçimi yapılmıştır. Çapraz doğrulama k=10 seçildiği durumda Karar Destek Vektörü ile %98 oranında doğru sınıflandırma başarımı gözlemlenmiştir.

Erişime Açık
Görüntülenme
1
05.07.2024 tarihinden bu yana
İndirme
1
05.07.2024 tarihinden bu yana
Son Erişim Tarihi
24 Temmuz 2024 11:13
Google Kontrol
Tıklayınız
Tam Metin
Tam Metin İndirmek için tıklayın Ön izleme
Detaylı Görünüm
Eser Adı
(dc.title)
Mesaj Metinlerinin Sınıflandırılması
Eser Sahibi
(dc.contributor.author)
Caner GÜLCAN
Yayıncı
(dc.publisher)
İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü
Esere Katkı Sağlayan
(dc.contributor.other)
AYTUĞ ONAN
Tür
(dc.type)
Diğer
Açıklama
(dc.description)
Yüksek Lisans Bitirme Projesi
Özet
(dc.description.abstract)
Günümüzde kısa mesaj(SMS) üzerinden iletişim kurmak yaygınlaşmıştır. Bu yaygınlaşmanın sonucu olarak gelen kutusundaki kısa mesaj sayısı oldukça artmıştır. Zaman zaman hatalı sınıflandırmalar olsa da günümüzde telefonlarda ki istenmeyen(spam) mesaj filtereleri oldukça başarılı şekilde çalışmaktadır. Bu çalışma kapsamında UCI platformunda paylaşılmış olan SMS Spam Collection adındaki veri seti kullanılarak metin sınıflandırma işlemi gerçekleştirilecektir. Veri seti üzerinde metin ön işleme adımları uygulanacaktır. Makine öğrenmesi modelleri olarak Karar Destek Vektörü, Rastgele Orman, Multinominal Naive Bayes, Karar Ağacı, K-En Yakın Komşu kullanılacaktır. Makine öğrenmesi algoritmalarında hiper parametre seçimi yapılmıştır. Çapraz doğrulama k=10 seçildiği durumda Karar Destek Vektörü ile %98 oranında doğru sınıflandırma başarımı gözlemlenmiştir.
Kayıt Giriş Tarihi
(dc.date.accessioned)
2024-07-05
Açık Erişim Tarihi
(dc.date.available)
2024-07-05
Yayın Tarihi
(dc.date.issued)
2024
Tek Biçim Adres
(dc.identifier.uri)
https://hdl.handle.net/11469/4103
Yayın Dili
(dc.language.iso)
tr
Konu Başlıkları
(dc.subject)
Metin Sınıflandırma
Konu Başlıkları
(dc.subject)
Metin madenciliği
Haklar
(dc.rights)
Open access
Analizler
Yayın Görüntülenme
Yayın Görüntülenme
Erişilen ülkeler
Erişilen şehirler
6698 sayılı Kişisel Verilerin Korunması Kanunu kapsamında yükümlülüklerimiz ve çerez politikamız hakkında bilgi sahibi olmak için alttaki bağlantıyı kullanabilirsiniz.

creativecommons
Bu site altında yer alan tüm kaynaklar Creative Commons Alıntı-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.
Platforms