Günümüzde kısa mesaj(SMS) üzerinden iletişim kurmak yaygınlaşmıştır. Bu yaygınlaşmanın sonucu olarak gelen kutusundaki kısa mesaj sayısı oldukça artmıştır. Zaman zaman hatalı sınıflandırmalar olsa da günümüzde telefonlarda ki istenmeyen(spam) mesaj filtereleri oldukça başarılı şekilde çalışmaktadır. Bu çalışma kapsamında UCI platformunda paylaşılmış olan SMS Spam Collection adındaki veri seti kullanılarak metin sınıflandırma işlemi gerçekleştirilecektir. Veri seti üzerinde metin ön işleme adımları uygulanacaktır. Makine öğrenmesi modelleri olarak Karar Destek Vektörü, Rastgele Orman, Multinominal Naive Bayes, Karar Ağacı, K-En Yakın Komşu kullanılacaktır. Makine öğrenmesi algoritmalarında hiper parametre seçimi yapılmıştır. Çapraz doğrulama k=10 seçildiği durumda Karar Destek Vektörü ile %98 oranında doğru sınıflandırma başarımı gözlemlenmiştir.
Eser Adı (dc.title) | Mesaj Metinlerinin Sınıflandırılması |
Eser Sahibi (dc.contributor.author) | Caner GÜLCAN |
Yayıncı (dc.publisher) | İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü |
Esere Katkı Sağlayan (dc.contributor.other) | AYTUĞ ONAN |
Tür (dc.type) | Diğer |
Açıklama (dc.description) | Yüksek Lisans Bitirme Projesi |
Özet (dc.description.abstract) | Günümüzde kısa mesaj(SMS) üzerinden iletişim kurmak yaygınlaşmıştır. Bu yaygınlaşmanın sonucu olarak gelen kutusundaki kısa mesaj sayısı oldukça artmıştır. Zaman zaman hatalı sınıflandırmalar olsa da günümüzde telefonlarda ki istenmeyen(spam) mesaj filtereleri oldukça başarılı şekilde çalışmaktadır. Bu çalışma kapsamında UCI platformunda paylaşılmış olan SMS Spam Collection adındaki veri seti kullanılarak metin sınıflandırma işlemi gerçekleştirilecektir. Veri seti üzerinde metin ön işleme adımları uygulanacaktır. Makine öğrenmesi modelleri olarak Karar Destek Vektörü, Rastgele Orman, Multinominal Naive Bayes, Karar Ağacı, K-En Yakın Komşu kullanılacaktır. Makine öğrenmesi algoritmalarında hiper parametre seçimi yapılmıştır. Çapraz doğrulama k=10 seçildiği durumda Karar Destek Vektörü ile %98 oranında doğru sınıflandırma başarımı gözlemlenmiştir. |
Kayıt Giriş Tarihi (dc.date.accessioned) | 2024-07-05 |
Açık Erişim Tarihi (dc.date.available) | 2024-07-05 |
Yayın Tarihi (dc.date.issued) | 2024 |
Tek Biçim Adres (dc.identifier.uri) | https://hdl.handle.net/11469/4103 |
Yayın Dili (dc.language.iso) | tr |
Konu Başlıkları (dc.subject) | Metin Sınıflandırma |
Konu Başlıkları (dc.subject) | Metin madenciliği |
Haklar (dc.rights) | Open access |