Nefret söylemi, belirli kişi ya da gruplara yönelik olarak ait oldukları kimlik nedeniyle aşağılama, ayrımcılık veya ötekileştirme içeren her türlü davranış, yazı veya konuşma olarak tanımlanmaktadır. Türkiye, Suriye iç savaşı sonrası yoğun bir göç almış ve bu süreçte mültecilere karşı nefret söyleminin yükseldiği gözlenmiştir. Nefret söylemi özellikle sosyal medyada hızla yayılabilmektedir. Nefret söyleminin kolaylıkla şiddet eylemlerine dönüşebileceği göz önüne alındığında, sosyal medya üzerinde tespit edilerek yayılımının engellenmesinin önemi ortaya çıkmaktadır. Bu çalışmada Twitter üzerindeki veriler kullanılmış ve araştırmanın ilk aşamasında mültecilere yönelik nefret söyleminin tespiti için 9778 tweet içeren bir veri seti oluşturulmuştur. Bu veri seti üzerinde öncelikle makine öğrenmesi modelleri (Lojistik Regresyon, Destek Vektör Makineleri, Karar Ağaçları, Rastgele Orman ve Yapay Sinir Ağları), Word2Vec ve TF-IDF kelime temsil yöntemleri ile uygulanmıştır. Makine öğrenmesi modelleri arasında en iyi performansın TF-IDF kelime temsil yöntemi ile uygulanan Lojistik Regresyon, Destek Vektör Makineleri ve Rastgele Orman ile elde edildiği ve 0.81 doğruluk değerine ulaşıldığı görülmüştür. Sonraki aşamada BERT tabanlı bir model olan BERTurk ile farklı hiperparametreler kullanılarak yürütülen deneysel çalışmalar sonucu, 0.85 doğruluk değerine ulaşılmıştır. Araştırmanın mültecilere yönelik nefret söyleminin tespiti konusunda yürütülen çalışmalara katkısının olacağı düşünülmektedir. Anahtar Sözcükler: Metin madenc
Eser Adı (dc.title) | Sosyal Ağlar Üzerinde Mültecilere Yönelik Nefret Söyleminin Metin Madenciliğine Dayalı Tespiti |
Eser Sahibi (dc.contributor.author) | Figen Eğin |
Tez Danışmanı (dc.contributor.advisor) | Vahide Bulut |
Yayıncı (dc.publisher) | İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü |
Tür (dc.type) | Yüksek Lisans |
Özet (dc.description.abstract) | Nefret söylemi, belirli kişi ya da gruplara yönelik olarak ait oldukları kimlik nedeniyle aşağılama, ayrımcılık veya ötekileştirme içeren her türlü davranış, yazı veya konuşma olarak tanımlanmaktadır. Türkiye, Suriye iç savaşı sonrası yoğun bir göç almış ve bu süreçte mültecilere karşı nefret söyleminin yükseldiği gözlenmiştir. Nefret söylemi özellikle sosyal medyada hızla yayılabilmektedir. Nefret söyleminin kolaylıkla şiddet eylemlerine dönüşebileceği göz önüne alındığında, sosyal medya üzerinde tespit edilerek yayılımının engellenmesinin önemi ortaya çıkmaktadır. Bu çalışmada Twitter üzerindeki veriler kullanılmış ve araştırmanın ilk aşamasında mültecilere yönelik nefret söyleminin tespiti için 9778 tweet içeren bir veri seti oluşturulmuştur. Bu veri seti üzerinde öncelikle makine öğrenmesi modelleri (Lojistik Regresyon, Destek Vektör Makineleri, Karar Ağaçları, Rastgele Orman ve Yapay Sinir Ağları), Word2Vec ve TF-IDF kelime temsil yöntemleri ile uygulanmıştır. Makine öğrenmesi modelleri arasında en iyi performansın TF-IDF kelime temsil yöntemi ile uygulanan Lojistik Regresyon, Destek Vektör Makineleri ve Rastgele Orman ile elde edildiği ve 0.81 doğruluk değerine ulaşıldığı görülmüştür. Sonraki aşamada BERT tabanlı bir model olan BERTurk ile farklı hiperparametreler kullanılarak yürütülen deneysel çalışmalar sonucu, 0.85 doğruluk değerine ulaşılmıştır. Araştırmanın mültecilere yönelik nefret söyleminin tespiti konusunda yürütülen çalışmalara katkısının olacağı düşünülmektedir. Anahtar Sözcükler: Metin madenc |
Kayıt Giriş Tarihi (dc.date.accessioned) | 2023-07-14 |
Açık Erişim Tarihi (dc.date.available) | 2024-01-24 |
Yayın Tarihi (dc.date.issued) | 2023 |
Yayın Dili (dc.language.iso) | tr |
Konu Başlıkları (dc.subject) | Metin madenciliği |
Konu Başlıkları (dc.subject) | nefret söyleminin tespiti |
Tek Biçim Adres (dc.identifier.uri) | https://hdl.handle.net/11469/3482 |