Sosyal Ağlar Üzerinde Mültecilere Yönelik Nefret Söyleminin Metin Madenciliğine Dayalı Tespiti

Nefret söylemi, belirli kişi ya da gruplara yönelik olarak ait oldukları kimlik nedeniyle aşağılama, ayrımcılık veya ötekileştirme içeren her türlü davranış, yazı veya konuşma olarak tanımlanmaktadır. Türkiye, Suriye iç savaşı sonrası yoğun bir göç almış ve bu süreçte mültecilere karşı nefret söyleminin yükseldiği gözlenmiştir. Nefret söylemi özellikle sosyal medyada hızla yayılabilmektedir. Nefret söyleminin kolaylıkla şiddet eylemlerine dönüşebileceği göz önüne alındığında, sosyal medya üzerinde tespit edilerek yayılımının engellenmesinin önemi ortaya çıkmaktadır. Bu çalışmada Twitter üzerindeki veriler kullanılmış ve araştırmanın ilk aşamasında mültecilere yönelik nefret söyleminin tespiti için 9778 tweet içeren bir veri seti oluşturulmuştur. Bu veri seti üzerinde öncelikle makine öğrenmesi modelleri (Lojistik Regresyon, Destek Vektör Makineleri, Karar Ağaçları, Rastgele Orman ve Yapay Sinir Ağları), Word2Vec ve TF-IDF kelime temsil yöntemleri ile uygulanmıştır. Makine öğrenmesi modelleri arasında en iyi performansın TF-IDF kelime temsil yöntemi ile uygulanan Lojistik Regresyon, Destek Vektör Makineleri ve Rastgele Orman ile elde edildiği ve 0.81 doğruluk değerine ulaşıldığı görülmüştür. Sonraki aşamada BERT tabanlı bir model olan BERTurk ile farklı hiperparametreler kullanılarak yürütülen deneysel çalışmalar sonucu, 0.85 doğruluk değerine ulaşılmıştır. Araştırmanın mültecilere yönelik nefret söyleminin tespiti konusunda yürütülen çalışmalara katkısının olacağı düşünülmektedir. Anahtar Sözcükler: Metin madenc

Erişime Açık
Görüntülenme
7
14.07.2023 tarihinden bu yana
İndirme
1
14.07.2023 tarihinden bu yana
Son Erişim Tarihi
17 Nisan 2024 17:05
Google Kontrol
Tıklayınız
Tam Metin
Tam Metin İndirmek için tıklayın Ön izleme
Detaylı Görünüm
Eser Adı
(dc.title)
Sosyal Ağlar Üzerinde Mültecilere Yönelik Nefret Söyleminin Metin Madenciliğine Dayalı Tespiti
Eser Sahibi
(dc.contributor.author)
Figen Eğin
Tez Danışmanı
(dc.contributor.advisor)
Vahide Bulut
Yayıncı
(dc.publisher)
İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü
Tür
(dc.type)
Yüksek Lisans
Özet
(dc.description.abstract)
Nefret söylemi, belirli kişi ya da gruplara yönelik olarak ait oldukları kimlik nedeniyle aşağılama, ayrımcılık veya ötekileştirme içeren her türlü davranış, yazı veya konuşma olarak tanımlanmaktadır. Türkiye, Suriye iç savaşı sonrası yoğun bir göç almış ve bu süreçte mültecilere karşı nefret söyleminin yükseldiği gözlenmiştir. Nefret söylemi özellikle sosyal medyada hızla yayılabilmektedir. Nefret söyleminin kolaylıkla şiddet eylemlerine dönüşebileceği göz önüne alındığında, sosyal medya üzerinde tespit edilerek yayılımının engellenmesinin önemi ortaya çıkmaktadır. Bu çalışmada Twitter üzerindeki veriler kullanılmış ve araştırmanın ilk aşamasında mültecilere yönelik nefret söyleminin tespiti için 9778 tweet içeren bir veri seti oluşturulmuştur. Bu veri seti üzerinde öncelikle makine öğrenmesi modelleri (Lojistik Regresyon, Destek Vektör Makineleri, Karar Ağaçları, Rastgele Orman ve Yapay Sinir Ağları), Word2Vec ve TF-IDF kelime temsil yöntemleri ile uygulanmıştır. Makine öğrenmesi modelleri arasında en iyi performansın TF-IDF kelime temsil yöntemi ile uygulanan Lojistik Regresyon, Destek Vektör Makineleri ve Rastgele Orman ile elde edildiği ve 0.81 doğruluk değerine ulaşıldığı görülmüştür. Sonraki aşamada BERT tabanlı bir model olan BERTurk ile farklı hiperparametreler kullanılarak yürütülen deneysel çalışmalar sonucu, 0.85 doğruluk değerine ulaşılmıştır. Araştırmanın mültecilere yönelik nefret söyleminin tespiti konusunda yürütülen çalışmalara katkısının olacağı düşünülmektedir. Anahtar Sözcükler: Metin madenc
Kayıt Giriş Tarihi
(dc.date.accessioned)
2023-07-14
Açık Erişim Tarihi
(dc.date.available)
2024-01-24
Yayın Tarihi
(dc.date.issued)
2023
Yayın Dili
(dc.language.iso)
tr
Konu Başlıkları
(dc.subject)
Metin madenciliği
Konu Başlıkları
(dc.subject)
nefret söyleminin tespiti
Tek Biçim Adres
(dc.identifier.uri)
https://hdl.handle.net/11469/3482
Analizler
Yayın Görüntülenme
Yayın Görüntülenme
Erişilen ülkeler
Erişilen şehirler
6698 sayılı Kişisel Verilerin Korunması Kanunu kapsamında yükümlülüklerimiz ve çerez politikamız hakkında bilgi sahibi olmak için alttaki bağlantıyı kullanabilirsiniz.

creativecommons
Bu site altında yer alan tüm kaynaklar Creative Commons Alıntı-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.
Platforms