Bu dönem projesinin ana amacı, Optik Karakter Tanıma (OCR) uygulanmamış PDF belgelerinden metin çıkarma sorununu incelemektir. Günümüzde, birçok dijital belge OCR işlemine tabi tutulmadan depolanmakta veya paylaşılmaktadır. Bu durum, metin içeriğine erişimi kısıtlamakta ve bilgi geri kazanımını zorlaştırmaktadır. Proje, mevcut metin çıkarma yöntemleri ve teknolojilerini araştıracak ve seçilen iki yöntemi örnek bir uygulama ile test edecek ve çıktılarını performans metrikleri anlamında değerlendirecektir. Giriş bölümünde projenin amacı ve kapsamı belirtilmekte ardından ikinci bölümde OCR teknolojilerinin gelişimi ve metin çıkartma alanında kullanımı üzerine gerçekleştirilen literatür araştırmasının sonuçları değerlendirilmektedir. Üçüncü bölümde Metin çıkarma teknikleri ve metodolojileri üzerine yapılan araştırma sonuçları örneklendirilmiştir, dördüncü bölümde çalışmada kullanılacak altyapı, yöntem ve metot belirtilmekte, takip eden bölümde ise seçilen iki yöntem ve altyapı ile geliştirilen bir uygulamanın OCR uygulanmamış bir PDF belgesi üzerinden metin çıkartımını nasıl gerçekleştirdiği gösterilmektedir ve yöntemlerin çıktılarının performans karşılaştırılması yapılmaktadır. Çalışmanın sonunda sonuç, tartışma ve önerilere yer verilmektedir
Eser Adı (dc.title) | OCR Uygulanmamış PDF Belgelerinden Metin Çıkartma: Bir İnceleme ve Çözüm Önerisi |
Eser Sahibi (dc.contributor.author) | Mert DÖNERÇARK |
Yayıncı (dc.publisher) | İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü |
Esere Katkı Sağlayan (dc.contributor.other) | Doğan AYDIN |
Tür (dc.type) | Diğer |
Açıklama (dc.description) | Tezsiz Yüksek Lisans Bitirme Projesi |
Özet (dc.description.abstract) | Bu dönem projesinin ana amacı, Optik Karakter Tanıma (OCR) uygulanmamış PDF belgelerinden metin çıkarma sorununu incelemektir. Günümüzde, birçok dijital belge OCR işlemine tabi tutulmadan depolanmakta veya paylaşılmaktadır. Bu durum, metin içeriğine erişimi kısıtlamakta ve bilgi geri kazanımını zorlaştırmaktadır. Proje, mevcut metin çıkarma yöntemleri ve teknolojilerini araştıracak ve seçilen iki yöntemi örnek bir uygulama ile test edecek ve çıktılarını performans metrikleri anlamında değerlendirecektir. Giriş bölümünde projenin amacı ve kapsamı belirtilmekte ardından ikinci bölümde OCR teknolojilerinin gelişimi ve metin çıkartma alanında kullanımı üzerine gerçekleştirilen literatür araştırmasının sonuçları değerlendirilmektedir. Üçüncü bölümde Metin çıkarma teknikleri ve metodolojileri üzerine yapılan araştırma sonuçları örneklendirilmiştir, dördüncü bölümde çalışmada kullanılacak altyapı, yöntem ve metot belirtilmekte, takip eden bölümde ise seçilen iki yöntem ve altyapı ile geliştirilen bir uygulamanın OCR uygulanmamış bir PDF belgesi üzerinden metin çıkartımını nasıl gerçekleştirdiği gösterilmektedir ve yöntemlerin çıktılarının performans karşılaştırılması yapılmaktadır. Çalışmanın sonunda sonuç, tartışma ve önerilere yer verilmektedir |
Kayıt Giriş Tarihi (dc.date.accessioned) | 2024-08-07 |
Açık Erişim Tarihi (dc.date.available) | 2024-08-07 |
Yayın Tarihi (dc.date.issued) | 2024 |
Tek Biçim Adres (dc.identifier.uri) | https://hdl.handle.net/11469/4138 |
Yayın Dili (dc.language.iso) | tr |
Konu Başlıkları (dc.subject) | OCR Uygulanmamış PDF |
Konu Başlıkları (dc.subject) | Metin Çıkarma |
Konu Başlıkları (dc.subject) | Dijital Belge Yönetimi |
Haklar (dc.rights) | Open access |