OCR Uygulanmamış PDF Belgelerinden Metin Çıkartma: Bir İnceleme ve Çözüm Önerisi

Mert DÖNERÇARK

OCR Uygulanmamış PDF Belgelerinden Metin Çıkartma: Bir İnceleme ve Çözüm Önerisi

Eser Sahibi Mert DÖNERÇARK
Tür Diğer
Yayın Tarihi 2024
Yayıncı İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü
Tek Biçim Adres https://hdl.handle.net/11469/4138
Konu Başlıkları OCR Uygulanmamış PDF
Metin Çıkarma
Dijital Belge Yönetimi

Bu dönem projesinin ana amacı, Optik Karakter Tanıma (OCR) uygulanmamış PDF belgelerinden metin çıkarma sorununu incelemektir. Günümüzde, birçok dijital belge OCR işlemine tabi tutulmadan depolanmakta veya paylaşılmaktadır. Bu durum, metin içeriğine erişimi kısıtlamakta ve bilgi geri kazanımını zorlaştırmaktadır. Proje, mevcut metin çıkarma yöntemleri ve teknolojilerini araştıracak ve seçilen iki yöntemi örnek bir uygulama ile test edecek ve çıktılarını performans metrikleri anlamında değerlendirecektir. Giriş bölümünde projenin amacı ve kapsamı belirtilmekte ardından ikinci bölümde OCR teknolojilerinin gelişimi ve metin çıkartma alanında kullanımı üzerine gerçekleştirilen literatür araştırmasının sonuçları değerlendirilmektedir. Üçüncü bölümde Metin çıkarma teknikleri ve metodolojileri üzerine yapılan araştırma sonuçları örneklendirilmiştir, dördüncü bölümde çalışmada kullanılacak altyapı, yöntem ve metot belirtilmekte, takip eden bölümde ise seçilen iki yöntem ve altyapı ile geliştirilen bir uygulamanın OCR uygulanmamış bir PDF belgesi üzerinden metin çıkartımını nasıl gerçekleştirdiği gösterilmektedir ve yöntemlerin çıktılarının performans karşılaştırılması yapılmaktadır. Çalışmanın sonunda sonuç, tartışma ve önerilere yer verilmektedir

Koleksiyonlar ENSTİTÜLER
FEN BİLİMLERİ ENSTİTÜSÜ

Erişime Açık

Görüntülenme

35

07.08.2024 tarihinden bu yana

İndirme

6

07.08.2024 tarihinden bu yana

Son Erişim Tarihi

08 Ekim 2024 13:24

Google Kontrol

Tıklayınız

Tam Metin İndirmek için tıklayın Ön izleme

Eser Adı (dc.title)	OCR Uygulanmamış PDF Belgelerinden Metin Çıkartma: Bir İnceleme ve Çözüm Önerisi
Eser Sahibi (dc.contributor.author)	Mert DÖNERÇARK
Yayıncı (dc.publisher)	İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü
Esere Katkı Sağlayan (dc.contributor.other)	Doğan AYDIN
Tür (dc.type)	Diğer
Açıklama (dc.description)	Tezsiz Yüksek Lisans Bitirme Projesi
Özet (dc.description.abstract)	Bu dönem projesinin ana amacı, Optik Karakter Tanıma (OCR) uygulanmamış PDF belgelerinden metin çıkarma sorununu incelemektir. Günümüzde, birçok dijital belge OCR işlemine tabi tutulmadan depolanmakta veya paylaşılmaktadır. Bu durum, metin içeriğine erişimi kısıtlamakta ve bilgi geri kazanımını zorlaştırmaktadır. Proje, mevcut metin çıkarma yöntemleri ve teknolojilerini araştıracak ve seçilen iki yöntemi örnek bir uygulama ile test edecek ve çıktılarını performans metrikleri anlamında değerlendirecektir. Giriş bölümünde projenin amacı ve kapsamı belirtilmekte ardından ikinci bölümde OCR teknolojilerinin gelişimi ve metin çıkartma alanında kullanımı üzerine gerçekleştirilen literatür araştırmasının sonuçları değerlendirilmektedir. Üçüncü bölümde Metin çıkarma teknikleri ve metodolojileri üzerine yapılan araştırma sonuçları örneklendirilmiştir, dördüncü bölümde çalışmada kullanılacak altyapı, yöntem ve metot belirtilmekte, takip eden bölümde ise seçilen iki yöntem ve altyapı ile geliştirilen bir uygulamanın OCR uygulanmamış bir PDF belgesi üzerinden metin çıkartımını nasıl gerçekleştirdiği gösterilmektedir ve yöntemlerin çıktılarının performans karşılaştırılması yapılmaktadır. Çalışmanın sonunda sonuç, tartışma ve önerilere yer verilmektedir
Kayıt Giriş Tarihi (dc.date.accessioned)	2024-08-07
Açık Erişim Tarihi (dc.date.available)	2024-08-07
Yayın Tarihi (dc.date.issued)	2024
Tek Biçim Adres (dc.identifier.uri)	https://hdl.handle.net/11469/4138
Yayın Dili (dc.language.iso)	tr
Konu Başlıkları (dc.subject)	OCR Uygulanmamış PDF
Konu Başlıkları (dc.subject)	Metin Çıkarma
Konu Başlıkları (dc.subject)	Dijital Belge Yönetimi
Haklar (dc.rights)	Open access

Yayın Görüntülenme

Erişilen ülkeler

Erişilen şehirler

Bu site altında yer alan tüm kaynaklar Creative Commons Alıntı-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.