OCR Uygulanmamış PDF Belgelerinden Metin Çıkartma: Bir İnceleme ve Çözüm Önerisi

Bu dönem projesinin ana amacı, Optik Karakter Tanıma (OCR) uygulanmamış PDF belgelerinden metin çıkarma sorununu incelemektir. Günümüzde, birçok dijital belge OCR işlemine tabi tutulmadan depolanmakta veya paylaşılmaktadır. Bu durum, metin içeriğine erişimi kısıtlamakta ve bilgi geri kazanımını zorlaştırmaktadır. Proje, mevcut metin çıkarma yöntemleri ve teknolojilerini araştıracak ve seçilen iki yöntemi örnek bir uygulama ile test edecek ve çıktılarını performans metrikleri anlamında değerlendirecektir. Giriş bölümünde projenin amacı ve kapsamı belirtilmekte ardından ikinci bölümde OCR teknolojilerinin gelişimi ve metin çıkartma alanında kullanımı üzerine gerçekleştirilen literatür araştırmasının sonuçları değerlendirilmektedir. Üçüncü bölümde Metin çıkarma teknikleri ve metodolojileri üzerine yapılan araştırma sonuçları örneklendirilmiştir, dördüncü bölümde çalışmada kullanılacak altyapı, yöntem ve metot belirtilmekte, takip eden bölümde ise seçilen iki yöntem ve altyapı ile geliştirilen bir uygulamanın OCR uygulanmamış bir PDF belgesi üzerinden metin çıkartımını nasıl gerçekleştirdiği gösterilmektedir ve yöntemlerin çıktılarının performans karşılaştırılması yapılmaktadır. Çalışmanın sonunda sonuç, tartışma ve önerilere yer verilmektedir

Erişime Açık
Görüntülenme
35
07.08.2024 tarihinden bu yana
İndirme
6
07.08.2024 tarihinden bu yana
Son Erişim Tarihi
08 Ekim 2024 13:24
Google Kontrol
Tıklayınız
Tam Metin
Tam Metin İndirmek için tıklayın Ön izleme
Detaylı Görünüm
Eser Adı
(dc.title)
OCR Uygulanmamış PDF Belgelerinden Metin Çıkartma: Bir İnceleme ve Çözüm Önerisi
Eser Sahibi
(dc.contributor.author)
Mert DÖNERÇARK
Yayıncı
(dc.publisher)
İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü
Esere Katkı Sağlayan
(dc.contributor.other)
Doğan AYDIN
Tür
(dc.type)
Diğer
Açıklama
(dc.description)
Tezsiz Yüksek Lisans Bitirme Projesi
Özet
(dc.description.abstract)
Bu dönem projesinin ana amacı, Optik Karakter Tanıma (OCR) uygulanmamış PDF belgelerinden metin çıkarma sorununu incelemektir. Günümüzde, birçok dijital belge OCR işlemine tabi tutulmadan depolanmakta veya paylaşılmaktadır. Bu durum, metin içeriğine erişimi kısıtlamakta ve bilgi geri kazanımını zorlaştırmaktadır. Proje, mevcut metin çıkarma yöntemleri ve teknolojilerini araştıracak ve seçilen iki yöntemi örnek bir uygulama ile test edecek ve çıktılarını performans metrikleri anlamında değerlendirecektir. Giriş bölümünde projenin amacı ve kapsamı belirtilmekte ardından ikinci bölümde OCR teknolojilerinin gelişimi ve metin çıkartma alanında kullanımı üzerine gerçekleştirilen literatür araştırmasının sonuçları değerlendirilmektedir. Üçüncü bölümde Metin çıkarma teknikleri ve metodolojileri üzerine yapılan araştırma sonuçları örneklendirilmiştir, dördüncü bölümde çalışmada kullanılacak altyapı, yöntem ve metot belirtilmekte, takip eden bölümde ise seçilen iki yöntem ve altyapı ile geliştirilen bir uygulamanın OCR uygulanmamış bir PDF belgesi üzerinden metin çıkartımını nasıl gerçekleştirdiği gösterilmektedir ve yöntemlerin çıktılarının performans karşılaştırılması yapılmaktadır. Çalışmanın sonunda sonuç, tartışma ve önerilere yer verilmektedir
Kayıt Giriş Tarihi
(dc.date.accessioned)
2024-08-07
Açık Erişim Tarihi
(dc.date.available)
2024-08-07
Yayın Tarihi
(dc.date.issued)
2024
Tek Biçim Adres
(dc.identifier.uri)
https://hdl.handle.net/11469/4138
Yayın Dili
(dc.language.iso)
tr
Konu Başlıkları
(dc.subject)
OCR Uygulanmamış PDF
Konu Başlıkları
(dc.subject)
Metin Çıkarma
Konu Başlıkları
(dc.subject)
Dijital Belge Yönetimi
Haklar
(dc.rights)
Open access
Analizler
Yayın Görüntülenme
Yayın Görüntülenme
Erişilen ülkeler
Erişilen şehirler
6698 sayılı Kişisel Verilerin Korunması Kanunu kapsamında yükümlülüklerimiz ve çerez politikamız hakkında bilgi sahibi olmak için alttaki bağlantıyı kullanabilirsiniz.

creativecommons
Bu site altında yer alan tüm kaynaklar Creative Commons Alıntı-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.
Platforms