Please take a moment to complete this survey below

Library's collection Library's IT development Cancel

Deteksi rumus matematika pada halaman dokumen digital dengan metode Convolutional Neural Network

Rumus matematika dalam scientific paper yang tersedia secara daring seringkali tidak bisa dikenali dengan baik oleh proses Optical Character Recognition (OCR). Sulitnya pengenalan ini dikarenakan adanya perbedaan-perbedaan yang dimiliki rumus matematika dibandingkan dengan baris teks biasa. Oleh karena itu, deteksi rumus matematika pada halaman dokumen digital diharapkan dapat membantu proses OCR.
Deteksi rumus matematika pada halaman dokumen digital dilakukan dengan mengubah dokumen menjadi image, kemudian memisahkan setiap baris teks dan kata-kata yang ada di dalamnya dan mengklasifikasi baris teks dan kata-kata tersebut menggunakan Convolutional Neural Network (CNN). Arsitektur CNN yang digunakan untuk melakukan klasifikasi memiliki 64 filter di setiap convolutional layer-nya.
Untuk rumus displayed (tidak bercampur dengan teks), digunakan 10 kumpulan layer Convolutional-ReLU-Max Pooling, sedangkan untuk rumus inline (bercampur dengan teks) digunakan 12 kumpulan layer. Dengan menggunakan arsitektur-arsitektur CNN yang telah disebutkan, didapat F1 score sebesar 0,980 untuk klasifikasi rumus displayed pada dokumen dengan layout 1 kolom; F1 score sebesar 0,940 untuk klasifikasi rumus displayed pada dokumen dengan 2 kolom; dan F1 score sebesar 0,916 untuk rumus inline.

Creator(s)
  • (26415031) MARTINA MARCELLINE TASLIM
Contributor(s)
  • Kartika Gunadi → Advisor 1
  • Henry Novianus Palit, S.Kom → Examination Committee 1
Publisher
Universitas Kristen Petra; 2019
Language
Indonesian
Category
s1 – Undergraduate Thesis
Sub Category
Skripsi/Undergraduate Thesis
Source
Skripsi No. 01021881/INF/2019; Martina Marcelline Taslim (26415031)
Subject(s)
  • NEURAL NETWORKS
  • NEURAL NETWORKS (COMPUTER SCIENCE)
File(s)

Similar Collection

by creator, contributor, or subject