SULISTIA NINGSIH, -
(2024)
PENGARUH PENYEIMBANGAN DATA PADA KLASIFIKASI
TERJEMAHAN AL-QURAN DENGAN METODE NAÏVE BAYES DAN
LONG SHORT TERM MEMORY.
Journal of Computer System and Informatics (JoSYC), 5 (3).
pp. 626-635.
ISSN ISSN 2714-7150 (media cetak) , ISSN 2714-8912 (media online)
Abstract
−Al-Quran adalah sebuah kitab suci umat islam yang merupakan pedoman hidup bagi seluruh umat manusia.
Mempelajari dan memahami terjemahan Al-Quran tidaklah mudah, salah satu cara yang dapat dilakukan adalah dengan
mengklasifikasikan terjemahan ayat Al-Quran kedalam topik-topik yang ada. Penelitian ini menggunakan metode Naïve
Bayes dan LSTM dalam proses klasifikasi. Data yang digunakan bersumber dari data terjemahan Al-Quran dalam bahasa
Indonesia yang telah dilabeli berdasarkan klasifikasi multi-class. Salah satu masalah utama yang dihadapi adalah
ketidakseimbangan data. Untuk mengatasi masalah tersebut maka dilakukan proses balancing data, teks preprocessing,
feature construction dan feature extraction dengan menggunakan teknik bag of words dan TF.IDF. Hasil penelitian
menunjukkan bahwa model Naïve Bayes yang paling optimal mendapatkan nilai rata-rata 55.39% pada data test juz 30,
61.59% pada data test juz 10-20, dan 59.53% pada data test juz 25-28. Sedangkan model LSTM yang paling optimal adalah
58.02% pada data test juz 30, 59.64% pada data test juz 10-20, dan 58.59% pada data test juz 25-28. Berdasarkan nilai
tersebut metode Naïve Bayes dan LSTM dapat menjadi pilihan yang baik untuk tugas klasifikasi. Tujuan utama dari
penelitian ini adalah untuk meningkatkan performa klasifikasi serta membandingkan akurasi antara Naïve Bayes dan LSTM.
Actions (login required)
|
View Item |