Halimah, - (2022) Peringkasan teks otomatis (automated text summarization) pada artikel berbahasa indonesia menggunakan algoritma lexrank. Jurnal Computer Science and Information Technology (CoSciTech), 3 (3). pp. 371-381. ISSN e-ISSN: 2723-5661
|
Text
Peringkasan teks otomatis (automated text summarization) pada artikel berbahasa indonesia menggunakan algoritma lexrank .pdf Download (1MB) | Preview |
Abstract
Artikel merupakan kumpulan teks atau kalimat yang panjang dan berisikan gagasan atau pendapat terhadap suatu topik tertentu. Artikel yang sangat panjang akan menghabiskan waktu cukup lama untuk membaca dan memahami poin-poin penting yang disampaikan. Penelitian ini mengusulkan algoritma Lexrank untuk meringkas teks otomatis pada artikel berbahasa indonesia. Penelitian ini menggunakan dataset berupa korpus yang tersusun atas 300 artikel dari berbagai topik. Kalimat yang dipilih menjadi ringkasan untuk gold standard dirata-ratakan dari dua orang annotator. Metode peringkas dokumen dikembangkan untuk menghasilkan ringkasan yang performanya dibandingkan dengan gold standard tersebut menggunakan ROUGE score. Metode bekerja dengan beberapa tahap, mulai dari text preprocessing yang meliputi segmentasi kalimat, case folding, tokenisasi, punctuation removal, stemming dan stopword removal. Kemudian menghitung bobot tf-idf, bobot similarity, pembentukan graf, pemeringkatan kalimat, dan tahap akhir adalah membentuk hasil ringkasan. Untuk pengembangan sistem, 150 dokumen diuji coba dengan variasi pemilihan ranking similarity, dan yang terbaik digunakan sebagai model untuk test document. Hasil pengujian dengan compression rate 50% menghasilkan nilai f-measure rata-rata untuk 150 test document, pada metrik ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 67,53%, 59,10%, dan 67,05%. Sedangkan untuk compression rate 30% menghasilkan rata-rata f-measure pada ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 55,82%, 45,51%, dan 54,76%. Penelitian ini menghasilkan akurasi f-measure yang lebih baik dan kompetitif bila merujuk pada hasil-hasil penelitian sejenis.
Item Type: | Article |
---|---|
Subjects: | 000 Karya Umum > 004 Pemrosesan Data, Ilmu Komputer, Teknik Informatika |
Divisions: | Fakultas Sains dan Teknologi > Teknik Informatika |
Depositing User: | fsains - |
Date Deposited: | 16 Jan 2023 04:52 |
Last Modified: | 16 Jan 2023 04:52 |
URI: | http://repository.uin-suska.ac.id/id/eprint/65049 |
Actions (login required)
View Item |