Search for collections on Universitas Islam Negeri Sultan Syarif Kasim Riau Repository

Peringkasan teks otomatis (automated text summarization) pada artikel berbahasa indonesia menggunakan algoritma lexrank

Halimah, - (2022) Peringkasan teks otomatis (automated text summarization) pada artikel berbahasa indonesia menggunakan algoritma lexrank. Jurnal Computer Science and Information Technology (CoSciTech), 3 (3). pp. 371-381. ISSN e-ISSN: 2723-5661

[img]
Preview
Text
Peringkasan teks otomatis (automated text summarization) pada artikel berbahasa indonesia menggunakan algoritma lexrank .pdf

Download (1MB) | Preview

Abstract

Artikel merupakan kumpulan teks atau kalimat yang panjang dan berisikan gagasan atau pendapat terhadap suatu topik tertentu. Artikel yang sangat panjang akan menghabiskan waktu cukup lama untuk membaca dan memahami poin-poin penting yang disampaikan. Penelitian ini mengusulkan algoritma Lexrank untuk meringkas teks otomatis pada artikel berbahasa indonesia. Penelitian ini menggunakan dataset berupa korpus yang tersusun atas 300 artikel dari berbagai topik. Kalimat yang dipilih menjadi ringkasan untuk gold standard dirata-ratakan dari dua orang annotator. Metode peringkas dokumen dikembangkan untuk menghasilkan ringkasan yang performanya dibandingkan dengan gold standard tersebut menggunakan ROUGE score. Metode bekerja dengan beberapa tahap, mulai dari text preprocessing yang meliputi segmentasi kalimat, case folding, tokenisasi, punctuation removal, stemming dan stopword removal. Kemudian menghitung bobot tf-idf, bobot similarity, pembentukan graf, pemeringkatan kalimat, dan tahap akhir adalah membentuk hasil ringkasan. Untuk pengembangan sistem, 150 dokumen diuji coba dengan variasi pemilihan ranking similarity, dan yang terbaik digunakan sebagai model untuk test document. Hasil pengujian dengan compression rate 50% menghasilkan nilai f-measure rata-rata untuk 150 test document, pada metrik ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 67,53%, 59,10%, dan 67,05%. Sedangkan untuk compression rate 30% menghasilkan rata-rata f-measure pada ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 55,82%, 45,51%, dan 54,76%. Penelitian ini menghasilkan akurasi f-measure yang lebih baik dan kompetitif bila merujuk pada hasil-hasil penelitian sejenis.

Item Type: Article
Subjects: 000 Karya Umum > 004 Pemrosesan Data, Ilmu Komputer, Teknik Informatika
Divisions: Fakultas Sains dan Teknologi > Teknik Informatika
Depositing User: fsains -
Date Deposited: 16 Jan 2023 04:52
Last Modified: 16 Jan 2023 04:52
URI: http://repository.uin-suska.ac.id/id/eprint/65049

Actions (login required)

View Item View Item