FERDIAN NOPRIANTO, - PERINGKASAN TEKS AUTOMATIS DOKUMEN BERITA MENGGUNAKAN METODE K-MEANS CLUSTERING. http://prosiding.unipma.ac.id/index.php/sendiko.
|
Text
FERDIAN JULAN REPOSIOTRY UIN SUSKA RIAU.pdf Download (2MB) | Preview |
Abstract
Perkembangan teknologi informasi yang pesat menyebabkan peningkatan secara drastis jumlah dokumen teks, artikel dan berita yang tersedia secara digital. Peningkatan jumlah dokumen tersebut menimbulkan kesulitan dalam memilih dan menyaring informasi yang relevan dengan efisien. Peringkasan teks otomatis menjadi solusi penting dalam memberikan informasi secara ringkas dan cepat. Penelitian ini mengusulkan peringkasan teks otomatis dengan teknik clustering menggunakan metode K-Means. Word2Vec digunakan untuk kalkulasi word embeddings dari kalimat-kalimat yang terdapat dalam setiap dokumen. Hasil ringkasan diperoleh dengan mengambil 1 kalimat yang memiliki jarak terdekat antara sentence embeddings-nya dengan centroid, dari masing-masing klaster. Evaluasi hasil ringkasan pada data testing dibandingkan dengan ringkasan manual buatan manusia menggunakan ROUGE, dengan F1-score sebagai metrik pengukuran utama. Metode ini cukup baik untuk tingkat kompresi yang kecil, yaitu F1-score rata-rata 51.96% untuk tingkat kompresi 30%. Sedangkan untuk tingkat kompresi 50% F1-score yang dicapai masih rendah. Kata kunci – Peringkasan Teks Otomatis, K-Means Clustering, ROUGE, Word2vec
Item Type: | Article |
---|---|
Subjects: | 000 Karya Umum > 001 Ilmu Pengetahuan > 001.42 Metode Riset |
Divisions: | Fakultas Sains dan Teknologi > Sistem Informasi |
Depositing User: | fsains - |
Date Deposited: | 18 Jan 2024 05:38 |
Last Modified: | 18 Jan 2024 05:38 |
URI: | http://repository.uin-suska.ac.id/id/eprint/77263 |
Actions (login required)
View Item |