Search for collections on Universitas Islam Negeri Sultan Syarif Kasim Riau Repository

RANCANG BANGUN APLIKASI PERINGKAS TEKS OTOMATIS ARTIKEL BERBAHASA INDONESIA MENGGUNAKAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) DAN K-MEAN CLUSTERING

Fendra Pratama (2014) RANCANG BANGUN APLIKASI PERINGKAS TEKS OTOMATIS ARTIKEL BERBAHASA INDONESIA MENGGUNAKAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) DAN K-MEAN CLUSTERING. Skripsi thesis, Universitas Islam Negeri Sultan Syarif Kasim Riau.

[img]
Preview
Text
fm.pdf

Download (246kB) | Preview
[img]
Preview
Text
Bab I.pdf

Download (34kB) | Preview
[img]
Preview
Text
BAB II.pdf

Download (130kB) | Preview
[img]
Preview
Text
BAB III.pdf

Download (125kB) | Preview
[img]
Preview
Text
BAB IV.pdf

Download (640kB) | Preview
[img] Text
BAB V.pdf
Restricted to Registered users only

Download (497kB)
[img]
Preview
Text
BAB VI.pdf

Download (9kB) | Preview
[img]
Preview
Text
em.pdf

Download (20kB) | Preview

Abstract

Membaca teks artikel secara keseluruhan membutuhkan waktu yang lama untuk mendapatkan informasi penting. Peringkas teks otomatis menawarkan solusi untuk membantu memperoleh informasi penting dengan membaca isi artikel dalam bentuk deskripsi singkat berupa ringkasan (summary). Dengan adanya ringkasan, informasi bisa diakses dengan cepat dan tidak perlu membutuhkan waktu yang lama dengan cara mengambil isi yang paling penting dari teks bacaan tersebut bagi penggunanya. Penerapan metode TF-IDF bertujuan untuk menghitung bobot tiap kalimat dan pada metode K-Mean Clustering bertujuan untuk meminimalisasikan variasi kalimat di dalam suatu cluster dan memaksimalisasikan variasi kalimat antar cluster. Pemilihan kalimat penting berdasarkan bobot kalimat paling besar pada tiap cluster dengan mengambil compression sebesar 25% dan 40%. Pengujian hasil ringkasan sistem pada compression 40% menghasilkan rata-rata recall 60%, precision 62%, dan f-measure 61%. Sedangkan untuk compression 25% menghasilkan rata-rata recall 37%, precision 44%, dan f-measure 40%. Penilaian hasil ringkasan sistem oleh expert judgement pada compression 40% menghasilkan nilai rata-rata 3,15 atau pada range diterima, sedangkan pada compression 25% menghasilkan nilai rata-rata 1,83 atau berada pada range cukup diterima. Dari hasil pengujian dan penilaian terhadap hasil ringkasan sistem tersebut membuktikan bahwa hasil ringkasan teks artikel dengan compression 40% lebih baik daripada hasil ringkasan dengan compression 25%. Kata kunci: F-Measure, K-Mean Clustering, Precision, Recall, TF-IDF

Item Type: Thesis (Skripsi)
Subjects: 000 Karya Umum > 004 Pemrosesan Data, Ilmu Komputer, Teknik Informatika
Divisions: Fakultas Sains dan Teknologi > Teknik Informatika
Depositing User: eva sartika
Date Deposited: 25 Apr 2016 11:25
Last Modified: 25 Apr 2016 11:25
URI: http://repository.uin-suska.ac.id/id/eprint/3616

Actions (login required)

View Item View Item