Yuliska (2014) CLUSTERING DOKUMEN TEKS BERDASARKAN FINGERPRINT BIWORD WINNOWING DENGAN MENGGUNAKAN METODE K-MEANS. Skripsi thesis, Universitas Islam Negeri Sultan Syarif Kasim Riau.
|
Text
fm.pdf Download (105kB) | Preview |
|
|
Text
Bab I Pendahuluan.pdf Download (21kB) | Preview |
|
|
Text
Bab II Landasan Teori.pdf Download (224kB) | Preview |
|
|
Text
Bab III Metodologi Penelitian.pdf Download (33kB) | Preview |
|
|
Text
Bab IV Analisa Dan Pembahasan.pdf Download (1MB) | Preview |
|
Text
BAB V Implementasi Dan Pengujian.pdf Restricted to Registered users only Download (478kB) |
||
|
Text
Bab VI-Penutup.pdf Download (14kB) | Preview |
|
|
Text
em.pdf Download (12kB) | Preview |
Abstract
Kebutuhan akan informasi yang semakin meningkat menyebabkan informasi yang berbentuk dokumen teks mengalami penumpukan, sehingga proses pencarian menjadi sulit. Untuk itu, dilakukan suatu teknik clustering agar dokumen-dokumen yang memiliki tingkat kesamaan tinggi dapat berada pada satu kluster/kelompok yang sama, sehingga proses pencarian menjadi lebih mudah. Salah satu metode yang sering digunakan dalam kasus clustering adalah K-Means. Penelitian ini mencoba melakukan clustering terhadap dokumen teks dengan menggunakan metode K-Means berdasarkan fingerprint biword winnowing sebagai feature atau ciri dokumen teks, dimana biword winnowing adalah algoritma yang biasa dipakai untuk mendeteksi kesamaan isi suatu dokumen teks. Proses clustering diawali dengan mengekstrak fingerprint dari masing- masing dokumen yang ada pada koleksi dokumen dengan menggunakan algoritma biword winnowing. Kemudian dilakukan proses pembentukan dimensi dokumen yang merepresentasikan frekuensi kemunculan fingerprint dari masing-masing dokumen tersebut, dan dilanjutkan dengan proses clustering dokumen menggunakan metode K-Means. Selanjutnya, untuk mengetahui kualitas hasil pengelompokan dilakukan pengujian dengan menggunakan parameter precision. Dari keseluruhan hasil pengujian, kualitas hasil pengelompokan terhadap koleksi dokumen uji oleh aplikasi clustering dokumen teks ini dinilai baik dengan nilai precision 60%-88.33%. Kata Kunci : Biword Winnowing, Clustering, Fingerprint, K-Means, Precision.
Item Type: | Thesis (Skripsi) |
---|---|
Subjects: | 000 Karya Umum > 004 Pemrosesan Data, Ilmu Komputer, Teknik Informatika |
Divisions: | Fakultas Sains dan Teknologi > Teknik Informatika |
Depositing User: | eva sartika |
Date Deposited: | 27 Apr 2016 20:27 |
Last Modified: | 27 Apr 2016 20:27 |
URI: | http://repository.uin-suska.ac.id/id/eprint/3898 |
Actions (login required)
View Item |