Agung Sucipto (2014) SOURCE DETECTIONPADA KASUS PLAGIARISME DOKUMEN BERDASARKAN WORDS PHRASINGDENGAN MODEL RUANG VEKTOR. Skripsi thesis, Universitas Negeri Sultan Syarif Kasim Riau.
|
Text
fm.pdf Download (565kB) | Preview |
|
|
Text
BAB I.pdf Download (18kB) | Preview |
|
|
Text
BAB II.pdf Download (236kB) | Preview |
|
|
Text
BAB III.pdf Download (91kB) | Preview |
|
|
Text
BAB IV.pdf Download (1MB) | Preview |
|
Text
BAB V.pdf Restricted to Registered users only Download (765kB) |
||
|
Text
BAB VI.pdf Download (15kB) | Preview |
|
|
Text
em.pdf Download (12kB) | Preview |
Abstract
Plagiarisme merupakan sebuah tindakan penggunaan dan mengutip sebagian isi karya tulisan orang lain tanpa mencantumkan sumber dan kemudian diakui sebagai miliknya sendiri. Namun pendeteksian plagiarisme yang telah dikembangkan masih melakukan pendeteksian 1:1 dan tidak dapat menemukan sumber dari dokumen. Penelitian ini menggabungkan antara pendeteksian plagiarisme dan mesin pencarian dengan model ruang vektor, ini bertujuan melakukan pendeteksian plagiarisme terhadap banyak dokumen. Konsep pendeteksian ini, yaitu melakukan pembuatan query terhadap isi dokumen dengan menggunakan word phrasing berbentuk triword, quadword dan pentaword dengan menggunakan stemming algoritma Nazief Adriani dan tanpa stemming serta melakukan pemilihan frekuensi kemunculan kata tertinggi, terendah dan tengah yang akan digunakan pada pencarian model ruang vektor, lalu mengukur kemiripan antara dokumen input terhadap dokumen yang telah dihasilkan oleh pencarian menggunakan algoritma biword winnowing. Pengujian akan dilakukan sebanyak lima kali dengan delapan belas konfigurasi pembuatan query berdasarkan kombinasi words phrasing. Kesimpulan Dari beberapa pengujian pembuatan query berdasarkan words phrasing dapat menemukan dokumen yang memiliki kesamaan antara dokumen uji dan dokumen yang ada pada corpus serta dapat menunjukkan persamaan kutipan antara dua dokumen. Selain itu tahap pengujian mengasumsikan pembuatan query berbentuk triword tanpa stemming dan pemilihan frekuensi kemunculan kata tertinggi dapat menghasilkan pencarian yang memiliki rata-rata nilai jaccard coefficient sebesar 15.66% dan stabil disetiap pengujiannya. Kata kunci: Algoritma, Biword Winnowing, Jaccard Coefficient, Model Ruang Vektor, Plagiarisme, Query, Words Phrasing.
Item Type: | Thesis (Skripsi) |
---|---|
Subjects: | 000 Karya Umum > 004 Pemrosesan Data, Ilmu Komputer, Teknik Informatika |
Divisions: | Fakultas Sains dan Teknologi > Teknik Informatika |
Depositing User: | eva sartika |
Date Deposited: | 22 Apr 2016 12:00 |
Last Modified: | 22 Apr 2016 12:27 |
URI: | http://repository.uin-suska.ac.id/id/eprint/3497 |
Actions (login required)
View Item |