SOURCE DETECTIONPADA KASUS PLAGIARISME DOKUMEN BERDASARKAN WORDS PHRASINGDENGAN MODEL RUANG VEKTOR

Agung Sucipto, (2014) SOURCE DETECTIONPADA KASUS PLAGIARISME DOKUMEN BERDASARKAN WORDS PHRASINGDENGAN MODEL RUANG VEKTOR. Skripsi thesis, Universitas Negeri Sultan Syarif Kasim Riau.

[img]
Preview
Text
fm.pdf

Download (565kB) | Preview
[img]
Preview
Text
BAB I.pdf

Download (18kB) | Preview
[img]
Preview
Text
BAB II.pdf

Download (236kB) | Preview
[img]
Preview
Text
BAB III.pdf

Download (91kB) | Preview
[img]
Preview
Text
BAB IV.pdf

Download (1MB) | Preview
[img] Text
BAB V.pdf
Restricted to Registered users only

Download (765kB)
[img]
Preview
Text
BAB VI.pdf

Download (15kB) | Preview
[img]
Preview
Text
em.pdf

Download (12kB) | Preview

Abstract

Plagiarisme merupakan sebuah tindakan penggunaan dan mengutip sebagian isi karya tulisan orang lain tanpa mencantumkan sumber dan kemudian diakui sebagai miliknya sendiri. Namun pendeteksian plagiarisme yang telah dikembangkan masih melakukan pendeteksian 1:1 dan tidak dapat menemukan sumber dari dokumen. Penelitian ini menggabungkan antara pendeteksian plagiarisme dan mesin pencarian dengan model ruang vektor, ini bertujuan melakukan pendeteksian plagiarisme terhadap banyak dokumen. Konsep pendeteksian ini, yaitu melakukan pembuatan query terhadap isi dokumen dengan menggunakan word phrasing berbentuk triword, quadword dan pentaword dengan menggunakan stemming algoritma Nazief Adriani dan tanpa stemming serta melakukan pemilihan frekuensi kemunculan kata tertinggi, terendah dan tengah yang akan digunakan pada pencarian model ruang vektor, lalu mengukur kemiripan antara dokumen input terhadap dokumen yang telah dihasilkan oleh pencarian menggunakan algoritma biword winnowing. Pengujian akan dilakukan sebanyak lima kali dengan delapan belas konfigurasi pembuatan query berdasarkan kombinasi words phrasing. Kesimpulan Dari beberapa pengujian pembuatan query berdasarkan words phrasing dapat menemukan dokumen yang memiliki kesamaan antara dokumen uji dan dokumen yang ada pada corpus serta dapat menunjukkan persamaan kutipan antara dua dokumen. Selain itu tahap pengujian mengasumsikan pembuatan query berbentuk triword tanpa stemming dan pemilihan frekuensi kemunculan kata tertinggi dapat menghasilkan pencarian yang memiliki rata-rata nilai jaccard coefficient sebesar 15.66% dan stabil disetiap pengujiannya. Kata kunci: Algoritma, Biword Winnowing, Jaccard Coefficient, Model Ruang Vektor, Plagiarisme, Query, Words Phrasing.

Item Type: Thesis (Skripsi)
Subjects: 000 Karya Umum > 004 Pemrosesan Data, Ilmu Komputer, Teknik Informatika
Divisions: Fakultas Sains dan Teknologi > Teknik Informatika
Depositing User: eva sartika
Date Deposited: 22 Apr 2016 12:00
Last Modified: 22 Apr 2016 12:27
URI: http://repository.uin-suska.ac.id/id/eprint/3497

Actions (login required)

View Item View Item