KLASIFIKASI BAHASA YANG MIRIP (BAHASA INDONESIA DAN BAHASA MALAYSIA) MENGGUNAKAN METODE SUPPORT VECTOR MACHINE

RIRIE BADZLINA ADANI (2018) KLASIFIKASI BAHASA YANG MIRIP (BAHASA INDONESIA DAN BAHASA MALAYSIA) MENGGUNAKAN METODE SUPPORT VECTOR MACHINE. Skripsi thesis, Universitas Islam Negeri Sultan Syarif Kasim Riau.

Preview

Text
1. COVER_2018604TIF.pdf
Download (293kB) | Preview

Preview

Text
2. PENGESAHAN_2018604TIF.pdf
Download (275kB) | Preview

Preview

Text
3. ABSTRAK_2018604TIF.pdf
Download (176kB) | Preview

Preview

Text
4. KATA PENGANTAR_2018604TIF.pdf
Download (543kB) | Preview

Preview

Text
5. DAFTAR ISI_2018604TIF.pdf
Download (374kB) | Preview

Preview

Text
6. BAB I_2018604TIF.pdf
Download (287kB) | Preview

Preview

Text
7. BAB II_2018604TIF.pdf
Download (490kB) | Preview

Preview

Text
8. BAB III_2018604TIF.pdf
Download (318kB) | Preview

Preview

Text
9. BAB IV_2018604TIF.pdf
Download (594kB) | Preview

Text
10. BAB V_2018604TIF.pdf
Restricted to Repository staff only
Download (698kB)

Preview

Text
11. BAB VI_2018604TIF.pdf
Download (263kB) | Preview

Preview

Text
12. DAFTAR PUSTAKA_2018604TIF.pdf
Download (191kB) | Preview

Abstract

Saat ini telah banyak media sosial yang digunakan masyarakat dari berbagai negara untuk mendapatkan informasi yang dibutuhkan, salah satunya Twitter. Twitter terdapat berbagai bahasa yang digunakan para penggunanya dalam menuliskan tweet.Bahasa yang tergolong mirip yaitu bahasa Indonesia dan bahasa Malaysia. Tweet berbahasa Indonesia dan berbahasa Malaysia pada Twitter ini, masih ambigu dikarenakan sulit dalam menentukan apakah tweet tergolong bahasa Indonesia atau bukan bahasa Indonesia (bahasa Malaysia),disebabkan kemiripan bahasa antara bahasa Indonesia dan bahasa Malaysia karena masih didalam rumpun yang sama. Penelitian ini, menggunakan 1000 tweet untuk dijadikan data set yang kemudian akan dilakukan beberapa tahapan seperti label manual, preprocessing, seleksi fitur dan pembelajaran SVM. dari hasil tahapan yang telah dilakukan, diperoleh tingkat akurasi sebesar 99% dengan menggunakan normalisasi, threshold dan pembagian data 80% sebagai data latih dan 20% sebagai data uji. Tetapi yang tidak menggunakan normalisasi, namun tetap menggunakan threshold dengan pembagian data 80% sebagai data latih dan 20% sebagai data uji, diperoleh tingkat akurasi sebesar 87%. Kata Kunci : Bahasa Indonesia, Bahasa Malaysia, Fitur, Klasifikasi, Preprocessing, Support Vecrtor Machine, Threshold, Tweet, Twitter

Item Type:	Thesis (Skripsi)
Subjects:	300 Ilmu Sosial
Divisions:	Fakultas Sains dan Teknologi > Teknik Informatika
Depositing User:	Ms. Nilam Badriyah
Date Deposited:	25 Jul 2019 04:39
Last Modified:	25 Jul 2019 04:39
URI:	http://repository.uin-suska.ac.id/id/eprint/16763

Actions (login required)

View Item

Search for collections on Universitas Islam Negeri Sultan Syarif Kasim Riau Repository