RIRIE BADZLINA ADANI (2018) KLASIFIKASI BAHASA YANG MIRIP (BAHASA INDONESIA DAN BAHASA MALAYSIA) MENGGUNAKAN METODE SUPPORT VECTOR MACHINE. Skripsi thesis, Universitas Islam Negeri Sultan Syarif Kasim Riau.
|
Text
1. COVER_2018604TIF.pdf Download (293kB) | Preview |
|
|
Text
2. PENGESAHAN_2018604TIF.pdf Download (275kB) | Preview |
|
|
Text
3. ABSTRAK_2018604TIF.pdf Download (176kB) | Preview |
|
|
Text
4. KATA PENGANTAR_2018604TIF.pdf Download (543kB) | Preview |
|
|
Text
5. DAFTAR ISI_2018604TIF.pdf Download (374kB) | Preview |
|
|
Text
6. BAB I_2018604TIF.pdf Download (287kB) | Preview |
|
|
Text
7. BAB II_2018604TIF.pdf Download (490kB) | Preview |
|
|
Text
8. BAB III_2018604TIF.pdf Download (318kB) | Preview |
|
|
Text
9. BAB IV_2018604TIF.pdf Download (594kB) | Preview |
|
Text
10. BAB V_2018604TIF.pdf Restricted to Repository staff only Download (698kB) |
||
|
Text
11. BAB VI_2018604TIF.pdf Download (263kB) | Preview |
|
|
Text
12. DAFTAR PUSTAKA_2018604TIF.pdf Download (191kB) | Preview |
Abstract
Saat ini telah banyak media sosial yang digunakan masyarakat dari berbagai negara untuk mendapatkan informasi yang dibutuhkan, salah satunya Twitter. Twitter terdapat berbagai bahasa yang digunakan para penggunanya dalam menuliskan tweet.Bahasa yang tergolong mirip yaitu bahasa Indonesia dan bahasa Malaysia. Tweet berbahasa Indonesia dan berbahasa Malaysia pada Twitter ini, masih ambigu dikarenakan sulit dalam menentukan apakah tweet tergolong bahasa Indonesia atau bukan bahasa Indonesia (bahasa Malaysia),disebabkan kemiripan bahasa antara bahasa Indonesia dan bahasa Malaysia karena masih didalam rumpun yang sama. Penelitian ini, menggunakan 1000 tweet untuk dijadikan data set yang kemudian akan dilakukan beberapa tahapan seperti label manual, preprocessing, seleksi fitur dan pembelajaran SVM. dari hasil tahapan yang telah dilakukan, diperoleh tingkat akurasi sebesar 99% dengan menggunakan normalisasi, threshold dan pembagian data 80% sebagai data latih dan 20% sebagai data uji. Tetapi yang tidak menggunakan normalisasi, namun tetap menggunakan threshold dengan pembagian data 80% sebagai data latih dan 20% sebagai data uji, diperoleh tingkat akurasi sebesar 87%. Kata Kunci : Bahasa Indonesia, Bahasa Malaysia, Fitur, Klasifikasi, Preprocessing, Support Vecrtor Machine, Threshold, Tweet, Twitter
Item Type: | Thesis (Skripsi) |
---|---|
Subjects: | 300 Ilmu Sosial |
Divisions: | Fakultas Sains dan Teknologi > Teknik Informatika |
Depositing User: | Ms. Nilam Badriyah |
Date Deposited: | 25 Jul 2019 04:39 |
Last Modified: | 25 Jul 2019 04:39 |
URI: | http://repository.uin-suska.ac.id/id/eprint/16763 |
Actions (login required)
View Item |