ULFA NADA DIANA, - (2022) IDENTIFIKASI WORD-BOUNDARY PADA HASHTAG TWEET BAHASA INDONESIA MENGGUNAKAN METODE RULE BASED. Skripsi thesis, Universitas Islam Negeri Sultan Syarif Kasim Riau.
|
Text
BAB 1-4.pdf Download (1MB) | Preview |
|
Text (BAB V)
SKRIPSI_ULFA NADA DIANA (1)-62-79.pdf - Published Version Restricted to Repository staff only Download (456kB) |
Abstract
Bahasa merupakan alat untuk berkomunikasi dalam menyampaikan pikiran, gagasan, konsep dan perasaan. Kesalahan dalam penggunaan bahasa di media sosial menyebabkan penyampaian informasi yang tidak jelas atau ambigu. Terdapat dua jenis kesalahan dalam penulisan, yaitu kesalahan penulisan yang tidak disengaja seperti tipografi dan kesalahan penulisan yang disengaja seperti penulisan kata yang menyatu pada tulisan yang memiliki tagar/hashtag. Pada aturan tokenisasi pemisahan kata hanya dilakukan pada teks yang memiliki spasi, enter, tabulasi dan tanda baca lainnya, namun kata yang menyatu pada hashtag tidak terdapat tanda baca apapun yang dapat dilakukan pemisahan menggunakan tokenisasi. Oleh karena itu diperlukan adanya identifikasi word-boundary untuk memisahkan kata yang menyatu pada hashtag agar didapatkan informasi penulisan yang benar. Pemisahan kata dilakukan menggunakan algoritma rule based dengan membuat beberapa aturan untuk 10 jenis bentuk penulisan hashtag, agar dapat memproses identifikasi word-boundary dan mendapatkan hasil pemenggalan kata yang benar. Berdasarkan algoritma dan rule based yang telah dirancang, didapatkan akurasi keberhasilan sistem sebesar 98,2% dengan jumlah kesalahan sebesar 9 dari 500 data uji hashtag. Kata kunci : Word-Boundary, Bahasa Indonesia, Hashtag, Rule Based
Item Type: | Thesis (Skripsi) |
---|---|
Subjects: | 000 Karya Umum |
Divisions: | Fakultas Sains dan Teknologi > Teknik Informatika |
Depositing User: | fsains - |
Date Deposited: | 29 Jul 2022 03:00 |
Last Modified: | 29 Jul 2022 03:00 |
URI: | http://repository.uin-suska.ac.id/id/eprint/62186 |
Actions (login required)
View Item |