khafifurahman, - (2021) NORMALISASI TEKS BAHASA PASER KALIMANTAN TIMUR MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE DAN N-GRAM LANGUAGE MODELS. Skripsi thesis, Universitas Islam Negeri Sultan Syarif Kasim Riau.
|
Text
BAB 1 2 3 dan 5.pdf Download (3MB) | Preview |
|
Text (BAB IV)
BAB 4.pdf - Published Version Restricted to Repository staff only Download (3MB) |
Abstract
Saat ini Kalimantan Timur memiliki penutur aktif bahasa Paser sekitar 200 ribuan (Sambolangi, 2020). Jika dilihat dari jumlah penduduk Paser dan Penajam Paser Utara (PPU), Jumlah ini tergolong sedikit untuk bisa mempertahankan penggunaan sebuah bahasa. Bahasa Paser juga digunakan dalam berkomunikasi di media sosial seperti youtube.com. Dalam hal penulisan bahasa Paser juga berkemungkinan untuk terjadi salah ketik (typo) atau terjadi penyingkatan yang mengakibatkan kata menjadi tidak baku. Proses normalisasi dalam penelitian ini menggunakan algoritma Levenshtein Distance dan N-gram Language Models. Pengujian dalam penelitian ini menggunakan pengujian akurasi dengan Suggestion Adequacy. Hasil pengujian akurasi terhadap 500 komentar youtube.com yang berjumlah 3147 kata menghasilkan tingkat akurasi sebesar 60,81%. Rekomendasi kata yang benar berjumlah 2.325 kata dan rekomendasi kata yang salah berjumlah 822 kata. Kata Kunci: Kamus, Levenshtein Distance, Normalisasi, N-gram Language Models, Paser, Youtube.
Item Type: | Thesis (Skripsi) |
---|---|
Subjects: | 600 Teknologi dan Ilmu-ilmu Terapan > 620 Ilmu Teknik 000 Karya Umum |
Divisions: | Fakultas Sains dan Teknologi > Teknik Informatika |
Depositing User: | fsains - |
Date Deposited: | 23 Dec 2021 03:25 |
Last Modified: | 23 Dec 2021 03:26 |
URI: | http://repository.uin-suska.ac.id/id/eprint/57006 |
Actions (login required)
View Item |