Search for collections on Universitas Islam Negeri Sultan Syarif Kasim Riau Repository

NORMALISASI TEKS BAHASA PASER KALIMANTAN TIMUR MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE DAN N-GRAM LANGUAGE MODELS

khafifurahman, - (2021) NORMALISASI TEKS BAHASA PASER KALIMANTAN TIMUR MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE DAN N-GRAM LANGUAGE MODELS. Skripsi thesis, Universitas Islam Negeri Sultan Syarif Kasim Riau.

[img]
Preview
Text
BAB 1 2 3 dan 5.pdf

Download (3MB) | Preview
[img] Text (BAB IV)
BAB 4.pdf - Published Version
Restricted to Repository staff only

Download (3MB)

Abstract

Saat ini Kalimantan Timur memiliki penutur aktif bahasa Paser sekitar 200 ribuan (Sambolangi, 2020). Jika dilihat dari jumlah penduduk Paser dan Penajam Paser Utara (PPU), Jumlah ini tergolong sedikit untuk bisa mempertahankan penggunaan sebuah bahasa. Bahasa Paser juga digunakan dalam berkomunikasi di media sosial seperti youtube.com. Dalam hal penulisan bahasa Paser juga berkemungkinan untuk terjadi salah ketik (typo) atau terjadi penyingkatan yang mengakibatkan kata menjadi tidak baku. Proses normalisasi dalam penelitian ini menggunakan algoritma Levenshtein Distance dan N-gram Language Models. Pengujian dalam penelitian ini menggunakan pengujian akurasi dengan Suggestion Adequacy. Hasil pengujian akurasi terhadap 500 komentar youtube.com yang berjumlah 3147 kata menghasilkan tingkat akurasi sebesar 60,81%. Rekomendasi kata yang benar berjumlah 2.325 kata dan rekomendasi kata yang salah berjumlah 822 kata. Kata Kunci: Kamus, Levenshtein Distance, Normalisasi, N-gram Language Models, Paser, Youtube.

Item Type: Thesis (Skripsi)
Subjects: 600 Teknologi dan Ilmu-ilmu Terapan > 620 Ilmu Teknik
000 Karya Umum
Divisions: Fakultas Sains dan Teknologi > Teknik Informatika
Depositing User: fsains -
Date Deposited: 23 Dec 2021 03:25
Last Modified: 23 Dec 2021 03:26
URI: http://repository.uin-suska.ac.id/id/eprint/57006

Actions (login required)

View Item View Item