Search for collections on Universitas Islam Negeri Sultan Syarif Kasim Riau Repository

NORMALISASI KATA BAHASA JAWA PADA TWEET DENGAN EDIT DISTANCE DAN DICTIONARY LOOKUP

Jelita Mahardika September Efani, - (2021) NORMALISASI KATA BAHASA JAWA PADA TWEET DENGAN EDIT DISTANCE DAN DICTIONARY LOOKUP. Skripsi thesis, UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU.

[img] Text (BAB IV-V)
BAB IV-V.pdf - Published Version
Restricted to Repository staff only

Download (1MB)
[img]
Preview
Text
T.A JELITA.pdf

Download (4MB) | Preview

Abstract

ABSTRAK Natural Language Processing (NLP) atau yang biasa disebut dengan pemrosesan bahasa alami adalah sebuah cabang ilmu komputer dan linguistic yang mengkaji tentang interaksi antara komputer dengan bahasa alami manusia. Terdapat banyak suku dan budaya di Indonesia dan terdapat banyak pula bahasa daerah yang digunakan ditiap-tiap daerahnya salah satunya bahasa Jawa. Bahasa Jawa hampir digunakan diseluruh pelosok Indonesia, tidak hanya berkembang dikalangan suku Jawa saja, namun suku lain juga sudah mulai menggunakan bahasa ini sebagai bahasa mereka. Orang Jawa memiliki tata krama yang kompleks tentang bagaimana menggunakan bahasa dengan tingkatan yang sesuai dengan kesopanannya. Setiap daerah di Jawa memiliki bahasanya masing-masing, terdapat lima dialek yang biasa digunakan di Jawa Timur. Berbeda tiap bahasa maka akan berbeda pula kesalahan dalam penulisannya atau yang biasa dikenal dengan tipografi. Kesalahan dalam penulisan inilah yang menyebabkan kata menjadi salah arti atau bahkan tidak memiliki arti, sehingga membuat seseorang kebingungan. Kesalahan dalam penulisan ini yang nantinya akan diperbaiki berdasarkan aturan tata bahasa. Dari permasalahan tersebut maka pada penelitian Tugas Akhir ini akan dilakukan tahapan normalisasi teks bahasa Jawa pada tweet melalui pendekatan Stemming. Solusi yang diambil untuk mengatasi permasalahan tersebut adalah dengan menggunakan Edit Distance dan Dictionary Lookup. Hasil akurasi dari algoritma stemming yang dilanjutkan dengan algoritma normalisasi adalah sebesar 60,7%. Kata Kunci : Algoritma Levenshtein Distance, Bahasa Jawa, Dialek, Natural Language Processing, Stemming, Tingkatan Bahasa Jawa.

Item Type: Thesis (Skripsi)
Subjects: 000 Karya Umum
Divisions: Fakultas Sains dan Teknologi > Teknik Informatika
Depositing User: fsains -
Date Deposited: 07 Jul 2021 02:48
Last Modified: 07 Jul 2021 02:48
URI: http://repository.uin-suska.ac.id/id/eprint/50618

Actions (login required)

View Item View Item