Search for collections on Universitas Islam Negeri Sultan Syarif Kasim Riau Repository

KLASIFIKASI SENTIMEN MENGGUNAKAN METODE PASSIVE AGGRESSIVE DENGAN MENGGUNAKAN MODEL BAHASA BERT PADA DATASET KECIL

Yazid Abdullah Subhi, - (2025) KLASIFIKASI SENTIMEN MENGGUNAKAN METODE PASSIVE AGGRESSIVE DENGAN MENGGUNAKAN MODEL BAHASA BERT PADA DATASET KECIL. KLASIFIKASI SENTIMEN MENGGUNAKAN METODE PASSIVE AGGRESSIVE DENGAN MENGGUNAKAN MODEL BAHASA BERT PADA DATASET KECIL, 6 (3). pp. 1838-1847. ISSN 2684-8910

[img]
Preview
Text
Yazid Abdullah Subhi.pdf

Download (1MB) | Preview

Abstract

Klasifikasi teks merupakan salah satu tugas pemrosesan bahasa alami yang sangat populer, khususnya dalam konteks klasifikasi sentimen. Data latih yang terbatas menjadi permasalahan yang banyak dibahas dalam berbagai penelitian klasifikasi teks. Penelitian ini berfokus pada pengoptimalkan performa klasifikasi menggunakan algoritma Passive Aggressive (PA) dengan memanfaatkan data pelatihan yang terbatas. Penelitian ini juga membandingkan metode representasi teks konvensional, seperti TF- IDF, dengan pendekatan yang lebih modern menggunakan word embeddings seperti FastText dan BERT. Dataset utama mencakup isu sentimen yang dibahas, terkait pengangkatan Kaesang Pangarep sebagai ketua umum PSI, yang dikumpulkan melalui teknik crawling Twitter, dengan pengelompokan label sentimen menjadi positif, negatif, dan netral. Dari dua versi data train yang tersedia, masing-masing hanya terdiri atas 300 tweet dengan kelas positif, negatif dan netral yang berimbang. Data ini dibagi menjadi 80% untuk training dan 20% untuk validasi dalam mencari model yang optimal. Data eksternal dengan isu berbeda yang sudah memiliki label sentimen, digunakan untuk menambah jumlah data train. Dari eksperimen yang dilakukan, model bahasa BERT yang digunakan sebagai fitur input pada metode passive agressive dengan penyesuaian hyperparameter, memiliki performa yang lebih baik dibandingkan fitur TF-IDF. Evaluasi terhadap data test menunjukkan fitur BERT pada Passive Aggressive menghasilkan F1- score sebesar 0.52, lebih baik dibandingkan dengan representasi teks konvensional seperti TF-IDF, dengan perolehan F1-score sebesar 0.42. Pemanfaatan model bahasa BERT memberikan kontribusi yang signifikan terhadap peningkatan performa klasifikasi teks di bidang pemrosesan bahasa alami, khususnya pada metode passive aggresive.

Item Type: Article
Contributors:
ContributionNameNIDN/NIDKEmail
Thesis advisorSurya Agustian, -330087602UNSPECIFIED
Subjects: 000 Karya Umum
Divisions: Fakultas Sains dan Teknologi > Teknik Informatika
Depositing User: fsains -
Date Deposited: 14 Jan 2025 05:31
Last Modified: 14 Jan 2025 05:31
URI: http://repository.uin-suska.ac.id/id/eprint/85494

Actions (login required)

View Item View Item