Search for collections on Universitas Islam Negeri Sultan Syarif Kasim Riau Repository

KLASIFIKASI SENTIMEN PADA DATASET TERBATAS MENGGUNAKAN RANDOM FOREST DAN WORD2VEC

DINA DESWARA FITRI, - (2024) KLASIFIKASI SENTIMEN PADA DATASET TERBATAS MENGGUNAKAN RANDOM FOREST DAN WORD2VEC. Journal of Computer System and Informatics (JoSYC), 6 (1). pp. 214-222. ISSN eISSN 2714-8912 (media online), ISSN 2714-7150 (media cetak)

[img]
Preview
Text
JURNAL DINA DESWARA FITRI.pdf - Published Version

Download (2MB) | Preview
[img]
Preview
Text
Artikel Jurnal.pdf - Published Version

Download (1MB) | Preview

Abstract

ABSTRAK Pengukuran sentimen terhadap opini publik di media sosial penting untuk memahami pandangan masyarakat terhadap berbagai isu, termasuk tokoh publik dan peristiwa politik. Penelitian ini mengeksplorasi efektivitas algoritma Random Forest dengan representasi kata berbasis Word2Vec untuk klasifikasi sentimen pada dataset terbatas. Studi kasus melibatkan tweet mengenai Kaesang Pangarep sebagai Ketua Umum PSI, ditambah data eksternal terkait Covid-19 dan topik umum. Dataset diproses menggunakan teknik cleaning, case folding, stopword removal, stemming, dan tokenisasi. Kata-kata dalam dataset direpresentasikan menggunakan model Word2Vec dengan arsitektur Continuous Bag of Words (CBOW) dan dimensi vektor 500.Random Forest digunakan untuk mengklasifikasikan sentimen ke dalam kategori positif, negatif, atau netral. Pada tahap awal, model dilatih menggunakan 300 sampel data per label, tetapi hasilnya menunjukkan performa yang kurang memuaskan dengan F1-Score 49,00% dan akurasi 50,00%. Untuk meningkatkan kinerja, dataset diperluas dengan menambahkan 900 sampel dari Kaesang dan 1.080 sampel dari topik eksternal. Hasil akhir menunjukkan peningkatan dengan F1-Score 49,89%, akurasi 58,29%, presisi 49,16%, dan recall 56,47%. Penelitian ini mengonfirmasi bahwa penggunaan Random Forest dengan representasi kata dari Word2Vec dapat meningkatkan performa klasifikasi sentimen meskipun dengan dataset terbatas, serta memberikan kontribusi dalam pengembangan teknik analisis sentimen di bidang pembelajaran mesin. Kata kunci: Klasifikasi sentimen; Random Forest; Word2vec ; Dataset Terbatas; Sosial Media

Item Type: Article
Contributors:
ContributionNameNIDN/NIDKEmail
Thesis advisorSURYA AGUSTIAN, -330087602surya.agustian@uin-suska.ac.id
Subjects: 000 Karya Umum
Divisions: Fakultas Sains dan Teknologi > Teknik Informatika
Depositing User: fsains -
Date Deposited: 14 Jan 2025 04:16
Last Modified: 14 Jan 2025 04:16
URI: http://repository.uin-suska.ac.id/id/eprint/85433

Actions (login required)

View Item View Item