Preprint has been published in a journal as an article
Preprint / Version 1

Sentiment Analysis on Twitter about Domestic Violence Using Random Forest and Extreme Gradient Boosting Methods


Analisa Sentimen pada Twitter tentang Kekerasan dalam Rumah Tangga Menggunakan Metode Random Forest dan Extreme Gradient Boosting

##article.authors##

DOI:

https://doi.org/10.21070/ups.2459

Keywords:

Analysis Sentiment, KDRT, Random Forest, Twitter, XGBoost

Abstract

Social media Twitter is one of the communication media that is in great demand by the public. Currently, the topic of domestic violence is being discussed by Twitter social media users. Users will provide comments and opinions about cases that were trending at the time, namely domestic violence via Twitter. In this study, researchers want to implement machine learning algorithms to perform sentiment analysis on Twitter users on the topic of domestic violence. After going through the text preprocessing stages, the researcher then used SMOTE for handling imbalanced data and TFIDF for word weighting. After that, classification was carried out using two machine learning algorithms, namely random forest and XGBoost. The results of this study obtained a train score of 94% and a test score of 76% for the Random Forest algorithm and a train score of 86% and a test score of 73% for XGBoost.

Downloads

Download data is not yet available.

References

A. Ikegami, I. Dewa, M. Bayu, and A. Darmawan, “Analisis Sentimen dan Pemodelan Topik Ulasan Aplikasi Noice Menggunakan XGBoost dan LDA,” Jnatia, vol. 1, no. 1, 2022.

R. Siringoringo, R. Perangin-angin, and J. Jamaluddin, “MODEL HIBRID GENETIC-XGBOOST DAN PRINCIPAL COMPONENT ANALYSIS PADA SEGMENTASI DAN PERAMALAN PASAR,” METHOMIKA Jurnal Manajemen Informatika dan Komputerisasi Akuntansi, vol. 5, no. 2, pp. 97–103, Oct. 2021, doi: 10.46880/jmika.Vol5No2.pp97-103.

R. Rismala, L. Novamizanti, K. N. Ramadhani, Y. S. Rohmah, S. Parjuangan, and D. Mahayana, “Kajian Ilmiah dan Deteksi Adiksi Internet dan Media Sosial di Indonesia Menggunakan XGBoost,” Jurnal Edukasi dan Penelitian Informatika (JEPIN), vol. 7, no. 1, 2021, doi: 10.26418/jp.v7i1.43606.

M. R. Adrian, M. P. Putra, M. H. Rafialdy, and N. A. Rakhmawati, “Perbandingan Metode Klasifikasi Random Forest dan SVM Pada Analisis Sentimen PSBB,” Jurnal Informatika Upgris, vol. 7, no. 1, 2021, doi: 10.26877/jiu.v7i1.7099.

D. Alita and A. R. Isnain, “Pendeteksian Sarkasme pada Proses Analisis Sentimen Menggunakan Random Forest Classifier,” jurnal komputasi, vol. 8, no. 2, 2020, doi: 10.23960/komputasi.v8i2.2615.

N. N. Pandika Pinata, I. M. Sukarsa, and N. K. Dwi Rusjayanthi, “Prediksi Kecelakaan Lalu Lintas di Bali dengan XGBoost pada Python,” Jurnal Ilmiah Merpati (Menara Penelitian Akademika Teknologi Informasi), 2020, doi: 10.24843/jim.2020.v08.i03.p04.

Y. S. Nugroho and N. Emiliyawati, “Sistem Klasifikasi Variabel Tingkat Penerimaan Konsumen Terhadap Mobil Menggunakan Metode Random Forest,” Jurnal Teknik Elektro, vol. 9, no. 1, 2017.

U. Erdiansyah, A. Irmansyah Lubis, and K. Erwansyah, “Komparasi Metode K-Nearest Neighbor dan Random Forest Dalam Prediksi Akurasi Klasifikasi Pengobatan Penyakit Kutil,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 6, no. 1, 2022, doi: 10.30865/mib.v6i1.3373.

R. Siringoringo, R. Perangin-angin, and M. J. Purba, “SEGMENTASI DAN PERAMALAN PASAR RETAIL MENGGUNAKAN XGBOOST DAN PRINCIPAL COMPONENT ANALYSIS,” METHOMIKA Jurnal Manajemen Informatika dan Komputerisasi Akuntansi, vol. 5, no. 1, pp. 42–47, Apr. 2021, doi: 10.46880/jmika.Vol5No1.pp42-47.

S. Devella, Y. Yohannes, and F. N. Rahmawati, “Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT,” JATISI (Jurnal Teknik Informatika dan Sistem Informasi), vol. 7, no. 2, 2020, doi: 10.35957/jatisi.v7i2.289.

M. Rizky Mubarok, R. Herteno, I. Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lambung Mangkurat Jalan Ahmad Yani Km, and K. Selatan, “HYPER-PARAMETER TUNING PADA XGBOOST UNTUK PREDIKSI KEBERLANGSUNGAN HIDUP PASIEN GAGAL JANTUNG.”

M. R. Andryan, M. Fajri, and N. Sulistyowati, “KOMPARASI KINERJA ALGORITMA XGBOOST DAN ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA,” JIKO (Jurnal Informatika dan Komputer), vol. 6, no. 1, 2022, doi: 10.26798/jiko.v6i1.500.

W. Apriliah, I. Kurniawan, M. Baydhowi, and T. Haryati, “Prediksi Kemungkinan Diabetes pada Tahap Awal Menggunakan Algoritma Klasifikasi Random Forest,” SISTEMASI, vol. 10, no. 1, 2021, doi: 10.32520/stmsi.v10i1.1129.

H. H. Sinaga and S. Agustian, “Pebandingan Metode Decision Tree dan XGBoost untuk Klasifikasi Sentimen Vaksin Covid-19 di Twitter,” Jurnal Nasional Teknologi dan Sistem Informasi, vol. 8, no. 3, 2022, doi: 10.25077/teknosi.v8i3.2022.107-114.

E. Fitri, “Analisis Sentimen Terhadap Aplikasi Ruangguru Menggunakan Algoritma Naive Bayes, Random Forest Dan Support Vector Machine,” Jurnal Transformatika, vol. 18, no. 1, 2020, doi: 10.26623/transformatika.v18i1.2317.

I. Muslim and K. Karo, “Implementasi Metode XGBoost dan Feature Importance untuk Klasifikasi pada Kebakaran Hutan dan Lahan,” Journal of Software Engineering, Information and Communication Technology, vol. 1, no. 1, 2020.

A. Syukron and A. Subekti, “Penerapan Metode Random Over-Under Sampling dan Random Forest Untuk Klasifikasi Penilaian Kredit,” Jurnal Informatika, vol. 5, no. 2, 2018, doi: 10.31311/ji.v5i2.4158.

Posted

2023-08-22