Open Journal Systems

Komparasi SVM dan IndoBERT dalam Klasifikasi Sentimen Program Makanan Bergizi Gratis

       Shifatush Shafwah, Harun Al Azies

Abstract


Program Makanan Bergizi Gratis (MBG) memunculkan beragam respons masyarakat di media sosial, khususnya pada platform X (Twitter). Analisis sentimen diperlukan untuk memahami kecenderungan opini publik terhadap program tersebut. Penelitian ini membandingkan kinerja Support Vector Machine (SVM) dan IndoBERT dalam mengklasifikasikan sentimen positif dan negatif pada 2.674 tweet terkait MBG. Data diperoleh melalui web scraping dan diproses melalui tahapan cleaning, normalisasi teks, tokenisasi, serta pelabelan menjadi dua kelas sentimen. Ketidakseimbangan data ditangani menggunakan Synthetic Minority Oversampling Technique (SMOTE). Model SVM dilatih menggunakan representasi fitur TF-IDF, sedangkan IndoBERT dilatih melalui fine-tuning sebagai model transformer. Evaluasi performa dilakukan menggunakan 10-Fold Cross-Validation, confusion matrix, ROC-AUC, dan uji statistik paired t-test. Hasil penelitian menunjukkan bahwa SVM memperoleh akurasi 94,64% dan F1-Score 94,63%, sedangkan IndoBERT mencapai akurasi 90,11% dan F1-Score 89,92%. Meskipun IndoBERT mencatat nilai AUC sedikit lebih tinggi, kinerja keseluruhan SVM lebih unggul secara konsisten pada data yang telah diseimbangkan dengan SMOTE. Uji paired t-test menghasilkan nilai p < 0,05, yang menunjukkan bahwa perbedaan performa kedua model bersifat signifikan. SVM lebih efektif digunakan untuk klasifikasi sentimen dua kelas pada dataset MBG yang relatif kecil dan bersifat informal.

  http://dx.doi.org/10.31544/jtera.v10.i2.2025.105-112

Keywords


Analisis Sentimen; Program Makanan Bergizi Gratis; SVM; IndoBERT; SMOTE; Media Sosial.

Full Text:

  PDF

References


N. Harahap, “Analisis Framing Netizen Di X Dalam Pelaksanaan Program Makan Bergizi Gratis,” vol. 4, 2025.

H. Hairani, “Peningkatan Kinerja Metode SVM Menggunakan Metode KNN Imputasi dan K-Means-Smote untuk Klasifikasi Kelulusan Mahasiswa Universitas Bumigora,” J. Teknol. Inf. Dan Ilmu Komput., vol. 8, no. 4, pp. 713–718, July 2021, doi: 10.25126/jtiik.2021843428.

W. Anggriyani and M. Fakhriza, “Analisis Sentimen Program Makan Gratis Pada Media Sosial X Menggunakan Metode NLP,” J. Comput. Syst. Inform. JoSYC, vol. 5, no. 4, pp. 1033–1042, Aug. 2024, doi: 10.47065/josyc.v5i4.5826.

Mutiara Sintia Dewi and A. H. Hasugian, “PENERAPAN SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN PADA TANGGAPAN MASYARAKAT DI MEDIA SOSIAL TERHADAP PROGRAM MAKAN SIANG GRATIS,” Rabit J. Teknol. Dan Sist. Inf. Univrab, vol. 10, no. 2, pp. 911–922, July 2025, doi: 10.36341/rabit.v10i2.6425.

F. Fatkhurrohman, B. I. Nugroho, and N. Fadillah, “Analisis Sentimen Program Makan Bergizi Gratis Pemerintah RI Melalui Twitter Menggunakan Metode SVM,” RIGGS J. Artif. Intell. Digit. Bus., vol. 4, no. 3, pp. 3906–3917, Aug. 2025, doi: 10.31004/riggs.v4i3.2533.

T. Thomas and E. Rajabi, “A systematic review of machine learning-based missing value imputation techniques,” Data Technol. Appl., vol. 55, no. 4, pp. 558–585, Aug. 2021, doi: 10.1108/DTA-12-2020-0298.

I. A. Wisky, S. Defit, and G. W. Nurcahyo, “Development of extraction features for Detecting Adolescent Personality with Machine Learning Algorithms,” JOIV Int. J. Inform. Vis., vol. 8, no. 3–2, p. 1606, Nov. 2024, doi: 10.62527/joiv.8.3-2.3091.

“Jurnal Zonasi Marwika Rifattul Iffa - MARWIKA RIFATTUL IFFA Teknik Informatika.”

T. Safitri, Y. Umaidah, and I. Maulana, “Analisis Sentimen Pengguna Twitter Terhadap BTS Menggunakan Algoritma Support Vector Machine,” vol. 7, no. 1.

S. P. Octarini, A. Y. Zakiyyah, and K. Purwandari, “Comparison of IndoBERT and SVM Algorithm to Perform Aspect Based Sentiment Analysis using Hierarchical Dirichlet Process”.

M. Mukherjee and M. Khushi, “SMOTE-ENC: A Novel SMOTE-Based Method to Generate Synthetic Data for Nominal and Continuous Features,” Appl. Syst. Innov., vol. 4, no. 1, p. 18, Mar. 2021, doi: 10.3390/asi4010018.

I. A. Rahma and L. H. Suadaa, “Penerapan Text Augmentation untuk Mengatasi Data yang Tidak Seimbang pada Klasifikasi Teks Berbahasa Indonesia,” J. Teknol. Inf. Dan Ilmu Komput., vol. 10, no. 6, pp. 1329–1340, Dec. 2023, doi: 10.25126/jtiik.2023107325.

M. F. Kono, I. N. Fajri, and Y. Pristyanto, “Public Sentiment Analysis on Corruption Issues in Indonesia Using IndoBERT Fine-Tuning, Logistic Regression, and Linear SVM,” Logist. Regres., vol. 9, no. 5.

A. Wafda, “Aspect-Based Sentiment Analysis terhadap Cuitan Platform X tentang Kurikulum Merdeka Menggunakan IndoBERT”.

S. Minaee, N. Kalchbrenner, E. Cambria, N. Nikzad, M. Chenaghlu, and J. Gao, “Deep Learning Based Text Classification: A Comprehensive Review,” Jan. 04, 2021, arXiv: arXiv:2004.03705. doi: 10.48550/arXiv.2004.03705.

M. Kumar, L. Khan, and H.-T. Chang, “Evolving techniques in sentiment analysis: a comprehensive review,” PeerJ Comput. Sci., vol. 11, p. e2592, Jan. 2025, doi: 10.7717/peerj-cs.2592.

A. N. Ma’aly, D. Pramesti, A. D. Fathurahman, and H. Fakhrurroja, “Exploring Sentiment Analysis for the Indonesian Presidential Election Through Online Reviews Using Multi-Label Classification with a Deep Learning Algorithm,” Information, vol. 15, no. 11, p. 705, Nov. 2024, doi: 10.3390/info15110705.

Z. Sitorus, M. Iqbal, D. Nasution, and R. F. Wijaya, “Penerapan Deep Learning dan Analisis Sentimen terhadap Gap Kompetensi Lulusan Lembaga Pendidikan dan Pelatihan Vokasi terhadap Dunia Kerja dengan Metode Long Short-Term Memory (LSTM),” vol. 6, no. 2, 2025.

M. A. Alfaridzy, E. Haerani, and L. Oktavia, “KLASIFIKASI SENTIMEN MASYARAKAT TERHADAP EFISIENSI ANGGARAN PEMERINTAH MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER,” vol. 5, 2024.

J. Khan, K. Ahmad, S. K. Jagatheesaperumal, and K.-A. Sohn, “Textual variations in social media text processing applications: challenges, solutions, and trends,” Artif. Intell. Rev., vol. 58, no. 3, p. 89, Jan. 2025, doi: 10.1007/s10462-024-11071-z.

M. I. Raif, N. N. Hidayati, and T. Matulatan, “Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI,” J. Teknol. Inf. Dan Ilmu Komput., vol. 11, no. 2, pp. 337–348, Apr. 2024, doi: 10.25126/jtiik.20241127404.

V. E. Priyanti, “ANALISIS SENTIMEN PADA ULASAN APLIKASI SMART CITY MENGGUNAKAN PEMODELAN LATENT DIRICHLET ALLOCATION DAN KLASIFIKASI NAÏVE BAYES”.

Y. Tay, M. Dehghani, D. Bahri, and D. Metzler, “Efficient Transformers: A Survey,” ACM Comput. Surv., vol. 55, no. 6, pp. 1–28, June 2023, doi: 10.1145/3530811.

W. Chen, K. Yang, Z. Yu, Y. Shi, and C. L. P. Chen, “A survey on imbalanced learning: latest research, applications and future directions,” Artif. Intell. Rev., vol. 57, no. 6, p. 137, May 2024, doi: 10.1007/s10462-024-10759-6.

D. Elreedy, A. F. Atiya, and F. Kamalov, “A theoretical distribution analysis of synthetic minority oversampling technique (SMOTE) for imbalanced learning,” Mach. Learn., vol. 113, no. 7, pp. 4903–4923, July 2024, doi: 10.1007/s10994-022-06296-4.




DOI: http://dx.doi.org/10.31544/jtera.v10.i2.2025.105-112
Abstract 107 View    PDF viewed = 54 View

Refbacks

  • There are currently no refbacks.


Copyright (c) 2025 JTERA (Jurnal Teknologi Rekayasa)

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Copyright @2016-2025 JTERA (Jurnal Teknologi Rekayasa) p-ISSN 2548-737X e-ISSN 2548-8678.

  Lisensi Creative Commons

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

JTERA Editorial Office:
Politeknik Sukabumi
Jl. Babakan Sirna 25, Sukabumi 43132, West Java, Indonesia
Phone/Fax: +62 266215417
Whatsapp: +62 81809214709
Website: https://jtera.polteksmi.ac.id
E-mail: [email protected]