Implementasi Data Mining untuk Klasterisasi dan Prediksi Kelompok Keluarga
DOI:
https://doi.org/10.31544/jtera.v7.i1.2022.149-156Keywords:
data mining, clustering, kModes, decision tree, kelompok keluargaAbstract
Pengelompokkan keluarga ke dalam cluster mampu dan tidak mampu sangat diperlukan untuk acuan berbagai kegiatan di masa depan seperti bantuan pemerintah atau pihak terkait lainnya. Data mining merupakan salah satu pendekatan yang dapat digunakan untuk menyelesaikan masalah ini. Metode data mining yang cocok adalah clustering dan prediksi. Penelitian ini bertujuan untuk mengimplementasikan data mining untuk klasterisasi dan prediksi kelompok keluarga. Terdapat dua algoritma yang digunakan pada penelitian ini, yaitu kModes dan decision tree. Algoritma kModes berfungsi untuk menghasilkan cluster yang akan digunakan pada tahap selanjutnya, sedangkan metode decision tree digunakan sebagai algoritma prediksinya. Hasil penelitian menunjukkan bahwa kedua metode ini berhasil menyelesaikan masalah dengan tingkat akurasi yang sangat tinggi yaitu sebesar 95,3%, presisi sebesar 95,4%, dan recall sebesar 95,3%.
Downloads
References
S. L. Dewi, “Membangun Peradaban Bangsa Dalam Era Globalisasi Pendidikan Karakter,†PENDAS MAHAKAM: Jurnal Pendidikan dan Pembelajaran Sekolah Dasar, vol. 4, no. 1, pp. 48-54, 2019.
R. Al-Hamdi, “Ketika Sekolah Menjadi Penjara: Membongkar Dilema Pendidikan Masyarakat Modern,†J Soc Media, vol. 1, no. 1, pp. 11-34, 2017.
Y. C. Pratama, “Analisis Faktor-Faktor Yang Mempengaruhi Kemiskinan Di Indonesia,†Esensi, vol. 4, no. 2, pp. 210–223, 2015.
Kemendikbud RI, “Program Indonesia Pintar,†https://indonesiapintar.kemdikbud.go.id/, 2021.
I. A. Arbi, “Dari Pungli hingga Salah Sasaran Penerima, Ini Ragam Masalah Bansos di Jabodetabek,†https://megapolitan.kompas.com/read/2021/07/30/08055781/dari-pungli-hingga-salah-sasaran-penerima-ini-ragam-masalah-bansos-di?page=all, 2021.
E. Fammaldo and L. Hakim, “Penerapan Algoritma K-Means Clustering Untuk Pengelompokan Tingkat Kesejahteraan Keluarga Untuk Program Kartu Indonesia Pintar,†J Ilm Teknol Infomasi Terap, vol. 5, no. 1, pp. 23–31, 2019.
A. K. Maheshwari, Business Intelligence and Data Mining. Ferguson M, editor. Business Expert Press, LLC, 2015.
P. S. Hasugian, “Penerapan Data Mining untuk Klasifikasi Produk Menggunakan Algoritma K-Means (Studi Kasus : Toko Usaha Maju Barabai),†J Mantik Penusa, vol. 2, no. 2, pp. 191–198, 2018.
D. Sunia and P. A. J. Kurniabudi, “Penerapan Data Mining untuk Clustering Data Penduduk Miskin Menggunakan Algoritma K-Means,†J Ilm Mhs Tek Inform, vol. 1, no. 2, pp. 121–134, 2016.
C. E. Purnomo and Rikendry, “Penerapan metode c4.5 untuk klasifikasi warga miskin pada desa mengandung sari,†vol. 2, no. 3, pp. 14–25, 2021.
I. Sutoyo, “Implementasi Algoritma Decision Tree Untuk Klasifikasi Data Peserta Didik,†J Pilar Nusa Mandiri, vol. 14, no. 2, pp. 217, 2018.
Y. A. Priambodo, S. Y. J. Prasetyo, “Pemetaan Penyebaran Guru di Provinsi Banten dengan Menggunakan Metode Spatial Clustering K-Means (Studi kasus : Wilayah Provinsi Banten),†Indones J Comput Model, vol. 1, no. 1, pp. 18–27, 2018.
G. S. Nugraha and Hairani, “Aplikasi Pemetaan Kualitas Pendidikan Di Indonesia Menggunakan Metode K-Means,†MATRIK: Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer, vol. 17, no. 2, pp. 13-23, 2018.
Orange: Data Mining Fruitful and Fun. https://orangedatamining.com/, 2021.
A. Azevedo and M. F. Santos MF. KDD, SEMMA AND CRISP-DM : A PARALLEL OVERVIEW. June 2014.
H. Akbar, Ingin Terapkan Data Mining? Ini Tahapannya. https://mti.binus.ac.id/2017/12/05/ingin-terapkan-data-mining-ini-tahapannya/, 2017.
S. A. Alasadi and W. S. Bhaya “Review of data preprocessing techniques in data mining,†J Eng Appl Sci., vol. 12, no. 16, pp. 4102–4107, 2017.
S. Kumar S, 7 Ways to Handle Missing Values in Machine Learning. https://towardsdatascience.com/7-ways-to-handle-missing-values-in-machine-learning-1a6326adf79e, 2017.
X. Deng, Q. Liu, Y. Deng, and S. Mahadevan, “An improved method to construct basic probability assignment based on the confusion matrix for classification problem,†Inf Sci (Ny), vol. 340–341, pp. 250–261, 2016.
D. Shulga, “Reasons why you should use Cross-Validation in your Data Science Projects,†https://towardsdatascience.com/5-reasons-why-you-should-use-cross-validation-in-your-data-science-project-8163311a1e79, 2018.
Downloads
Published
Issue
Section
License
Authors who publish with this journal agree to the following terms:
The copyright to this article is transferred to JTERA if and when the article is accepted for publication. The undersigned hereby transfers any and all rights in and to the paper including without limitation all copyrights to JTERA. The undersigned hereby represents and warrants that the paper is original and that he/she is the author of the paper, except for material that is clearly identified as to its original source, with permission notices from the copyright owners where required. The undersigned represents that he/she has the power and authority to make and execute this assignment. The copyright transfer form will be sent via email before the article published.
The corresponding author signs for and accepts responsibility for releasing this material on behalf of any and all co-authors. This agreement is to be signed by at least one of the authors who have obtained the assent of the co-author(s) where applicable. After submission of this agreement signed by the corresponding author, changes of authorship or in the order of the authors listed will not be accepted.


