Implementasi Data Mining untuk Klasterisasi dan Prediksi Kelompok Keluarga

Imam Sapuan; Muhammad Hilmi Fauzan; Christina Juliane

doi:10.31544/jtera.v7.i1.2022.149-156

Abstract

Pengelompokkan keluarga ke dalam cluster mampu dan tidak mampu sangat diperlukan untuk acuan berbagai kegiatan di masa depan seperti bantuan pemerintah atau pihak terkait lainnya. Data mining merupakan salah satu pendekatan yang dapat digunakan untuk menyelesaikan masalah ini. Metode data mining yang cocok adalah clustering dan prediksi. Penelitian ini bertujuan untuk mengimplementasikan data mining untuk klasterisasi dan prediksi kelompok keluarga. Terdapat dua algoritma yang digunakan pada penelitian ini, yaitu kModes dan decision tree. Algoritma kModes berfungsi untuk menghasilkan cluster yang akan digunakan pada tahap selanjutnya, sedangkan metode decision tree digunakan sebagai algoritma prediksinya. Hasil penelitian menunjukkan bahwa kedua metode ini berhasil menyelesaikan masalah dengan tingkat akurasi yang sangat tinggi yaitu sebesar 95,3%, presisi sebesar 95,4%, dan recall sebesar 95,3%.

Keywords

data mining clustering kModes decision tree kelompok keluarga

References

S. L. Dewi, â€œMembangun Peradaban Bangsa Dalam Era Globalisasi Pendidikan Karakter,â€ PENDAS MAHAKAM: Jurnal Pendidikan dan Pembelajaran Sekolah Dasar, vol. 4, no. 1, pp. 48-54, 2019.

R. Al-Hamdi, â€œKetika Sekolah Menjadi Penjara: Membongkar Dilema Pendidikan Masyarakat Modern,â€ J Soc Media, vol. 1, no. 1, pp. 11-34, 2017.

Y. C. Pratama, â€œAnalisis Faktor-Faktor Yang Mempengaruhi Kemiskinan Di Indonesia,â€ Esensi, vol. 4, no. 2, pp. 210â€“223, 2015.

Kemendikbud RI, â€œProgram Indonesia Pintar,â€ https://indonesiapintar.kemdikbud.go.id/, 2021.

I. A. Arbi, â€œDari Pungli hingga Salah Sasaran Penerima, Ini Ragam Masalah Bansos di Jabodetabek,â€ https://megapolitan.kompas.com/read/2021/07/30/08055781/dari-pungli-hingga-salah-sasaran-penerima-ini-ragam-masalah-bansos-di?page=all, 2021.

E. Fammaldo and L. Hakim, â€œPenerapan Algoritma K-Means Clustering Untuk Pengelompokan Tingkat Kesejahteraan Keluarga Untuk Program Kartu Indonesia Pintar,â€ J Ilm Teknol Infomasi Terap, vol. 5, no. 1, pp. 23â€“31, 2019.

A. K. Maheshwari, Business Intelligence and Data Mining. Ferguson M, editor. Business Expert Press, LLC, 2015.

P. S. Hasugian, â€œPenerapan Data Mining untuk Klasifikasi Produk Menggunakan Algoritma K-Means (Studi Kasus : Toko Usaha Maju Barabai),â€ J Mantik Penusa, vol. 2, no. 2, pp. 191â€“198, 2018.

D. Sunia and P. A. J. Kurniabudi, â€œPenerapan Data Mining untuk Clustering Data Penduduk Miskin Menggunakan Algoritma K-Means,â€ J Ilm Mhs Tek Inform, vol. 1, no. 2, pp. 121â€“134, 2016.

C. E. Purnomo and Rikendry, â€œPenerapan metode c4.5 untuk klasifikasi warga miskin pada desa mengandung sari,â€ vol. 2, no. 3, pp. 14â€“25, 2021.

I. Sutoyo, â€œImplementasi Algoritma Decision Tree Untuk Klasifikasi Data Peserta Didik,â€ J Pilar Nusa Mandiri, vol. 14, no. 2, pp. 217, 2018.

Y. A. Priambodo, S. Y. J. Prasetyo, â€œPemetaan Penyebaran Guru di Provinsi Banten dengan Menggunakan Metode Spatial Clustering K-Means (Studi kasus : Wilayah Provinsi Banten),â€ Indones J Comput Model, vol. 1, no. 1, pp. 18â€“27, 2018.

G. S. Nugraha and Hairani, â€œAplikasi Pemetaan Kualitas Pendidikan Di Indonesia Menggunakan Metode K-Means,â€ MATRIK: Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer, vol. 17, no. 2, pp. 13-23, 2018.

Orange: Data Mining Fruitful and Fun. https://orangedatamining.com/, 2021.

A. Azevedo and M. F. Santos MF. KDD, SEMMA AND CRISP-DM : A PARALLEL OVERVIEW. June 2014.

H. Akbar, Ingin Terapkan Data Mining? Ini Tahapannya. https://mti.binus.ac.id/2017/12/05/ingin-terapkan-data-mining-ini-tahapannya/, 2017.

S. A. Alasadi and W. S. Bhaya â€œReview of data preprocessing techniques in data mining,â€ J Eng Appl Sci., vol. 12, no. 16, pp. 4102â€“4107, 2017.

S. Kumar S, 7 Ways to Handle Missing Values in Machine Learning. https://towardsdatascience.com/7-ways-to-handle-missing-values-in-machine-learning-1a6326adf79e, 2017.

X. Deng, Q. Liu, Y. Deng, and S. Mahadevan, â€œAn improved method to construct basic probability assignment based on the confusion matrix for classification problem,â€ Inf Sci (Ny), vol. 340â€“341, pp. 250â€“261, 2016.

D. Shulga, â€œReasons why you should use Cross-Validation in your Data Science Projects,â€ https://towardsdatascience.com/5-reasons-why-you-should-use-cross-validation-in-your-data-science-project-8163311a1e79, 2018.

E-ISSN	2548-737X
P-ISSN	2548-8678
Frequency	2× per year
Language	Indonesian / English
Publisher	Politeknik Sukabumi

JTERA

Implementasi Data Mining untuk Klasterisasi dan Prediksi Kelompok Keluarga

Abstract

Keywords

References

Issue

Section

License

How to Cite

Journal Info