Seleksi Fitur Information Gain Untuk Klasifikasi Kualitas Susu Sapi Menggunakan Metode K-Nearest Neighbor Dan Naïve Bayes
DOI:
https://doi.org/10.31004/innovative.v5i1.17477Abstract
Kemajuan dalam komputasi modern, khususnya klasifikasi, telah membantu manusia dalam mengklasifikasikan berbagai tugas yang memakan waktu dan komputasi yang mahal, salah satunya adalah klasifikasi kualitas susu sapi. Pengklasifikasian ini penting dilakukan untuk mengurangi kemungkinan beredarnya susu dengan kualitas buruk di masyarakat. Data pada penelitian ini terdiri dari 429 susu kualitas rendah, 374 susu kualitas menengah, dan 256 susu kualitas tinggi. Penelitian ini menguji performa algoritma klarifikasi K-nearest neighbor dan naïve Bayes dengan menggunakan teknik seleksi fitur information gain dan tanpa seleksi fitur information gain. Hasil penelitian ini menunjukkan performa KNN mengalami peningkatan rata-rata akurasi sebesar 1,04 persen dengan perhitungan jarak Euclid dan 0,92 persen dengan perhitungan jarak Manhattan ketika menggunakan lima fitur. Sedangkan performa naïve Bayes mengalami penurunan akurasi sebesar 3,48 persen. Perlakuan yang berbeda tersebut memiliki perbedaan akurasi yang signifikan.
References
Aini, S. H. A., Sari, Y. A., & Arwan, A. (2018). Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi
Metode K-Nearest Neighbor dan Naïve Bayes. Jurnal Pengembangan Teknologi Informasi Dan Komputer, 2(9), 2546–2554.
Bhatia, N., & Vandana. (2010). Survey of Nearest Neighbor Techniques. International Journal of Computer Science and Information Security, 8(2), 302–305.
Chormunge, S., & Jena, S. (2016). Efficient feature subset selection algorithm for high dimensional data. International Journal of Electrical and Computer Engineering, 6(4), 1880–1888. https://doi.org/10.11591/ijece.v6i4.9800
Dewantoro, S., Herdiani, A., & Puspandari, D. (2019). Implementasi Information Gain sebagai Feature Selection pada Word Sense Disambiguation Bahasa Indonesia dengan Teknik Klasifikasi Decision List. E- Proceeding of Engineering, 6(3), 10425–10435.
Gorunescu, F. (2011). Data Mining: Concept, Models, and Techniques. Springer.
Hafidzullah, M., Sutrisno, & Marji. (2019). Seleksi Fitur dengan Information Gain pada Identifikasi Jenis Attention Deficit Hyperactivity Disorder Menggunakan Metode Modified K-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(11), 10444–10452.
Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concept and Techniques. Morgan Kaufmann.
Hidayat, L. R., Setiawan, B. D., & Nurwasito, H. (2016). Pengklasifikasian Kualitas Susu Sapi dengan Algoritma Fuzzy K-Nearest Neighbor (FK-NN).
Larose, D. T., & Larose, C. D. (2014). Discovering Knowledge In Data An Introduction to Data Mining. Wiley.
Leung, K. S., Lee, K. H., Wang, J. F., Ng, E. Y. T., Chan, H. L. Y., Tsui, S. K. W., Mok, T. S. K., Tse, P. C. H., & Sung, J. J. Y. (2011). Data mining on DNA sequences of hepatitis B virus. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 8(2), 428–440. https://doi.org/10.1109/TCBB.2009.6
Mulak, P., & Talhar, N. (2015). Analysis of Distance Measures Using K-Nearest Neighbor Algorithm on KDD Dataset. International Journal of Science and Research, 4(7), 2101–2104.
Multamiah, L., Utami, S., & Sudewo, A. T. A. (2013). Kajian Kadar Lemak dan Bahan Kering Tanpa Lemak Susu Kambing Sapera di Cilacap dan Bogor. Jurmal Ilmiah Peternakan, 1(3), 874–880.
Mutmainnah, U., Darma Setiawan, B., & Dewi, C. (2019). Pengaruh Seleksi Fitur Information Gain pada K-Nearest Neighbor untuk Klasifikasi Tingkat Kelancaran Pembayaran Kredit Kendaraan. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(9), 8882–8888. http://j-ptiik.ub.ac.id
Nabella, F. Y., Sari, Y. A., & Wihandika, R. C. (2019). Seleksi Fitur Information Gain Pada Klasifikasi Citra Makanan Menggunakan Hue Saturation Value dan Gray Level Co-Occurrence Matrix. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(2), 1892–1900.
Patil, T. R., & Sherekar, S. S. (2013). Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification. International Journal Of Computer Science And Applications, 6(2), 256–261.
Sari, B. N. (2016). Implementasi Teknik Seleksi Fitur Information Gain pada Algoritma Klasifikasi Machine Learning untuk Prediksi Performa Akademik Siswa. Seminar Nasional Teknologi Informasi Dan Multimedia, 2(9), 55–60.
Shaltout, N. A., El-Hefnawi, M., Rafea, A., & Moustafa, A. (2014). Information Gain as a Featrure Selection Method for the Efficient Classification of Influenza Based on Viral Hosts. Proceedings of the World Congress on Engineering, 1.
Shrijayan. (2022, August 3). Milk Quality Prediction. https://www.kaggle.com/datasets/cpluzshrijayan/milkquality
Syarli, & Muin, A. A. (2016). Metode Naive Bayes Untuk Prediksi Kelulusan. Jurnal Ilmiah Ilmu Komputer, 2(1), 22–26.
Wasito. (2017). Persepsi Dan Adopsi SNI 3141-1: 2011 Keluarga Peternak Sapi Perah Kawasan Usaha Peternakan(KUNAK) Kabupaten Bogor. Jurnal Standardisasi, 19(3), 241–254.
Wiranti, N., Wanniatie, V., Husni, A., & Qisthon, A. (2022). Kualitas Susu Sapi Segar pada Pemerahan Pagi dan Sore. Jurnal Riset Dan Inovasi Peternakan, 6(2), 123–128
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Fauzi Wardah Ali, I Wayan Sumarjaya, Eka N. Kencana
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.