Komparasi Kinerja Algoritma Data Mining pada Dataset Konsumsi Alkohol Siswa
Data mining melakukan proses ekstraksi pengetahuan yang diperoleh dari sekumpulan data dalam jumlah besar. Penelitian ini bertujuan untuk menerapkan dan melakukan analisis kinerja algoritma data mining untuk memprediksi konsumsi alkohol dan menganalisis faktor-faktor yang terkait pada siswa tingkat...
Saved in:
Main Authors: | , |
---|---|
Format: | UMS Journal (OJS) |
Language: | ind |
Published: |
Department of Informatics, Universitas Muhammadiyah Surakarta, Indonesia
2018
|
Subjects: | |
Online Access: | https://journals.ums.ac.id/index.php/khif/article/view/7061 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
_version_ | 1805342471605977088 |
---|---|
author | Sagala, Noviyanti Tampubolon, Hendrik |
author_facet | Sagala, Noviyanti Tampubolon, Hendrik |
author_sort | Sagala, Noviyanti |
collection | OJS |
description | Data mining melakukan proses ekstraksi pengetahuan yang diperoleh dari sekumpulan data dalam jumlah besar. Penelitian ini bertujuan untuk menerapkan dan melakukan analisis kinerja algoritma data mining untuk memprediksi konsumsi alkohol dan menganalisis faktor-faktor yang terkait pada siswa tingkat menengah. Adapun tahapan yang dilakukan ialah pra-proses data, seleksi fitur, klasifikasi, dan evaluasi model. Pada tahap praproses, beberapa fitur diubah menjadi bentuk yang sesuai untuk memudahkan proses klasifikasi. Selanjutnya, algoritma Gain Ratio dan Feature Correlation-Based Filter (FCBF) digunakan untuk memilih fitur-fitur yang relevan dan penting untuk digunakan dalam tahapan klasifikasi. Decision Tree C5.0, Support Vector Machine (SVM), K-Nearest Neighbor (KNN), dan Naive Bayes (NB) dieksekusi pada kelompok fitur yang terpilih. Akurasi model yang dibangun dievaluasi menggunakan 10-fold Cross-Validation (CV). Hasil penelitian menunjukkan bahwa model klasifikasi yang dibangun menggunakan Naïve Bayes memiliki nilai akurasi tertinggi dengan menggunakan 5 fitur terbaik dari Gain Ratio. Selain itu, penggunaan metode pemilihan fitur mampu meningkatkan performa dari seluruh klasifier secara umum. Pengujian lebih lanjut pada data yang sama maupun berbeda perlu dilakukan untuk mendapatkan gambaran lebih mendalam mengenai kinerja algoritma-algoritma yang digunakan. |
format | UMS Journal (OJS) |
id | oai:ojs2.journals.ums.ac.id:article-7061 |
institution | Universitas Muhammadiyah Surakarta |
language | ind |
publishDate | 2018 |
publisher | Department of Informatics, Universitas Muhammadiyah Surakarta, Indonesia |
record_format | ojs |
spelling | oai:ojs2.journals.ums.ac.id:article-7061 Komparasi Kinerja Algoritma Data Mining pada Dataset Konsumsi Alkohol Siswa Sagala, Noviyanti Tampubolon, Hendrik data mining; konsumsi alkohol siswa; Naïve Bayes; KNN; decision tree Data mining melakukan proses ekstraksi pengetahuan yang diperoleh dari sekumpulan data dalam jumlah besar. Penelitian ini bertujuan untuk menerapkan dan melakukan analisis kinerja algoritma data mining untuk memprediksi konsumsi alkohol dan menganalisis faktor-faktor yang terkait pada siswa tingkat menengah. Adapun tahapan yang dilakukan ialah pra-proses data, seleksi fitur, klasifikasi, dan evaluasi model. Pada tahap praproses, beberapa fitur diubah menjadi bentuk yang sesuai untuk memudahkan proses klasifikasi. Selanjutnya, algoritma Gain Ratio dan Feature Correlation-Based Filter (FCBF) digunakan untuk memilih fitur-fitur yang relevan dan penting untuk digunakan dalam tahapan klasifikasi. Decision Tree C5.0, Support Vector Machine (SVM), K-Nearest Neighbor (KNN), dan Naive Bayes (NB) dieksekusi pada kelompok fitur yang terpilih. Akurasi model yang dibangun dievaluasi menggunakan 10-fold Cross-Validation (CV). Hasil penelitian menunjukkan bahwa model klasifikasi yang dibangun menggunakan Naïve Bayes memiliki nilai akurasi tertinggi dengan menggunakan 5 fitur terbaik dari Gain Ratio. Selain itu, penggunaan metode pemilihan fitur mampu meningkatkan performa dari seluruh klasifier secara umum. Pengujian lebih lanjut pada data yang sama maupun berbeda perlu dilakukan untuk mendapatkan gambaran lebih mendalam mengenai kinerja algoritma-algoritma yang digunakan. Department of Informatics, Universitas Muhammadiyah Surakarta, Indonesia 2018-12-27 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf https://journals.ums.ac.id/index.php/khif/article/view/7061 10.23917/khif.v4i2.7061 Khazanah Informatika : Jurnal Ilmu Komputer dan Informatika; Vol. 4 No. 2 Desember 2018; 98-103 Khazanah Informatika; Vol. 4 No. 2 Desember 2018; 98-103 2477-698X 2621-038X ind https://journals.ums.ac.id/index.php/khif/article/view/7061/4345 Copyright (c) 2018 Khazanah Informatika: Jurnal Ilmu Komputer dan Informatika http://creativecommons.org/licenses/by/4.0 |
spellingShingle | data mining; konsumsi alkohol siswa; Naïve Bayes; KNN; decision tree Sagala, Noviyanti Tampubolon, Hendrik Komparasi Kinerja Algoritma Data Mining pada Dataset Konsumsi Alkohol Siswa |
title | Komparasi Kinerja Algoritma Data Mining pada Dataset Konsumsi Alkohol Siswa |
title_full | Komparasi Kinerja Algoritma Data Mining pada Dataset Konsumsi Alkohol Siswa |
title_fullStr | Komparasi Kinerja Algoritma Data Mining pada Dataset Konsumsi Alkohol Siswa |
title_full_unstemmed | Komparasi Kinerja Algoritma Data Mining pada Dataset Konsumsi Alkohol Siswa |
title_short | Komparasi Kinerja Algoritma Data Mining pada Dataset Konsumsi Alkohol Siswa |
title_sort | komparasi kinerja algoritma data mining pada dataset konsumsi alkohol siswa |
topic | data mining; konsumsi alkohol siswa; Naïve Bayes; KNN; decision tree |
topic_facet | data mining; konsumsi alkohol siswa; Naïve Bayes; KNN; decision tree |
url | https://journals.ums.ac.id/index.php/khif/article/view/7061 |
work_keys_str_mv | AT sagalanoviyanti komparasikinerjaalgoritmadataminingpadadatasetkonsumsialkoholsiswa AT tampubolonhendrik komparasikinerjaalgoritmadataminingpadadatasetkonsumsialkoholsiswa |