DIABETES PREDICTION USING DATA MINING CLASSIFICATION METHODS

Authors

  • Sri Wulandari Politeknik Indonusa Surakarta
  • Sri Wulandari Politeknik Indonusa Surakarta
  • Annisa Nur Rokhmah Politeknik Indonusa Surakarta
  • Okky Fajar Saputra Politeknik Indonusa Surakarta

DOI:

https://doi.org/10.46808/informa.v9i1.298

Keywords:

Diabetes, Data Mining, Prediksi, Algoritma C4.5, RapidMiner

Abstract

Kesehatan merupakan peranan terpenting dalam kehidupan. Salah satu penyakit yang dapat
menyebabkan komplikasi dan kematian adalah diabetes. Diabetes merupakan penyakit yang
disebabkan oleh pankreas yang tidak memproduksi insulin yang cukup untuk tubuh sehingga kadar
gula dalam darah melebihi normal. Diabetes merupakan penyakit keturunan, penyakit ini dapat
diturunkan kepada anaknya dari orang tua yang mengidap penyakit diabetes, sangat disayangkan jika
usia yang masih muda sudah mengidap penyakit diabetes. Pemeriksaan dalam dunia medis dilakukan
dengan cara pendiagnosaan penyakit berdasarkan gejala-gejala yang dirasakan oleh penderita yang
dapat menghasilkan rekam medis gejala penyakit. Untuk meminimalisir angka kematian dari
penyakit Diabetes ini, para pakar kesehatan harus melakukan pendiagnosaan penyakit dengan sedini
mungkin. Salah satu metode yang dapat digunakan dalam permasalahan ini adalah data mining
dengan teknik klasifikasi dengan menggunakan algoritma C4.5. Penelitian ini bertujuan untuk
membantu para medis untuk mengklasifikasi para pasien yang memiliki gejala- gejala penyakit
diabetes. Algoritma C4.5 merupakan metode yang digunakan untuk klasifikasi yang menghasilkan
model berupa pohon keputusan. Pohon keputusan merupakan metode klasifikasi dan prediksi yang
terkenal. Algoritma C4.5 merupakan metode yang dapat digunakan untuk memprediksi dan
mengetahui nilai akurasi pada pasien dengan gejala-gejala yang diderita pasien apakah pasien
tersebut mengidap penyakit Diabetes atau tidak. Berdasarkan hasil pengujian dengan metode cross
validation pada tools RapidMiner menggunakan 2 options yaitu 5-Fold Cross Validation yang
menghasilkan akurasi 95,88% dan 10-Fold Cross Validation menghasilkan akurasi 95,90%. Yang
mana pengujian dengan 10 Fold Cross Validation menghasilkan akurasi yang lebih baik
dibandingkan menggunakan 5 Fold Cross Validation. Dengan jumlah kelas data yang sama yaitu
pada class positive sebanyak 224 data dan pada class negative sebanyak 140 data

Downloads

Download data is not yet available.

Downloads

Published

2023-06-30

Issue

Section

Artikel