Lompat ke konten Lompat ke sidebar Lompat ke footer

Operasi Dan Tahapan Proses Data Mining

Pengertian Data Mining

Data mining yaitu proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.

Operasi Data Mining

Operasi data mining berdasarkan sifatnya dibedakan menjadi dua, yaitu bersifat :
  1. Prediksi (prediction driven) untuk menjawab pertanyaan apa dan sesuatu yang bersifat remang-remang atau transparan.0perasi prediksi dipakai untuk validasi hipotesis, querying dan pelaporan (misal : spreadsheet dan pivot tabel), analisis multidimensi (dimensional summary); OLAP (Online Analytic Processing) serta analisis statistik.
  2. Penemuan (discovery driven)bersifat transparan dan untuk menjawab pertanyaan “mengapa?". Operasi inovasi dipakai untuk analisis data eksplorasi, pemodelan prediktif, segmentasi database, analisis keterkaitan (link analysis) dan deteksi deviasi. 
Baca Juga: Definisi Data Mining

Tahapan Proses Data Mining

Tahapan proses dalam penggunaan data mining yang merupakan proses Knowledge Discovery in Databases (KDD) menyerupai yang terlihat pada Gambar 1.2 sanggup diuraikan sebagai berikut :
  • Memahami domain aplikasi untuk mengetahui dan menggali pengetahuan awal serta apa sasaran pengguna.
  • Membuat sasaran data-set yang mencakup pemilihan data dan fokus pada sub-set data.
  • Pembersihan dan transformasi data mencakup eliminasi derau, outliers, missing value serta pemilihan fitur dan reduksi dimensi.
  • Penggunaan algoritma data mining yang terdiri dari asosiasi, sekuensial, klasifikasi, klasterisasi. dll.
  • Interpretasi. penilaian dan visualisasi contoh untuk melihat apakah ada sesuatu yang gres dan menarik dan dilakukan iterasi jikalau diperlukan.