Lompat ke konten Lompat ke sidebar Lompat ke footer

Tantangan Dan Permasalahan Data Mining

Pengertian Data Mining

Data mining yaitu proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Dengan perkembangan ilmu dan teknologi yang semakin pesat ini maka kita sering menjumpai implementasi atau penerapan data mining dilingkungan sekitar kita. Akan tetapi implementasi dari data mining tentu tidak sanggup berjalan mulus, ada beberapa tantangan yang harus dihadapai dalam data mining


Baca Juga: Teknik Pencarian Pola Sekuensial (Sequence Mining) pada Data Mining

Tantangan Dalam Data mining

Tantangan dalam data mining mencakup :

  1. Scalability, yaitu besarnya ukuran basis data yang digunakan.
  2. Dimensionality, yaitu banyaknya jumlah atribut dalam data yang akan diproses.
  3. Complex and Heterogeneous Data, yaitu data yang kompleks dan mempunyai variasi yang beragam.
  4. Data'QuaIity, kualitas data yang akan diproses menyerupai data yang higienis dari noise, missing value, dsb.
  5. Data Ownership and Distribution, yaitu siapa yang mempunyai data dan bagaimana distribusinya.
  6. Privacy Preservation, yaitu menjaga kerahasiaan data yang banyak diterapkan pada data nasabah perbankan.
  7. Streaming Data, yaitu aliran data itu sendiri.

Baca Juga: Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining

Permasalahan Dalam Data mining

Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahan dalam basis data yang cenderung dinamis, tidak lengkap, ber-noise dan besar. Permasalahan lain muncul sebagai jawaban dari kecukupan dan relevansi dari info yang disimpan.

Basis data seringkali didesain untuk tujuan yang berbeda dari data mining dan kadangkala properti atau atribut yang akan menyederhanakan pekerjaan pembelajaran tidak tersedia atau tidak sanggup dimintai dari dunia nyata. Data yang tidak meyakinkan menjadikan permasalahan alasannya yaitu kalau ada atribut-atribut esensial bagi pengetahuan perihal domain aplikasi tidak ada dalam data tidak memungkinkan untuk menemukan pengetahuan yang sempurna mengenai domain yang diberikan.