Lompat ke konten Lompat ke sidebar Lompat ke footer

Model Dan Struktur Data Warehouse Pada Data Mining

Pengertian Data Warehouse Data Mining

Data warehouse merupakan proses mengekstraksi dan mentransformasi data operasional kedalam data informasional dan memuatkan ke dalam sebuah toko atau gudang data terpusat. Data yang dimuat sanggup diakses melalui desktop query dan alat analisis oleh pembuat keputusan.

Model Data Warehouse pada Data Mining

Model data warehouse digambarkan dalam diagram berikut ini :


Baca Juga: Perbedaan Data Warehouse dan Sistem OLTP pada Data Mining

Data dalam warehouse sendiri mempunayi suatu struktur yang berbeda dengan menekankan pada level peringkasan yang berbeda menyerupai ditunjukkan pada gambar berikut :


Data détail terkini merupakan sentra kepentingan sebagai :
  1. Mencerminkan kejadian terkini yang biasanya paling menarik.
  2. Data yang sangat besar disimpan pada level kecil.
  3. Selalu disimpan pada penyimpanan disk yang cepat diakses tetapi mahal dan kompleks dalam pengelolaannya.
Detail data yang lebih usang disimpan pada beberapa bentuk penyimpanan massal, yang tidak terlalu sering diakses dan disimpan pada sebuah detil level dengan detil data terkini.

Baca Juga: Proses dalam Data Warehouse pada Data Mining

Data yang diringkas dengan terang merupakan data yang disaring dari level detil rendah yang ditemukan pada level detil tertentu dan secara umum disimpan pada penyimpanan piringan (disk). Saat membangun gudang dat-a perlu mempertimbangkan unit waktu penyelesaian penarikan kesimpulan dan juga isi atau atribut dari ringkasan data.

Ringkasan data yang lebih tinggi padat dan gampang diakses dan sanggup ditemukan diluar gudang.
Metadata yaitu komponen final dari gudang data dan merupakan dimensi yang benar-benar berbeda yang tidak sama menyerupai data yang didapat dari lingkungan operasional tetapi dipakai sebagai:
  1. Direktori untuk membantu analis DSS menemukan isi dari gudang data.
  2. Pemandu untuk memetakan data dikala data ditransformasikan dari lingkungan operasional ke lingkungan gudang data.
  3. Pemandu algoritma- -algoritma yang dipakai untuk meringkas antara data detil terkini dan data ringkasan level bawah dan antara data ringkasan level rendah dengan data ringkasan level tinggi, dsb.
Struktur dasar ditunjukkan dalam diagram berikut :


Diagram tersebut diasumsikan pada tahun 1993 sehingga data detil terkini yaitu 1992-93. Secara umum, data penjualan tidak mencapai level detil terkini untuk 24 jam selama menunggu hingga tidak tersedia lagi sistem operasional, yaitu diharapkan 24 jam untuk mengambil ke dalam gudang data. Detil penjualan diringkas setiap ahad menurut -sub-pr0duk dan kawasan untuk menghasilkan detil ringkasan level rendah. Penjualan mingguan kemudian diringkas lagi untuk menghasilkan data ringkasan level lebih tinggi.