Pages

Tuesday, January 17, 2012

DATA MINING


Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar.
Selain itu juga ada beberapa definisi dari data mining yang dikenal di buku-buku teks data mining. Diantaranya adalah :

  • Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.
  • Data mining adalah analisa otomatis dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaannya.

Menarik untuk diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. 
Dari definisi-definisi itu, dapat dilihat ada beberapa faktor yang mendefinisikan data mining :
  1. Data mining adalah proses otomatis terhadap data yang dikumpulkan di masa lalu
  2. Objek dari data mining adalah data yang berjumlah besar atau kompleks
  3. Tujuan dari data mining adalah menemukan hubungan-hubungan atau pola-pola yang mungkin memberikan indikasi yang bermanfaat.

Data mining untuk mengekstraksi pengetahuan secara otomatis dari data berukuran besar dengan cara mencari pola-pola menarik yang terkandung di dalam data tersebut. Data mining memiliki banyak fungsionalitas, antara lain pembuatan ringkasan data, analisis asosiasi antar data, klasifikasi data, 
prediksi, dan pengelompokan data. Setiap fungsionalitas akan menghasilkan pengetahuan atau pola yang berbeda satu sama lain.
Pada klasifikasi, akan dihasilkan sebuah model yang dapat memprediksi kelas atau kategori dari objekobjek di dalam basisdata. 
Sebagai contoh :
  1. Klasifikasi dapat digunakan oleh petugas peminjaman uang di sebuah bank untuk memprediksi pemohon mana yang aman dan mana yang beresiko untuk diberi pinjaman. Model klasifikasi dibuat untuk memprediksi kelas ”aman” atau ”beresiko” untuk data permohonan pinjaman; ”beli” atau ”tidak”  untuk data pemasaran.
  2. Oleh manajer pemasaran di sebuah toko elektronik untuk memprediksi apakah seorang pelanggan akan membeli komputer baru, 
  3. Oleh periset di bidang medis untuk memprediksi jenis pengobatan apa yang cocok diberikan kepada seorang pasien dengan penyakit tertentu. ”pengobatan-1”, ”pengobatan-2”, atau ”pengobatan-3” untuk data medis. 

Model klasifikasi dibuat dengan cara menganalisis training data (terdiri dari objek-objek yang kelasnya sudah diketahui). Model yang dihasilkan kemudian akan digunakan untuk memprediksi kelas dari unknown data (terdiri dari objek-objek yang kelasnya belum diketahui). 
Model klasifikasi dapat digambarkan dalam beberapa bentuk, seperti aturan klasifikasi (IF-THEN), pohon keputusan, rumus matematika, atau jaringan saraf tiruan. 
Pohon keputusan banyak digunakan karena mudah dipahami oleh manusia serta mampu menangani data beratribut banyak.

0 comments:

Post a Comment

Silahkan Tambahkan Komentar Anda dan Silahkan Tuliskan Yang anda ingin ketahui menengenai Topik Diatas.
Terimakasih