PENGERTIAN DATA MINING
Data Mining adalah kegiatan yang meliputi
pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan
hubungan dalam set data berukuran besar. Kegunaan data mining adalah untuk
menspesifikasikan pola yang harus ditemukan dalam tugas data mining. Kehadiran
data mining dilatar belakangi dengan problema data explosion yang dialami
akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun
lamanya (data pembelian, data penjualan, data nasabah, data transaksi dsb.)
Pramudiono
(2006) mengemukakan bahwa pengertian data mining adalah adalah serangkaian
proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan
yang selama ini tidak diketahui secara manual.
Lalu
Larose berpendapat bahwa data mining adalah bidang yang digabung dari beberapa
bidang keilmuan yang menyatukan teknik dari pembelajaran mesin, pengenalan
pola, statistik, database, dan visualisasi untuk pengenalan permasalahan
pengambilan informasi dari database yang besar.
Pengertian
data mining menurut Jiawei bahwa data
mining merupakan pemilihan atau “menambang” pengetahuan dari jumlah data yang
banyak.
Definisi
data mining menurut Berry bahwa data mining adalah aktivitas mengeksplorasi dan
menganalisis data jumlah yang besar untuk menemukan pattern (pola) dan rule
(aturan) yang berarti.
Hoffer
dan McFadden mengemukakan bahwa pengertian
data mining adalah penemuan pengetahuan dengan menggunakan teknik-teknik
yang tergabung dari statistik, tradisional, kecerdasan dan grafik komputer.
Pengertian
data mining menurut Turban,dkk.(2005) data mining adalah proses yang
menggunakan teknik statistik, matematika, kecerdasan buatan, dan mesin learning
untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait berbagai database besar (baca pengertian database).
Istilah Istilah khusus dalam Data
Mining
- Data cleaning (untuk menghilangkan noise data yang tidak konsisten)
- Data integration (di mana sumber data yang terpecah dapat disatukan)
- Data selection (di mana data yang relevan dengan tugas analisis dikembalikan ke dalam database)
- Data transformation (di mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)
- Data mining (proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data) – Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)
- Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang kpada user).
CONTOH DATA MINING
Sebagai cabang ilmu baru di bidang komputer (lihat artikel sebelumnya berjudul ‘Data Mining’) cukup banyak penerapan yang dapat dilakukann oleh Data Mining. Apalagi ditunjang ke-kaya-an dan ke-anekaragam-an berbagai bidang ilmu (artificial intelligence, database, statistik, pemodelan matematika, pengolahan citra dsb.) membuat penerapan data mining menjadi makin luas. Di bidang apa saja penerapan data mining dapat dilakukan? Artikel singkat ini berusaha memberikan jawabannya.
Salah
satu contoh kasus yang dapat diambil dalam penerapan data mining yaitu misalnya
pada toko buku. Misalnya toko buku tersebut memiliki database pembelian
buku-buku yang telah dibeli. Penjual dapat memanfaatkan database tersebut
menggunakan data mining. Dengan menggunakan data mining penjual dapat
mengetahui buku-buku dengan kategori apa saja yang paling banyak terjual, yang
kurang banyak terjual, atau tidak pernah terjual. Selain itu penjual dapat
mengetahui pada waktu-waktu kapan saja buku tertentu terjual paling banyak.
Misalnya berdasarkan database penjualan, pada tahun ajaran baru, buku-buku
pelajaran SD, SMP, dan SMA adalah yang paling banyak terjual. Penjual dapat
menyiasatinya untuk meningkatkan pendapatan dengan cara menempatkan buku-buku
pelajaran SD, SMP, dan SMA ke rak buku bagian belakang karena barang tersebut
pasti dicari dan menempatkan buku-buku yang kurang banyak terjual atau tidak
pernah terjual di rak buku bagian depan. Selain itu penjual dapat menambah stok
buku pelajaran SD,SMP, dan SMAnya dan
menambah barang-barang lain yang kemungkinan besar terjual laris manis pada
tahun ajaran baru. Misalnya pupen, buku tulis, tas, dll. Sehingga yang
dijualnya bukan hanya buku-buku saja tetapi juga barang-barang lain yang juga
kemungkinan besar juga ikut terjual pada tahun ajaran baru. Penjual juga dapat
meningkatkan penjualannya dengan memudahkan pembeli mencari buku yang
diinginkan yaitu dengan memberi label untuk setiap rak kelompok buku. Misalnya
buku-buku komputer dikelompokkan dalam satu rak dan rak tersebut diberi label
komputer sehingga pembeli mudah menemukannya meskipun diletakkan di rak buku
bagian belakang
Analisa Pasar dan Manajemen
Untuk
analisa pasar, banyak sekali sumber data yang dapat digunakan seperti transaksi
kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli,
ditambah dengan studi tentang gaya hidup publik.
Beberapa
solusi yang bisa diselesaikan dengan data mining diantaranya:
•
Menembak target pasar
Data
mining dapat melakukan pengelompokan (clustering) dari model-model pembeli dan
melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang
diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan
membeli dan karakteristik lainnya.
•
Melihat pola beli pemakai dari waktu ke
waktu
Data
mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu.
Sebagai contoh, ketika seseorang menikah bisa saja dia kemudian memutuskan
pindah dari single account ke joint account (rekening bersama) dan kemudian
setelah itu pola beli-nya berbeda dengan ketika dia masih bujangan.
•
Cross-Market Analysis
Kita
dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu produk
dengan produk lainnya. Berikut ini saya sajikan beberapa contoh:
o
Cari pola penjualan Coca Cola sedemikian rupa sehingga kita dapat mengetahui
barang apa sajakah yang harus kita sediakan untuk meningkatkan penjualan Coca
Cola?
o
Cari pola penjualan IndoMie sedemikian rupa sehingga kita dapat mengetahui
barang apa saja yang juga dibeli oleh pembeli IndoMie. Dengan demikian kita
bisa mengetahui dampak jika kita tidak lagi menjual IndoMie.
o
Cari pola penjualan
•
Profil Customer
Data
mining dapat membantu Anda untuk melihat profil customer/pembeli/nasabah
sehingga kita dapat mengetahui kelompok customer tertentu suka membeli produk
apa saja.
•
Identifikasi Kebutuhan Customer
Anda
dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap kelompok
customer dan menyusun faktor-faktor apa saja yang kira-kira dapat menarik
customer baru untuk bergabung/membeli.
•
Menilai Loyalitas Customer
VISA
International Spanyol menggunakan data mining untuk melihat kesuksesan
program-program customer loyalty mereka. Anda bisa lihat di
www.visa.es/ingles/info/300300.html
•
Informasi Summary
Anda
juga dapat memanfaatkan data mining untuk membuat laporan summary yang bersifat
multi-dimensi dan dilengkapi dengan informasi statistik lainnya.
Analisa
Perusahaan dan Manajemen Resiko
•
Perencanaan Keuangan dan Evaluasi Aset
Data
Mining dapat membantu Anda untuk melakukan analisis dan prediksi cash flow
serta melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu
Anda juga dapat menggunakannya untuk analisis trend.
•
Perencanaan Sumber Daya (Resource
Planning)
Dengan
melihat informasi ringkas (summary) serta pola pembelanjaan dan pemasukan dari
masing-masing resource, Anda dapat memanfaatkannya untuk melakukan resource
planning.
•
Persaingan (Competition)
o
Sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan competitive
intelligence. Data Mining dapat membantu Anda untuk memonitor pesaing-pesaing
Anda dan melihat market direction mereka.
o
Anda juga dapat melakukan pengelompokan customer Anda dan memberikan variasi
harga/layanan/bonus untuk masing-masing grup.
o
Menyusun strategi penetapan harga di pasar yang sangat kompetitif. Hal ini
diterapkan oleh perusahaan minyak REPSOL di Spanyol dalam menetapkan harga jual
gas di pasaran.
Telekomunikasi
Sebuah
perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan
transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara
manual (dilayani oleh orang). Tujuannya tidak lain adalah untuk menambah
layanan otomatis khusus untuk transaksi-transaksi yang masih dilayani secara
manual. Dengan demikian jumlah operator penerima transaksi manual tetap bisa
ditekan minimal.
Keuangan
Financial
Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data
mining untuk me-nambang trilyunan dari berbagai subyek seperti property,
rekening bank dan transaksi keuangan lainnya untuk mendeteksi
transaksi-transaksi keuangan yang mencurigakan (seperti money laundry). Mereka
menyatakan bahwa hal tersebut akan susah dilakukan jika menggunakan analisis
standar. Anda bisa lihat di
www.senate.gov/~appropriations/treasury/testimony/sloan.htm. Mungkin sudah
saatnya juga Badan Pemeriksa Keuangan Republik Indonesia menggunakan teknologi
ini untuk mendeteksi aliran dana BLBI.
Asuransi
Australian
Health Insurance Commision menggunakan data mining untuk mengidentifikasi
layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh
peserta asuransi. Hasilnya? Mereka berhasil menghemat satu juta dollar per
tahunnya. Anda bisa lihat di www.informationtimes.com.au/data-sum.htm. Tentu
saja ini tidak hanya bisa diterapkan untuk asuransi kesehatan, tetapi juga
untuk berbagai jenis asuransi lainnya.
KEUNTUNGAN & KERUGIAN
Pemanfaatan data mining dapat dilihat dari dua
sudut pandang, yaitu sudut pandang komersial dan sudut pandang keilmuan. Dari
sudut pandang komersial, pemanfaatan dataming dapat digunakan dalam menangani
meledaknya volume data. Bagaimana mana menyimpannya, mengestraknya serta
memanfaaatkannya. Berbagai teknik komputasi dapat digunakan menghasilkan
informasi yang dibutuhkan. Informasi yang dihasilkan menjadi asset untuk
meningkatkan daya saing suatu institusi. Data mining tidak hanya digunakan
untuk menangani persoalan menumpuknya data/informasi dan bagaimana
menggudangkannya tanpa kehilangan informasi yang penting (warehousing).
1.
Kemampuan dalam mengolah data dalam jumlah yang besar.
2.
Pencarian Data secara otomatis.
3.
Dapat digunakan dalam menangani meledaknya volume data.
Kerugian Data Mining
1.
Kendala Database ( Garbage in garbage out ).
2.
Tidak bisa melakukan analisa sendiri.
KESIMPULAN & OPINI
Data mining menawarkan prospek yang
menjanjikan ke banyak organisasi dalam usaha untuk menemukan pola yang
tersembunyi dalam data mereka yang dapat digunakan untuk memprediksi prilaku
pelanggan, produk, atau proses. Akan tetapi perangkat data mining membutuhkan user
yang mengerti bisnis, data, prilaku umum dari metode analitis yang digunakan.
Data mining yang sukses diharapkan dapat meningkatkan pendapatan atau
mengurangi biaya. Membangun model hanyalah satu langkah dalam knowledge
discovery. Mengumpulkan dan mempersiapkan data yang tepat, serta pengujian
model dalam dunia nyata adalah sangat penting.
Perlu dilakukan penelitian untuk
mengembangkan software data mining yang terintegrasi dengan peralatan QCS
sehingga bisa digunakan untuk menganalisis proses secara online dan realtime.
Teknik Data Mining mempunyai beberapa
algoritma. Oleh karena itu, perlu dilakukan penelitian guna mencari algoritma
paling efisien yang dapat diaplikasikan pada pengendalian proses dalam industri
kertas.
REFERENSI
No comments:
Post a Comment