Thursday 12 January 2017

Data Mining




PENGERTIAN DATA MINING
Data Mining adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar. Kegunaan data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam tugas data mining. Kehadiran data mining dilatar belakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data transaksi dsb.)
Pramudiono (2006) mengemukakan bahwa pengertian data mining adalah adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.
Lalu Larose berpendapat bahwa data mining adalah bidang yang digabung dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik, database, dan visualisasi untuk pengenalan permasalahan pengambilan informasi dari database yang besar.
Pengertian data mining menurut Jiawei bahwa  data mining merupakan pemilihan atau “menambang” pengetahuan dari jumlah data yang banyak.
Definisi data mining menurut Berry bahwa data mining adalah aktivitas mengeksplorasi dan menganalisis data jumlah yang besar untuk menemukan pattern (pola) dan rule (aturan) yang berarti.

Hoffer dan McFadden mengemukakan bahwa pengertian  data mining adalah penemuan pengetahuan dengan menggunakan teknik-teknik yang tergabung dari statistik, tradisional, kecerdasan dan grafik komputer.
Pengertian data mining menurut Turban,dkk.(2005) data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan mesin learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait berbagai database besar (baca pengertian database).

Istilah Istilah khusus dalam Data Mining
  • Data cleaning (untuk menghilangkan noise data yang tidak konsisten)
  • Data integration (di mana sumber data yang terpecah dapat disatukan)
  • Data selection (di mana data yang relevan dengan tugas analisis dikembalikan ke dalam database)
  • Data transformation (di mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)
  • Data mining (proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data) – Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)
  • Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang kpada user).





CONTOH DATA MINING

Sebagai cabang ilmu baru di bidang komputer (lihat artikel sebelumnya berjudul ‘Data Mining’) cukup banyak penerapan yang dapat dilakukann oleh Data Mining. Apalagi ditunjang ke-kaya-an dan ke-anekaragam-an berbagai bidang ilmu (artificial intelligence, database, statistik, pemodelan matematika, pengolahan citra dsb.) membuat penerapan data mining menjadi makin luas. Di bidang apa saja penerapan data mining dapat dilakukan? Artikel singkat ini berusaha memberikan jawabannya.
Salah satu contoh kasus yang dapat diambil dalam penerapan data mining yaitu misalnya pada toko buku. Misalnya toko buku tersebut memiliki database pembelian buku-buku yang telah dibeli. Penjual dapat memanfaatkan database tersebut menggunakan data mining. Dengan menggunakan data mining penjual dapat mengetahui buku-buku dengan kategori apa saja yang paling banyak terjual, yang kurang banyak terjual, atau tidak pernah terjual. Selain itu penjual dapat mengetahui pada waktu-waktu kapan saja buku tertentu terjual paling banyak. Misalnya berdasarkan database penjualan, pada tahun ajaran baru, buku-buku pelajaran SD, SMP, dan SMA adalah yang paling banyak terjual. Penjual dapat menyiasatinya untuk meningkatkan pendapatan dengan cara menempatkan buku-buku pelajaran SD, SMP, dan SMA ke rak buku bagian belakang karena barang tersebut pasti dicari dan menempatkan buku-buku yang kurang banyak terjual atau tidak pernah terjual di rak buku bagian depan. Selain itu penjual dapat menambah stok buku pelajaran  SD,SMP, dan SMAnya dan menambah barang-barang lain yang kemungkinan besar terjual laris manis pada tahun ajaran baru. Misalnya pupen, buku tulis, tas, dll. Sehingga yang dijualnya bukan hanya buku-buku saja tetapi juga barang-barang lain yang juga kemungkinan besar juga ikut terjual pada tahun ajaran baru. Penjual juga dapat meningkatkan penjualannya dengan memudahkan pembeli mencari buku yang diinginkan yaitu dengan memberi label untuk setiap rak kelompok buku. Misalnya buku-buku komputer dikelompokkan dalam satu rak dan rak tersebut diberi label komputer sehingga pembeli mudah menemukannya meskipun diletakkan di rak buku bagian belakang


Analisa Pasar dan Manajemen
Untuk analisa pasar, banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup publik.
Beberapa solusi yang bisa diselesaikan dengan data mining diantaranya:
Menembak target pasar
Data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya.
Melihat pola beli pemakai dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja dia kemudian memutuskan pindah dari single account ke joint account (rekening bersama) dan kemudian setelah itu pola beli-nya berbeda dengan ketika dia masih bujangan.
Cross-Market Analysis
Kita dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu produk dengan produk lainnya. Berikut ini saya sajikan beberapa contoh:
o Cari pola penjualan Coca Cola sedemikian rupa sehingga kita dapat mengetahui barang apa sajakah yang harus kita sediakan untuk meningkatkan penjualan Coca Cola?
o Cari pola penjualan IndoMie sedemikian rupa sehingga kita dapat mengetahui barang apa saja yang juga dibeli oleh pembeli IndoMie. Dengan demikian kita bisa mengetahui dampak jika kita tidak lagi menjual IndoMie.
o Cari pola penjualan
Profil Customer
Data mining dapat membantu Anda untuk melihat profil customer/pembeli/nasabah sehingga kita dapat mengetahui kelompok customer tertentu suka membeli produk apa saja.
Identifikasi Kebutuhan Customer
Anda dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap kelompok customer dan menyusun faktor-faktor apa saja yang kira-kira dapat menarik customer baru untuk bergabung/membeli.

Menilai Loyalitas Customer
VISA International Spanyol menggunakan data mining untuk melihat kesuksesan program-program customer loyalty mereka. Anda bisa lihat di www.visa.es/ingles/info/300300.html
Informasi Summary
Anda juga dapat memanfaatkan data mining untuk membuat laporan summary yang bersifat multi-dimensi dan dilengkapi dengan informasi statistik lainnya.
Analisa Perusahaan dan Manajemen Resiko
Perencanaan Keuangan dan Evaluasi Aset
Data Mining dapat membantu Anda untuk melakukan analisis dan prediksi cash flow serta melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu Anda juga dapat menggunakannya untuk analisis trend.
Perencanaan Sumber Daya (Resource Planning)
Dengan melihat informasi ringkas (summary) serta pola pembelanjaan dan pemasukan dari masing-masing resource, Anda dapat memanfaatkannya untuk melakukan resource planning.
Persaingan (Competition)
o Sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan competitive intelligence. Data Mining dapat membantu Anda untuk memonitor pesaing-pesaing Anda dan melihat market direction mereka.
o Anda juga dapat melakukan pengelompokan customer Anda dan memberikan variasi harga/layanan/bonus untuk masing-masing grup.
o Menyusun strategi penetapan harga di pasar yang sangat kompetitif. Hal ini diterapkan oleh perusahaan minyak REPSOL di Spanyol dalam menetapkan harga jual gas di pasaran.
Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual (dilayani oleh orang). Tujuannya tidak lain adalah untuk menambah layanan otomatis khusus untuk transaksi-transaksi yang masih dilayani secara manual. Dengan demikian jumlah operator penerima transaksi manual tetap bisa ditekan minimal.
Keuangan
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry). Mereka menyatakan bahwa hal tersebut akan susah dilakukan jika menggunakan analisis standar. Anda bisa lihat di www.senate.gov/~appropriations/treasury/testimony/sloan.htm. Mungkin sudah saatnya juga Badan Pemeriksa Keuangan Republik Indonesia menggunakan teknologi ini untuk mendeteksi aliran dana BLBI.
Asuransi
Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi. Hasilnya? Mereka berhasil menghemat satu juta dollar per tahunnya. Anda bisa lihat di www.informationtimes.com.au/data-sum.htm. Tentu saja ini tidak hanya bisa diterapkan untuk asuransi kesehatan, tetapi juga untuk berbagai jenis asuransi lainnya.



KEUNTUNGAN & KERUGIAN
Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu sudut pandang komersial dan sudut pandang keilmuan. Dari sudut pandang komersial, pemanfaatan dataming dapat digunakan dalam menangani meledaknya volume data. Bagaimana mana menyimpannya, mengestraknya serta memanfaaatkannya. Berbagai teknik komputasi dapat digunakan menghasilkan informasi yang dibutuhkan. Informasi yang dihasilkan menjadi asset untuk meningkatkan daya saing suatu institusi. Data mining tidak hanya digunakan untuk menangani persoalan menumpuknya data/informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang penting (warehousing).
1. Kemampuan dalam mengolah data dalam jumlah yang besar.
2. Pencarian Data secara otomatis.
3. Dapat digunakan dalam menangani meledaknya volume data.

Kerugian Data Mining
1. Kendala Database ( Garbage in garbage out ).
2. Tidak bisa melakukan analisa sendiri.



KESIMPULAN & OPINI
Data mining menawarkan prospek yang menjanjikan ke banyak organisasi dalam usaha untuk menemukan pola yang tersembunyi dalam data mereka yang dapat digunakan untuk memprediksi prilaku pelanggan, produk, atau proses. Akan tetapi perangkat data mining membutuhkan user yang mengerti bisnis, data, prilaku umum dari metode analitis yang digunakan. Data mining yang sukses diharapkan dapat meningkatkan pendapatan atau mengurangi biaya. Membangun model hanyalah satu langkah dalam knowledge discovery. Mengumpulkan dan mempersiapkan data yang tepat, serta pengujian model dalam dunia nyata adalah sangat penting.
Perlu dilakukan penelitian untuk mengembangkan software data mining yang terintegrasi dengan peralatan QCS sehingga bisa digunakan untuk menganalisis proses secara online dan realtime.
Teknik Data Mining mempunyai beberapa algoritma. Oleh karena itu, perlu dilakukan penelitian guna mencari algoritma paling efisien yang dapat diaplikasikan pada pengendalian proses dalam industri kertas.

REFERENSI

No comments:

Post a Comment