1. Data Mining
Data mining disebut juga pattern
recognition yaitu sebuah algoritma untuk mengelola data guna menemukan pola
yang masih tersembunyi sehingga menghasilkan suatu pengetahuan baru dari data
yang diolah tersebut (Sadewo,dkk, 2018:312). Sedangkan
Data mining menurut Vulandari(2017:1) menjelaskan bahwa “serangkaian
untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui
secara manual dari suatu basisdata. Informasi yang dihasilkan diperoleh dengan
cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang
terdapat di basisdata”.
Langkah–langkah penting yang dilakukan dalam
proses penambangan pengetahuan dari data secara umum menurut Tan dalam Vulandari(2017:2) yaitu:
- Pembersihan data untuk membuang data yang tidak konsisten dan noise.
- Integrasi data yaitu penggabungan data dari beberapa sumber.
- Transformasi data yaitu data diubah menjadi bentuk yang sesuai untuk di mining
- Aplikasi teknik data mining, proses ekstraksi pola dari data yang ada.
- Evaluasi pola yang ditemukan, yaitu proses interpretasi pola menjadi pengetahuan yang dapat digunakan untuk mendukung pengambilan keputusan
- Presentasi pengetahuan dengan teknik visualisasi
Sumber : Tan dalam Vulandari(2017)
Menurut Abdillah,et al(2016:499) membahas mengenai tiga karakteristik dari data mining
yaitu :
- Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya.
- Data mining bisa menggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya.
- Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi.
- Dari sudut pandang komersial, pemanfaatan data mining dapat digunakan untuk menangani meledaknya volume data, dengan menggunakan teknik komputasi dapat digunakan untuk menghasilkan informasi-informasi yang dibutuhkan yang merupakan asset yang dapat meningkatkan daya saing suatu institusi.
- Dari sudut pandang keilmuan, data mining dapat digunakan untuk mengcapture, menganalisis serta menyimpan data yang bersifat real time dan sangat besar.
Pengelompokkan data mining dibagi menjadi beberapa
kelompok berdasarkan fungsi-fungsi umum yang dapat diterapkan menurut Haskett
dalam Vulandari(2017:4) yaitu:
- Assosiation, adalah proses untuk menemukan aturan asosiasi antara suatu kombinasi item dalam suatu waktu.
- Sequence, proses untuk menemukan aturan asosiasi antara suatu kombinasi item dalam suatu waktu dan diterapkan lebih dari satu periode.
- Clustering, adalah proses pengelompokkan sejumlah data/objek ke dalam kelompok data sehingga setiap kelompok berisi data yang mirip.
- Classification, proses penemuan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data,dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
- Regression, adalah proses pemetaan data dalam suatu nilai prediksi.
- Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan pola-pola di dalam sekumpulan data
- Solution, adalah proses penemuan akar masalah dan problem solving dari persoalan bisnis yang dihadadapi atau paling tidak sebagai informasi dalam pengambilan keputusan.
Tidak ada komentar:
Posting Komentar