Perbedaan Istilah Data Warehouse dan Data Mining
Pertanyaan soal perbedaan kedua istilah ini terkadang sulit untuk dipahami, sering kali kita bingung karena kedua istilah tersebut mirip-mirip, sering dipertukarkan dan banyak bersinggungan dalam konteks yang sama.
Kita mulai cari definisi data warehouse dulu. Saya coba ambil salah satu definisi yang ada pada bukunya Vincent Rainardi - Building a Data Warehouse With Examples in SQL Server. Beliau menyampaikan definisi sebagai berikut.
A data warehouse is a system that retrieves and consolidates data periodically from the source systems into a dimensional or normalized data store. It usually keeps years of history and is queried for business intelligence or other analytical activities. It is typically updated in batches, not every time a transaction happens in the source system.
Jadi data warehouse merupakan suatu sistem yang mengkonsolidasikan data secara periodik dari sistem-sistem yang ada (OLTP) ke dalam suatu penyimpanan dimensional. Pada umumnya, data warehouse menyimpan data histori beberapa tahun dan di-quey untuk keperluan business intelligence atau aktifitas analisis lainnya. Data warehouse diremajakan secara batch, tidak serta-merta setiap terjadinya transaksi pada sistem-sistem sumber tersebut.
Dari penjelasan di atas terlihat jelas perbedaan antara data warehouse dibandingkan business intelligence ataupun data mining.
Sebagai tambahan informasi, perkembangan saat ini data warehouse digunakan sebagai sumber data untuk Business Intelligence (BI), penyempurnaan CRM (Customer Relationship Management) ataupun Data Mining (DM).
Lalu, apa yang dimaksud dengan Data Mining?
Coba kita buka lagi, definisi data mining dari buku tersebut. Dalam buku tersebut, kita coba telaah paragraph berikut ini :
Data mining is a field that has been growing fast in the past few years. It is also known as knowledge discovery, because it includes trying to find meaningful and useful information from a large amount of data. It is an interactive or automated process to find patterns describing the data and to predict the future behavior of the data based on these patterns.
Data Mining disebut juga knowledge discovery karena merupakan bidang yang berupaya untuk menemukan informasi yang punya arti dan berguna dari jumlah data yang besar. Data mining merupakan suatu proses yang interaktif atau terotomatisasi untuk menemukan pola (pattern) data tersebut dan memprediksi kelakuan (trend) di masa mendatang berdasarkan pola data tersebut.
Nah, mudah-mudahan dengan penjelasan singkat tersebut, sekarang kita sudah bisa membedakan kedua istilah tersebut.
Semoga bermanfaat.