Halaman

Rabu, 15 Mei 2013

Learning From Data



Data Warehouse
Data warehouse adalah suatu paradigma baru dilingkungan pengambilan keputusan strategik. Data warehouse bukan suatu produk tetapi suatu lingkungan dimana user dapat menemukan informasi strategic [Poniah, 2001, h.14]. Data warehouse adalah kumpulan data-data logik yang terpisah dengan database operasional dan merupakan suatu ringkasan.

Adapun karakteristik dari data warehouse [Poniah, 2001,h.20-24] adalah sebagai berikut.
1. Berorientasi subyek
Data warehouse adalah tempat penyimpanan berdasakan subyek bukan berdasakan aplikasi. Subyek merupakan bagian dari suatu perusahaan. Contoh subyek pada perusahaan manufaktur adalah penjualan, konsumen, inventori, daln lain sebagainya. Sumber: Poniah, 2001,h.21
Gambar 1. perbedaan data warehouse dan database operasional Untuk lebih jelasnya mengenai perbedaan antara database operasional dengan data warehouse bisa dilihat pada tabel 1 dibawah ini.
2. Data yang terintegrasi
Sumber data yang ada dalam data warehouse tidak hanya berasal dari database operasional (internal source) tetapi juga berasal dari data diluar sistem (external source). Data pada sumber berbeda dapat di-encode dengan cara yang berbeda. Sebagai contoh, data jenis kelamin dapat dienkode
sebagai 0 dan 1 di satu tempat dan ”m” dan ”f” di tempat lain.
3. Nonvolatile
Data dalam database operasional akan secara berkala atau periodic dipindahkan kedalam data warehouse sesuai dengan jadwal yang sudah ditentukan. Misal perhari, perminggu, perbulan, dan lain sebagainya. Sekali masuk ke dalam data warehouse, data adalah read-only . Pada gambar 2
dibawah ini bisa dilihat bahwa database OLTP bisa dibaca, diupdate, dan dihapus. Tetapi pada database data warehouse hanya bisa dibaca.Sumber: Poniah, 2001,h.24 Gambar 2 Data warehouse adalah nonvolatile
4. Time-Variant
Sistem operasional mengandung data yang bernilai sekarang sedangkan data dalam data warehouse mengandung data tidak hanya data terkini tetapi juga data history yang akan digunakan dalam analisis dan pengambilan keputusan. Waktu adalah dimensi penting yang harus didukung oleh semua data warehouse. Data untuk analisis dari berbagai sumber berisi berbagai nilai waktu, misalkan harian, mingguan, dan bulanan.
5. Ringkas
Jika diperlukan, data operasional dikumpulkan ke dalam ringkasanringkasan.
6. Granularity
Pada sistem operasional data dibuat secara real-time sehingga untuk mendapatkan informasi langsung dilakukan proses query. Pada data warehouse pada menganalisis harus memperhatikan level-of-detail misalkan perhari, ringkasan perbulan, ringkasan per-tiga-bulan.
7. Tidak ternormalisasi
Data di dalam sebuah data warehouse biasanya tidak ternormalisasi dan
sangat redundan. Dasar dari suatu data warehouse adalah suatu data yang besar yang mengandung informasi bisnis. Data-data yang ada di dalam data warehouse bisa berasal dari banyak sumber, misalkan dari database operasional atau transaksional dan sumber dari luar misalkan dari web, penyedia jasa informasi, dari perusahaan lain, dan lain sebagainya. Data warehouse mengandung beberapa elemen penting antara lain [Mallach, 2000,h.473]:
1. Sumber data yang digunakan oleh data warehouse, database transaksional dan sumber data eksternal.
2. Proses ETL (Extraction, Transformation, Loading) dari sumber data kedatabase data warehouse.
3. Membuat suatu ringkasan atau summary terhadap data warehouse misalkan dengan menggunakan fungsi agregat.
4. Metadata.
Metadata mengacu data tentang data. Metadata menguraikan struktur dan beberapa arti tentang data, dengan demikian mendukung penggunaan efektif atau tidak efektif dari data.
5. Database data warehouse.
Database ini berisi data yang detail dan ringkasan data dari data yang ada di dalam data warehouse. Karena data warehouse tidak digunakan dalam proses transaksi individu, maka databasenya tidak perlu
diorganisasikan untuk akses transaksi dan untuk pengambilan data, melainkan dioptimisasikan untuk pola akses yang berbeda di dalam analisis.
6. Query Tools yaitu dengan OLAP (Online Analytical Processing ) dan data
mining. Tool untuk query ini meliputi antarmuka pengguna akhir dalam mengajukan pertanyaan kepada database, dimana proses ini disebut sebagai On-line Analytical Processing (OLAP). Tool ini juga terdiri dari tool otomatis yang menemukan pola-pola di dalam data, yang sering disebut sebagai data mining. Data warehouse harus memiliki salah satu dari kedua tipe ini atau malah kedua-duanya.
7. User.Pengguna yang memanfaatkan data warehouse tersebut.


Sumber :
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CDkQFjAA&url=http%3A%2F%2Fresearch.amikom.ac.id%2Findex.php%2FJD%2Farticle%2Fdownload%2F484%2F106&ei=gTmTUYCpIdGzrAfFnoHwCA&usg=AFQjCNFtloo_TrvVhq426zLVjFyXothEpA&sig2=MvSVBr2RUVNXSg5unVIHHQ&bvm=bv.46471029,d.bmk

0 komentar:

Posting Komentar