Data Multi Dimensi


Seperti yang telah kita ketahui bahwa penggunaan data warehouse adalah dengan tujuan untuk dapat mendapatkan historis dan analisis data. Oleh karena itu, hal ini menimbulkan perbedaan yang mendasar pada data yang tersimpan dalam database biasa dengan data yang tersimpan dalam data warehouse. Namun, hal ini dapat diatasi dengan melihat data dari dimensi yang berbeda-beda atau data multi dimensi. Sebelum membahas lebih lanjut mengenai data multi dimensi, lebih baik kita membahas terlebih dahulu mengenai data mart dan model pengembangan data warehouse.
1. Data Mart
Pada postingan saya sebelumnya yang berjudul “Arsitektur Data Warehouse’, saya telah menyinggung sedikit mengenai data mart yaitu pada bagian Staging Area + Data Mart Architecture. Seperti yang saya jelaskakan disana bahwa data mart merupakan salah satu bagian dari arsitektur data warehouse tersebut. Jadi, dapat dikatakan bahwa data mart  merupakan sub bagian dari data warehouse.
Data mart mengelompokkan data dari data warehouse sesuai dengan unit kerja atau department pada perusahaan sebelum sampai pada pengguna akhir. Hal ini bertujuan agar memudahkan pengguna akhir untuk mengakses data dari data warehouse sesuai kebutuhan maupun untuk analisa data.

Dapat disimpulkan bahwa data mart merupakan bagian dari data warehouse secara keseluruhan yang berada pada access layer serta berorientasi pada spesifik proses bisnis dan kebutuhan dari unit kerja suatu perusahaan yang mengimplementasikan data warehouse.

2. Model Pengembangan Data Warehouse
Terdapat 6 model pengembangan data warehouse baik secara hierarchy maupun menggunakan user feedback. Keenam model pengembangangan tersebut adalah sebagai berikut.
  • Top Down tanpa User Feedback
Model pengembangan ini adalah yang paling sederhana dengan tujuan agar pemgguna dapat memperoleh data sesuai kebutuhan. Dimana pada pemodelan ini aliran data dimulai dari data source atau sumber data kemudian dilanjutkan ke data warehouse tanpa melakukan pengubahan apapun pada data warehouse, dan yang terakhir data dari data warehouse diteruskan atau dikelompokkan menjadi beberapa data mart. Setiap data yang mengalir baik dari data source maupun data warehouse harus mengikuti aliran Extraction , Transformation, Tranportation (ETT).

  • Buttom Up tanpa User Feedback
Sesuai dengan namanya model pengemangan ini dilakukan dari bawah ke atas atau kabalikan dari model sebelumnya yaitu top down tanpa user feedback. Dimana pada pemodelan ini aliran data dimulai dari data source atau sumber data yang dilanjutkan ke data mart dengan ETT (Extraction, Transformation, Transportation). Pada data mart dilakukan pengintegrasian data dari sumber-sumber tersebut. Kemudian data diteruskan ke data warehouse dengan kembali menggunakan ETT. Dan pada data warehouse dilakukan integrasi dan pengilangan atau redundancy data dari data mart.  

  • Paralel tanpa User Feedback
Model pengembangan ini adalah modifikasi dari model top down tanpa user feedback, namun yang membedakan adalah data mart tidak sepenuhnya bergantung pada data warehouse dalam memperoleh sumber data. Langkah pertama pada pemodelan ini adalah membangun data warehouse dari berbagai sumber data, terbentuklah suatu data model di dalam data warehouse yang jemudian menjadi acuan untuk membentuk data mart. Langkah selanjutnya ialah setelah data mart terbentuk, data mart tersebut ikut berperan dalam membangun data warehouse melalui integrasi di level data.

  • Top Down beserta User Feedback
Model pengembangan ini berasal dari data source yang dintegrasikan di level data kemudian disatukan ke dalam data warehouse. Kemudian dari data warehouse dibentuklah beberapa data mart sesuai kebutuhan pengguna. Setelah data sampai pada pengguna munculah feedback dari pengguna (user feedback) yang nantinya akan digunakan sebagai acuan dalam pengembangan berkelanjutan pada data mart dan data warehouse itu sendiri. Oleh karena itu, terjadilan aliran bolak-balik dari pengguna berupa user feedback ke data mart dan dilanjutkan ke data warehouse.

  • Buttom Up beserta User Feedback
Model pengembangan ini dimulai dari pembentukan dua atau lebih data mart dari sumber data (data source) yang menggunakan ETT (extraction, transformation, transportation) dan dilalukan integrasi pada level data. Kemudian dibentuk data warehouse dari data mart menggunakan kembali ETT untuk mengintegrasikan dari dari data mart ke dalam kesatuan data warehouse. Selanjutnya pengguna dapat mengakses data dari data warehouse  dan memberi feedback untuk kelanjutan pengembangan data warehouse, feedback tersebut akan mempengaruhi data mart yang membentuk data warehouse tersebut.

  • Paralel beserta User Feedback
Model pengembangan ini dimulai dari data source yang dialirkan ke dalam data mart dan data warehouse. Data yang dialirkan langsung ke data mart harus melalui proses ETT (Extraction, Transformation, Transportation). Sedangkan, data yang dialirkan langsung ke data warehouse tidak melalui proses ETT, namun sebelum masuk ke data warehouse terlebih dahulu masuk ke data model dari data warehouse untuk menyamakan format data. Dan yang terakhir, user feedback atau feedback dari pengguna dialirkan melalui interface ke data mart.

3. Data Multi Dimensi
Data multi dimensi berbeda dengan data relasional yang biasa kita kenal pada database biasa. Dimana data relasional ialah bentuk hubungan antar data melalui tabel yang berelasi dalam stuktur hirarkis dan berada pada 2 dimensi atau hanya terdiri dari baris dan kolom. Data relasional merupakan data transaksional da memanipulasi data tanpa menyimpan data historis.
Data multi dimensi atau multi dimensional data (MDD) adalah physical data model atau dalam bahasa Indoensia model data fisik, dengan struktur yang dapat dilihat dari berbagai sudut pandang (dimensi) dan terdiri dari 3 bagian yaitu baris, kolom, dan layer. Objek yang terdapat didalmnya merupaan objek data multi dimensi yang atribtnya dibedakan menjadi 2 jenis yaitu atribut dimensi dan pengukuran. Data multi dimensi dapat diumpamakan sebagai bentuk koordinat yang ditunjukkan dalam 3 sumbu yaitu x, y, z atau bangun 3 dimensi yang memiliki panjang, lebar, dan tinggi. Contoh dari data multi dimensi misalkan untuk melihat data produksi suatu barang diperlukab dimensi barang yang diproduksi, dimensi waktu produksi, dan dimensi jumlah produksi.

Dari penjelasan diatas dapat disimpulkan bahwa istilah yang telah kita kenal sebelumnya yaitu OLTP (On Line Transactional Data) dan OLAP (On Line Analytical Data). Dimana OLTP merupakan data 2 dimensi dan OLAP merupakan data multi dimensi. Slicing atau pemotongan data berlapis (data multi dimensi) sangat berguna untuk mengambil data yang tepat untuk kebutuhan analisa.

Sumber :
Pratama, I Putu Agus Eka. 2017. Handbook Data Warehouse. Bandung. Penerbit Informatika.

Komentar

Postingan populer dari blog ini

ERP pada UKM/UMKM

Tutorial Install Pentaho Business Intelligence

Pengantar Enterprise Resource Planning