Information Sharing a Principle Component of the National Strategy for Homeland Security Vignette
• Jaringan dari sistem yang memberikan distribusi dan integrasi knowledge
• Horizontal and vertical information sharing
• Peningkatan komunikasi
• Data Mining tersimpan dalam data warehouse yang memungkinkan diakses melalui Web
Data, Information, Knowledge
• Data
– Sesuatu yang menjadi gambaran paling mendasar mengenai benda, peristiwa, aktivitas dan transaksi
– Terdiri dari internal atau eksternal
• Informasi
– Data yang telah diolah menjadi sesuatu yang lebih berarti dan bernilai
• Knowledge
– Data yang telah diolah atau informasi yang lebih berarti atau proses pembelajaran terhadap suatu masalah atau aktifitas
Data
• Data mentah diperoleh secara manual atau menggunakan instrumen
• Kualitas merupakan sesuatu yang penting
– Kualitas menentukan manfaat
• Contextual data quality
• Intrinsic data quality
• Accessibility data quality
• Representation data quality
– Sering kali terlupakan atau ditangani begitu saja
– Masalah akan terungkap ketika data terangkum
Data Problems
• Membersihkan data
– Ketika menggunakan warehouse
– Data quality action plan
– Best practices untuk kualitas data
– Mengukur hasil
• Topik terkait dengan Integritas Data
– Uniformity (Keseragaman)
– Version
– Completeness check (Periksa kelengkapan)
– Conformity check (Periksa konsistensi)
– Genealogy or drill-down (turunan)
• Integrasi Data
• Diperlukan akses ke berbagai sumber
– Seringkali berskala besar (enterprise-wide)
– Database yang berbeda dan heterogen
– XML menjadi bahasa standard
Sumber Data Eksternal
• Web
– Intelligent agents
– Document management systems
– Content management systems
• Commercial databases
– Menjual akses ke database tertentu
Database Management Systems
• Software program
• Mendukung Sistem Operasi
• Mengelola data
• Menjalankan Query dan menghasilkan reports
• Keamanan Data
• Dikombinasikan dengan modeling language untuk pengembangan DSS
Database Models
• Hierarchical
– Top down, seperti struktur pohon
– Fields hanya memiliki satu “parent”, setiap “parent” dapat memiliki beberapa “children”
– Cepat
• Network
– Relationships dibuat melalui linked lists, dengan menggunakan pointers
– “Children” dapat memiliki beberapa “parents”
– Sangat fleksibel
• Relational
– Flat, tabel dua dimensi dengan multiple access queries
– Menganalisa relasi antar tabel
– Fleksibel, cepat, dan diperluas dengan data independence
• Object oriented
– Data dianalisa pada tingkat konseptual
– Inheritance, abstraction, encapsulation
Database Structure
• Multimedia Based
– Multiple data formats
• JPEG, GIF, bitmap, PNG, sound, video, virtual reality
– Membutuhkan hardware tertentu untuk dapat menampilkan semua feature yang tersedia
• Document Based
– Penyimpanan dan manajemen dokumen
• Intelligent
– Intelligent agents dan Artificial Neural Network
• Inference engines
Data Warehouse
• Subject oriented
• Sudah dibersihkan sehingga data menjadi standar meski diperoleh dari berbagai sumber
• Time series; no current status
• Nonvolatile
– Read only
• Rangkuman
• Tidak normal; mungkin saja terjadi kerangkapan data (redundant)
• Menyajikan data dari sumber internal dan eksternal
• Mencakup Metadata
– Data tentang data
• Business metadata
• Semantic metadata
ARSITEKTUR
• May have one or more tiers
– Ditentukan oleh warehouse, data acquisition (back end), dan client (front end)
• One tier, dimana semua dijalankan dalam platform yang sama, sangat jarang
• Two tier biasanya menggabungkan DSS engine (client) dengan warehouse
– Lebih ekonomis
• Three tier memisahkan kedua fungsi ini (DSS engine dan warehouse)
Data Warehouse Framework and Views
Migrasi Data
• Business rules
– Tersimpan dalam metadata repository
– Diaplikasikan pada data warehouse secara terpusat
• Data di-extract dari berbagai sumber yang relevan
– Di-load melalui data-transformation tools atau programs
– Terpisah antara operation dan decision support environments
• Memperbaiki masalah kualitas sebelum data disimpan
– Proses membersihkan dan mengorganisasikan dilakukan dengan konsisten
Perancangan Data Warehouse
• Dimensional modeling
– Retrieval based
– Diimplementasikan dengan star schema
• Central fact table
• Dimension tables
• Grain
– Highest level of detail
– Drill-down analysis
Pengembangan Data Warehouse
• Teknik Implementasi Data warehouse
– Top down
– Bottom up
– Hybrid
– Federated
• Projects may be data centric or application centric
• Implementation factors
– Organizational issues
– Project issues
– Technical issues
• Scalable
• Fleksibel
Data Marts
• Dependent
– Dibuat dari warehouse
– Replika
• Functional subset dari warehouse
• Independent
– Skala lebih kecil, versi data warehouse yang “lebih murah”
– Dirancang untuk sebuah departemen/bagian
– Perusahaan mungkin saja memiliki beberapa data marts
• Sulit untuk diintegrasikan
Business Intelligence and Analytics
• Business intelligence
– Akuisisi/penggabungan dari data dan informasi untuk digunakan dalam kegiatan pengambilan keputusan
• Business analytics
– Models and solution methods
• Data mining
– Menerapkan model dan metod pada data untuk mengidentifikasi pola dan kecenderungan (trend)
OLAP
• Aktivitas yang dilakukan oleh end users pada online systems
– Specific, open-ended query generation
• SQL
– Ad hoc reports
– Statistical analysis
– Building DSS applications
• Modeling and visualization capabilities
• Special class of tools
– DSS/BI/BA front ends
– Data access front ends
– Database front ends
– Visual information access systems
Data Mining
• Mengorganisasikan dan menggunakan informasi dan knowledge dari beberapa database
• Statistical, mathematical, artificial intelligence, and machine-learning techniques
• Otomatis dan cepat
• Tools yang digunakan untuk mencari pola
– Simple models
– Intermediate models
– Complex Models
• Data mining application classes of problems
– Classification
– Clustering
– Association
– Sequencing
– Regression
– Forecasting
– Others
• Hypothesis or discovery driven
• Iterative
• Scalable
Tools and Techniques
• Data mining
– Statistical methods
– Decision trees
– Case based reasoning
– Neural computing
– Intelligent agents
– Genetic algorithms
• Text Mining
– Hidden content
– Group by themes
– Determine relationships
Knowledge Discovery in Databases
• Data mining digunakan untuk mencari pola (patterns) dalam data
– Identifikasi data
– Preprocessing
– Transformasi ke format yang umum
– Data mining melalui algoritma
– Evaluasi
Data Visualization
• Teknologi pendukung visualisasi dan interpretasi
– Digital imaging, GIS, GUI, tables, multidimensions, graphs, VR, 3D, animation
– Mengidentifikasi relasi dan trends
• Manipulasi Data memungkinkan untuk melihat performance data secara real time
Multidimensionality
• Data diorganisasikan menurut standar bisnis, bukan ditentukan oleh seorang analis
• Konseptual
• Faktor
– Dimensi
– Ukuran
– Waktu
• Overhead dan storage yang signifikan
• Mahal
• Kompleks
Analytic systems
• Real-time queries and analysis
• Real-time decision-making
• Real-time data warehouses yang di-update harian atau lebih sering
– Update dapat dilakukan bersamaan dengan menjalankan query
– Tidak semua data ter-update secara terus menerus
• Pengunaan aplikasi business analytic
GIS
• Sistem terkomputerisasi untuk mengelola dan memanipulasi data dengan peta digital
– Berorientasi Geografis
– Geographic spreadsheet for models
– Software memungkinkan web mengakses peta
– Digunakan untuk modeling dan simulasi
GIS Application

Web Analytics/Intelligence
• Web analytics
– Aplikasi dari business analytics pada Web sites
• Web intelligence
– Aplikasi dari teknik business intelligence pada Web sites




No comments:
Post a Comment