Definicja
Data Warehouse (hurtownia danych) to centralne repozytorium integrujące dane z wielu źródeł, zoptymalizowane pod kątem zapytań analitycznych (OLAP).
DW vs baza operacyjna
| Aspekt |
Baza operacyjna (OLTP) |
Data Warehouse (OLAP) |
| Cel |
Przetwarzanie transakcji |
Analiza i raportowanie |
| Zapytania |
Proste (INSERT/UPDATE) |
Złożone (GROUP BY, JOIN, agregacje) |
| Dane |
Bieżące |
Historyczne (lata) |
| Schemat |
Znormalizowany (3NF) |
Zdenormalizowany (star/snowflake) |
| Użytkownicy |
Aplikacje |
Analitycy, BI tools |
Modele danych w DW
| Model |
Opis |
| Star schema |
Tabela faktów + tabele wymiarów (prosta, szybka) |
| Snowflake schema |
Star z znormalizowanymi wymiarami |
| Data Vault |
Elastyczny, historyczny (hub-link-satellite) |
Popularne rozwiązania
| Narzędzie |
Typ |
Cena |
| Google BigQuery |
Cloud, serverless |
Pay-per-query |
| Snowflake |
Cloud, managed |
Pay-per-use |
| Amazon Redshift |
Cloud, cluster |
Per-node |
| PostgreSQL |
On-premise, darmowe |
Free |
Powiązane pojęcia