Definicja
Data Mining (eksploracja danych) to proces automatycznego odkrywania nieoczywistych wzorców, zależności i anomalii w dużych zbiorach danych.
Techniki Data Mining
| Technika | Cel | Przykład |
|---|---|---|
| Klasyfikacja | Przypisanie do kategorii | Klient → ryzyko odejścia (tak/nie) |
| Klasteryzacja | Grupowanie podobnych | Segmentacja klientów |
| Regresja | Predykcja wartości | Prognoza sprzedaży |
| Asocjacja | Zależności między elementami | „Klienci kupujący A kupują też B" |
| Wykrywanie anomalii | Identyfikacja odstępstw | Wykrycie fraudu |
| Analiza sekwencji | Wzorce czasowe | Ścieżki zakupowe klientów |
Proces CRISP-DM
| Faza | Działania |
|---|---|
| 1. Zrozumienie biznesu | Cele, KPI, pytania biznesowe |
| 2. Zrozumienie danych | Jakość, kompletność, rozkłady |
| 3. Przygotowanie danych | Czyszczenie, transformacja, selekcja |
| 4. Modelowanie | Algorytmy, parametry, walidacja |
| 5. Ewaluacja | Trafność, użyteczność biznesowa |
| 6. Wdrożenie | Raport, model w produkcji, monitoring |
Dlaczego to ważne?
BA nie musi budować modeli ML, ale powinien rozumieć co data mining może odkryć i formułować właściwe pytania biznesowe.