Eksploracja danych - data mining
+ Co to jest data mining?
+ Rodzaje metod odkrywania wiedzy
Co to jest data mining?
Data mining jest jednym z etapów odkrywania wiedzy w bazach danych. Wywodzi się z takich dziedzin nauki, jak statystyka i uczenie maszynowe. Istota data miningu polega na wykorzystaniu szybkości komputerów do odkrywania ukrytych dla człowieka zależności i prawidłowości w ogromnych zbiorach danych. Przykładem może być wykrycie, jakie towary są najczęściej kupowane razem w danym sklepie – właśnie to zastosowanie data miningu wykorzystałem w swojej aplikacji.
Innymi przykładami wykorzystania data miningu są problemy:
-
jakie cechy wyróżniają kierowców najczęściej powodujących wypadki?
-
jakie jest prawdopodobieństwo terminowej spłaty kredytu przez klienta banku?
-
jaka będzie jutro pogoda?
-
jakie ustalić wielkości produkcji dóbr X w okresie Y?
W maksymalnym uproszczeniu cały proces odkrywania wiedzy sprowadza sie do tego, że wybrane metody uczenia się są używane do odnalezienia regularności w danych i zapisania ich w odpowiedniej postaci, zaś metody statystyczne służą do oceny ich jakości.