Artykuły na temat Eksploracji danych, czyli Data Miningu

Już od zarania dziejów informacja miała dla człowieka kluczowe znaczenie w walce o przetrwanie. To informacja o zbliżających się stadach dzikich zwierząt pozwalała na przygotowanie pułapek i upolowanie pożywienia. To informacja jest podstawowym czynnikiem potrzebnym do kształtowania czegoś o bardziej wysublimowanym charakterze – wiedzy.

W dzisiejszym świecie znaczenie informacji nie tylko się nie zatarło, ale się jeszcze bardziej pogłębiło. Błyskawicznie rozwijające się gałęzie nauki, jak telekomunikacja czy informatyka nie tylko ułatwiają szybki dostęp do poszukiwanej informacji, ale również pomagają na szybsze i trafniejsze podejmowanie strategicznych decyzji decyzji. Ogromne ilości informacji wcale jednak bezpośrednio nie ułatwiają podjęcia trafnej decyzji, ponieważ człowiek nie jest w stanie ich wszystkich ogarnąć i wyciągnąć sensownych konkluzji. Z pomocą przychodzi nowa dziedzina nauki: eksploracja danych.

Systemy odkrywające wiedzę w danych powstawały i wciąż powstają na całym świecie. Jako, że problem jest palący, potrzebne są wciąż szybsze i dokładniejsze algorytmy, które poradzą sobie z odnalezieniem nowego rodzaju wiedzy w coraz większych zbiorach danych. Rozwiązania, które opisałem w niniejszej pracy pojawiały się i będą pojawiały się w wielu systemach, zarówno komercyjnych, jak i amatorskich.

Łukasz Gołaszewski, ADAPTACYJNY SKLEP INTERNETOWY

Dodany przez: pukas
Niepoprawne dane.



W wielu bazach danych przechowujących rzeczywiste dane można spotkać atrybuty, których wartości są w naturalny sposób obarczone błędami, np. w danych pochodzących z pomiarów. O takich danych mówimy, że są zaszumione. Taka sytuacja stwarza ryzyko stworzenia reguł zbytnio dopasowanych do przypadkowych danych. Reguły takie, nawet jeżeli są wystarczająco dokładne w odniesieniu do istniejących danych, okazują się zupełnie nieprzystające do nowych rekordów, co całkowicie eliminuje je w dalszym wnioskowaniu dedukcyjnym. Zapobiegać nadmiernemu dopasowaniu możemy już podczas wyszukiwania zależności, biorąc od uwagę tylko te statystycznie istotne – taki mechanizm zastosowałem w swojej aplikacji, aby wykluczyć z analizy przypadkowe zakupy klientów zachowujących się irracjonalnie lub dokonujących zakupów w sposób losowy. Możemy również poddawać modyfikacjom już znalezione zależności poprzez ich upraszczanie, np. usuwanie niektórych warunków z istniejących reguł. Takie działanie pogarsza dostosowanie reguł do istniejących rekordów w zbiorze trenującym, ale zwiększa ich przydatność i skuteczność w odniesieniu do nowych przykładów.

W przypadku atrybutów, w których naturalnie nie powinny występować błędy, możemy odkryć w czasie ich analizowania różnego rodzaju anomalie w postaci nadzwyczajnego odchylenia ich wartości od pozostałych atrybutów i to w niewielkiej liczbie przypadków. Często anomalie te są błędami spowodowanymi przez operatora wprowadzającego dane do bazy danych. Anomalie te mogą być również obserwowane jako wyjątki od istniejących reguł lub jako reguły pokrywające niewielką liczbę analizowanych przykładów.

Zobacz też inne materiały

Eksploracja danych - data mining
Systemy uczące się
Reprezentowanie wiedzy
Problemy związane z analizą rzeczywistych danych - duże zbiory danych
Problemy związane z analizą rzeczywistych danych - liczne atrybuty
Problemy związane z analizą rzeczywistych danych - niekompletne dane
Reguły asocjacyjne - istota asocjacji
Reguły asocjacyjne - reprezentowanie danych i hipotez
Generowanie reguł asocjacyjnych

Powiązane kategorie

Eksploracja danych - data mining

Komentarze

  • Brak komentarzy

Dodaj komentarz

Aby dodawać komentarze, zaloguj się.
Nie masz jeszcze swojego konta na Wykłady.org? Zarejestruj się!.
Google
 

Wykłady.org to serwis kierowany do studentów i uczniów szkół średnich. Na stronach serwisu znajdziesz wiele materiałów z wykładów oraz opracowania lektur i przykładowe prace maturalne. Dowiedz się więcej.

Zapraszamy wszystkie osoby chętne do współpracy przy tworzeniu tego serwisu. Jeżeli posiadasz jakieś ciekawe materiały lub opracowania swojego autorstwa i nie łamiące praw autorskich i chcesz podzielić się nimi z innymi uczniami lub studentami, napisz do nas - opublikujemy Twoje prace w tym serwisie!

Rejestracja

Chcesz mieć możliwość wpływania na kształt portalu Wykłady.org? Zarejestruj się i pisz, komentuj, oceniaj, bierz udział w konkursach i wygrywaj nagrody!