Artykuły na temat Eksploracji danych, czyli Data Miningu

Już od zarania dziejów informacja miała dla człowieka kluczowe znaczenie w walce o przetrwanie. To informacja o zbliżających się stadach dzikich zwierząt pozwalała na przygotowanie pułapek i upolowanie pożywienia. To informacja jest podstawowym czynnikiem potrzebnym do kształtowania czegoś o bardziej wysublimowanym charakterze – wiedzy.

W dzisiejszym świecie znaczenie informacji nie tylko się nie zatarło, ale się jeszcze bardziej pogłębiło. Błyskawicznie rozwijające się gałęzie nauki, jak telekomunikacja czy informatyka nie tylko ułatwiają szybki dostęp do poszukiwanej informacji, ale również pomagają na szybsze i trafniejsze podejmowanie strategicznych decyzji decyzji. Ogromne ilości informacji wcale jednak bezpośrednio nie ułatwiają podjęcia trafnej decyzji, ponieważ człowiek nie jest w stanie ich wszystkich ogarnąć i wyciągnąć sensownych konkluzji. Z pomocą przychodzi nowa dziedzina nauki: eksploracja danych.

Systemy odkrywające wiedzę w danych powstawały i wciąż powstają na całym świecie. Jako, że problem jest palący, potrzebne są wciąż szybsze i dokładniejsze algorytmy, które poradzą sobie z odnalezieniem nowego rodzaju wiedzy w coraz większych zbiorach danych. Rozwiązania, które opisałem w niniejszej pracy pojawiały się i będą pojawiały się w wielu systemach, zarówno komercyjnych, jak i amatorskich.

Łukasz Gołaszewski, ADAPTACYJNY SKLEP INTERNETOWY

Dodany przez: pukas
+ Odkrywanie wiedzy
+ Uczenie się
+ Indukcja



Odkrywanie wiedzy



Odkrywanie prawidłowości w zbiorach danych możemy śmiało nazwać uczeniem się na podstawie tych danych. Wiedza zdobyta podczas analizy danych jest w pewnym sensie ich uogólnieniem. Taki sposób uczenia się nazywa się uczeniem indukcyjnym.

Do odkrywania wiedzy wykorzystuje się obecnie nieco “podrasowane” algorytmy uczenia sie, opracowane wcześniej bez uwzględnienia praktycznego ich zastosowania w analizie rzeczywistych danych, które bardzo często posiadają bardzo duże rozmiary, są zaszumione i niekompletne oraz posiadają wiele atrybutów różnych typów.

Szybki rozwój dziedziny odkrywania wiedzy doprowadził również do powstania nowych algorytmów, które bez problemu radzą sobie z rzeczywistymi danymi, oraz znajdują zastosowanie w odnajdywaniu nowych rodzajów zależności, którymi nie zajmowano się w ramach badań nad uczeniem maszynowym.[1]



Uczenie się



Poprzez uczenie się rozumiemy pewne autonomiczne zmiany w systemie, mające na celu polepszenie jakości jego działania, odbywające się na podstawie obserwacji otaczającego świata lub analizy danych historycznych. Przyjmijmy, że zmiana ta polega na zdobyciu lub udoskonaleniu przez uczącego się wiedzy lub umiejętności, zapamiętaniu tej wiedzy lub umiejętności i wykorzystaniu jej do wykonania stawianych mu zadań. Rodzaj uczenia się, z którym będziemy mieć do czynienia zależy od postaci i sposób dostarczania uczącemu się jego obserwacji i doświadczeń, mechanizm generowania jakiejś wiedzy na ich podstawie oraz sposób wykorzystania tej wiedzy. Jeżeli zadaniem uczącego się miałoby być odpowiednie zakwalifikowanie obiektu do danej kategorii, pokazalibyśmy mu szereg prawidłowo zakwalifikowanych obiektów do kategorii i na tej podstawie uczący się zdobyłby potrzebną wiedzę do zakwalifikowania dowolnego obiektu do odpowiedniej kategorii.[1]



Indukcja



Z pojęciem indukcji mamy do czynienia, kiedy mówimy o wnioskowaniu indukcyjnym. Potocznie poprzez pojęcie indukcji rozumiemy przechodzenie od wielu drobnych faktów do jednego prawa ogólnego, opisującego je wszystkie. Poprzez uczenie się na podstawie wnioskowania indukcyjnego rozumiemy wytworzenie na podstawie analizy obserwowanych faktów, bądź danych historycznych hipotezy indukcyjnej, stanowiącej ogólny obraz analizowanych danych. Uzyskana w ten sposób wiedza może być później stosowana do wnioskowania dedukcyjnego, czyli stosowania hipotezy indukcyjnej do rozwiązania nowych zadań.

Mamy więc dwa rodzaje wnioskowania:

  • wnioskowanie indukcyjne – stworzenie hipotezy indukcyjnej na podstawie analizowanych danych,

  • wnioskowanie dedukcyjne – wykorzystanie hipotezy indukcyjnej do rozwiązania nowych zadań.

W praktyce mamy zwykle do czynienia z danymi zorganizowanymi w rekordach, opisanych przez odpowiednio dobrany zestaw atrybutów. Wnioskowanie indukcyjne polega na odnalezieniu zależności między tymi atrybutami, a wnioskowanie dedukcyjne polega na zastosowaniu znalezionych hipotez do sprawdzania poprawności lub przewidywania przyszłych wartości nowych rekordów lub atrybutów.

 

 

[1] Bibliografia: Cichosz, Paweł, Systemy uczące się. WNT, 2000.

Zobacz też inne materiały

Eksploracja danych - data mining
Reprezentowanie wiedzy
Problemy związane z analizą rzeczywistych danych - duże zbiory danych
Problemy związane z analizą rzeczywistych danych - liczne atrybuty
Problemy związane z analizą rzeczywistych danych - niekompletne dane
Problemy związane z analizą rzeczywistych danych - niepoprawne dane
Reguły asocjacyjne - istota asocjacji
Reguły asocjacyjne - reprezentowanie danych i hipotez
Generowanie reguł asocjacyjnych

Powiązane kategorie

Eksploracja danych - data mining

Komentarze

  • Brak komentarzy

Dodaj komentarz

Aby dodawać komentarze, zaloguj się.
Nie masz jeszcze swojego konta na Wykłady.org? Zarejestruj się!.
Google
 

Wykłady.org to serwis kierowany do studentów i uczniów szkół średnich. Na stronach serwisu znajdziesz wiele materiałów z wykładów oraz opracowania lektur i przykładowe prace maturalne. Dowiedz się więcej.

Zapraszamy wszystkie osoby chętne do współpracy przy tworzeniu tego serwisu. Jeżeli posiadasz jakieś ciekawe materiały lub opracowania swojego autorstwa i nie łamiące praw autorskich i chcesz podzielić się nimi z innymi uczniami lub studentami, napisz do nas - opublikujemy Twoje prace w tym serwisie!

Rejestracja

Chcesz mieć możliwość wpływania na kształt portalu Wykłady.org? Zarejestruj się i pisz, komentuj, oceniaj, bierz udział w konkursach i wygrywaj nagrody!