Reguły asocjacyjne - reprezentowanie danych i hipotez

Reprezentowanie danych i hipotez.

1. Opis przykładów


Załóżmy, że chodzi nam o odkrywanie asocjacji wśród wartości pewnych atrybutów, występujących w rekordach bazy danych, zwanych w terminologii maszynowego uczenia się przykładami. W przypadku mojej aplikacji (sklep internetowy) dużo wygodniej jest nie zajmować się samymi atrybutami, ale konkretnie ich wartościami. W takim rodzaju danych dopuszcza się występowanie w każdym z przykładów mogą wystąpić różne zestawy atrybutów, bądź pojedyncze atrybuty mogą przyjmować nie pojedyncze wartości, ale całe zbiory wartości. Tak dzieje sie w przypadku analizowania zakupów poszczególnych klientów w sklepie. Każdy klient może kupić dowolną ilość towarów w ramach jednej transakcji. Podczas analizy należy traktować pojedynczą transakcję jako całość, niezależnie od ilości zakupionych w ramach niej towarów.

Pomijając sposób organizacji takich danych w relacyjnej bazie danych, możemy przyjąć, że każdy przykład p jest opisany przez pewien zbiór atrybutów Zp (zbiór wartości), nie interesując się tym, ile tych atrybutów w istocie jest, ani również ile każdy z nich może mieć wartości. Jako Z oznaczmy zbiór wszystkich wartości, jakie mogą wystąpić w ramach rozważanej dziedziny w opisach przykładów. Jak wcześniej wspomniałem, będziemy rozważać przykłady nie jako zbiór atrybutów i wartości, ale tylko jako zbiór wartości, eliminując w ten sposób konieczność zakładania ilości atrybutów oraz ile każdy z nich może mieć wartości w danym przykładzie.


2. Reguły asocjacyjne

 

Wiedzę o asocjacjach w zbiorze danych zapisujemy za pomocą reguł asocjacyjnych. Jak wspomniałem w poprzednich podrozdziałach tej pracy, reguły przedstawiamy w najbardziej naturalny sposób – za pomocą logicznej implikacji. Każda reguła asocjacyjna składa się z dwóch części – dwóch zbiorów wartości: warunkujących i warunkowych. Regułę o części warunkującej X ⊂ Z i części warunkowej Y ? Z zapiszemy więc w sposób następujący:


X ⇒ Y


i będziemy ją interpretować jako stwierdzenie, że wartości atrybutów ze zbioru X często pociągają za sobą wartości atrybutów ze zbioru Y. Inaczej – w wielu przykładach, w których występują wszystkie wartości zbioru X występują również wszystkie wartości ze zbioru Y.

Strony: 1 2 3 4

Powiązane kategorie

» Eksploracja danych - data mining

Komentarze

  • Jeszcze nie ma komentarzy.

Aby dodać komentarz, zaloguj się.
Jeżeli nie masz jeszcze swojego konta, utwórz je w kilka sekund.

Eksploracja danych - data mining

Już od zarania dziejów informacja miała dla człowieka kluczowe znaczenie w walce o przetrwanie. To informacja o zbliżających się stadach dzikich zwierząt pozwalała na przygotowanie pułapek i upolowanie pożywienia. To informacja jest podstawowym czynnikiem potrzebnym do kształtowania czegoś o bardziej wysublimowanym charakterze – wiedzy.

W dzisiejszym świecie znaczenie informacji nie tylko się nie zatarło, ale się jeszcze bardziej pogłębiło. Błyskawicznie rozwijające się gałęzie nauki, jak telekomunikacja czy informatyka nie tylko ułatwiają szybki dostęp do poszukiwanej informacji, ale również pomagają na szybsze i trafniejsze podejmowanie strategicznych decyzji decyzji. Ogromne ilości informacji wcale jednak bezpośrednio nie ułatwiają podjęcia trafnej decyzji, ponieważ człowiek nie jest w stanie ich wszystkich ogarnąć i wyciągnąć sensownych konkluzji. Z pomocą przychodzi nowa dziedzina nauki: eksploracja danych.

Systemy odkrywające wiedzę w danych powstawały i wciąż powstają na całym świecie. Jako, że problem jest palący, potrzebne są wciąż szybsze i dokładniejsze algorytmy, które poradzą sobie z odnalezieniem nowego rodzaju wiedzy w coraz większych zbiorach danych. Rozwiązania, które opisałem w niniejszej pracy pojawiały się i będą pojawiały się w wielu systemach, zarówno komercyjnych, jak i amatorskich.

Łukasz Gołaszewski, ADAPTACYJNY SKLEP INTERNETOWY

» strona główna

Szukaj

Pokrewne serwisy

Informatyka

Subskrypcja

Chcesz być na bieżąco? Dodaj swój adres e-mail do newslettera!

Wpisz adres E-mail: