Reguły asocjacyjne - reprezentowanie danych i hipotez
Określenie “często” nie jest zbyt precyzyjnym określeniem ilości powtórzeń wystąpień zbiorów X i Y wśród analizowanego zbioru trenującego. W celu sprecyzowania interpretacji reguł asocjacyjnych określa się dla nich wsparcie i zaufanie. Wsparcie jest stosunkiem ilości wystąpień przykładów P, które zawierają w całości opisy X oraz Y do ilości wszystkich przykładów P, gdzie P jest dowolnym podzbiorem zawierającym tylko i wyłącznie przykłady Z:
Wsparcie(X ⇒ Y) = |PX∪Y| / |P|
Każda reguła może być więc wspierana, albo naruszana przez przykład. Natomiast zaufanie reguły w zbiorze P definiuje się następująco:
Zaufanie(X ⇒ Y) = |PX∪Y| / |PX|
czyli jako stosunek liczby przykładów ze zbioru P, w których opisach występują zarówno opisy X jak i Y do liczby przykładów, w których opisach występują tylko elementy zbioru X, czyli zbioru wartości warunkujących. Poniższy przykład ilustruje wsparcie i zaufanie wybranych reguł w transakcjach sprzedaży sklepu:
transakcja |
produkty |
1 |
chleb, masło |
2 |
chleb, masło, mleko, jabłka |
3 |
chleb, mleko, jabłka |
4 |
chleb, masło, mleko, jabłka |
reguła |
wspierana |
naruszana |
chleb AND mleko --> jabłka |
2, 3, 4 |
|
chleb --> masło |
1, 2, 4 |
3 |
Zgodnie z definicją wsparcia i zaufania dla reguł otrzymujemy następujące wyniki dla analizowanych reguł:
-
chleb AND mleko --> jabłka wsparcie=75% zaufanie=100%
-
chleb --> masło wsparcie=75% zaufanie=75%
Podsumowując, wsparcie mówi, jak często w badanym zbiorze występuje sytuacja opisana przez regułę, natomiast zaufanie mówi, jak często sytuacja opisana przez zbiór wartości warunkowych występuje pod warunkiem wystąpienia sytuacji opisanej przez zbiór wartości warunkujących.