Śledź nas na:



Problemy związane z analizą rzeczywistych danych - duże zbiory danych

2. Redukcja liczby przykładów


Jeżeli z jakiś względów technika okienkowania nie daje zadowalających rezultatów, bądź wymaga bardzo wielu iteracji, można przeprowadzić z pozoru drastyczną i samobójczą operację redukcji liczby przykładów w zbiorze trenującym. Oczywiście, aby nie była to w istocie samobójcza operacja, należy przeprowadzić ją ostrożnie, w taki sposób, aby pozostawić w zbiorze trenującym interesujące nas zależności. Redukcja taka może mieć dwojaką postać. Możemy przeprowadzić we wstępnej fazie przygotowania zbioru trenującego do analizy grupowanie pojęciowe. Oczywiście należy pamiętać, aby odpowiednio dobrać ziarnistość grup, tak, aby uzyskana liczba przykładów była równa porządanej skali redukcji przykładów. Inne podejście polega na bezpośrednim wyborze przykładów do nowego zbioru trenującego, które będą najbardziej reprezentatywne dla całego zbioru trenującego. Można użyć wielu różnych heurystyk, które umożliwią nam ten wybór.




Zobacz także