Śledź nas na:



Problemy związane z analizą rzeczywistych danych - liczne atrybuty

Liczne atrybuty.

Koszt obliczeniowy algorytmu wyszukiwania reguł nie zależy tylko od ilości analizowanych rekordów danych, ale również w dużym stopniu zależy od ilości atrybutów, jakimi te rekordy są opisane. W niektórych przypadkach, kiedy nie potrzebujemy bardzo dokładnych reguł, zasadnym wydaje się zmniejszenie ilości atrybutów opisujących analizowane rekordy danych. Taka operacja spowoduje znaczne przyspieszenie wykonywania się algorytmu wyszukującego reguły. Niestety, takie uproszczenie daje w efekcie prostsze, ale również mniej dokładne reguły. Oczywiście chodzi tu o usuwanie atrybutów nieistotnych lub mało istotnych, czyli takich, które w najmniejszym stopniu opisują dany przykład – jeden z rodzajów konstruktywnej indukcji.



Zobacz także