Problemy związane z analizą rzeczywistych danych - liczne atrybuty

Liczne atrybuty.

Koszt obliczeniowy algorytmu wyszukiwania reguł nie zależy tylko od ilości analizowanych rekordów danych, ale również w dużym stopniu zależy od ilości atrybutów, jakimi te rekordy są opisane. W niektórych przypadkach, kiedy nie potrzebujemy bardzo dokładnych reguł, zasadnym wydaje się zmniejszenie ilości atrybutów opisujących analizowane rekordy danych. Taka operacja spowoduje znaczne przyspieszenie wykonywania się algorytmu wyszukującego reguły. Niestety, takie uproszczenie daje w efekcie prostsze, ale również mniej dokładne reguły. Oczywiście chodzi tu o usuwanie atrybutów nieistotnych lub mało istotnych, czyli takich, które w najmniejszym stopniu opisują dany przykład – jeden z rodzajów konstruktywnej indukcji.

Powiązane kategorie

» Eksploracja danych - data mining

Komentarze

  • Jeszcze nie ma komentarzy.

Aby dodać komentarz, zaloguj się.
Jeżeli nie masz jeszcze swojego konta, utwórz je w kilka sekund.

Eksploracja danych - data mining

Już od zarania dziejów informacja miała dla człowieka kluczowe znaczenie w walce o przetrwanie. To informacja o zbliżających się stadach dzikich zwierząt pozwalała na przygotowanie pułapek i upolowanie pożywienia. To informacja jest podstawowym czynnikiem potrzebnym do kształtowania czegoś o bardziej wysublimowanym charakterze – wiedzy.

W dzisiejszym świecie znaczenie informacji nie tylko się nie zatarło, ale się jeszcze bardziej pogłębiło. Błyskawicznie rozwijające się gałęzie nauki, jak telekomunikacja czy informatyka nie tylko ułatwiają szybki dostęp do poszukiwanej informacji, ale również pomagają na szybsze i trafniejsze podejmowanie strategicznych decyzji decyzji. Ogromne ilości informacji wcale jednak bezpośrednio nie ułatwiają podjęcia trafnej decyzji, ponieważ człowiek nie jest w stanie ich wszystkich ogarnąć i wyciągnąć sensownych konkluzji. Z pomocą przychodzi nowa dziedzina nauki: eksploracja danych.

Systemy odkrywające wiedzę w danych powstawały i wciąż powstają na całym świecie. Jako, że problem jest palący, potrzebne są wciąż szybsze i dokładniejsze algorytmy, które poradzą sobie z odnalezieniem nowego rodzaju wiedzy w coraz większych zbiorach danych. Rozwiązania, które opisałem w niniejszej pracy pojawiały się i będą pojawiały się w wielu systemach, zarówno komercyjnych, jak i amatorskich.

Łukasz Gołaszewski, ADAPTACYJNY SKLEP INTERNETOWY

» strona główna

Szukaj

Pokrewne serwisy

Informatyka

Subskrypcja

Chcesz być na bieżąco? Dodaj swój adres e-mail do newslettera!

Wpisz adres E-mail: