Odkrywanie wiedzy ukrytej w bazach i hurtowniach danych jest przedsięwzięciem skomplikowanym i czasochłonnym, którego sukces nie jest zagwarantowany. We współczesnym zinformatyzowanym świecie coraz częściej staje się ono jednak koniecznością. W ramach eksploracji danych rozwijane są algorytmy i techniki, dzięki którym proces poszukiwań jest bardziej przyjazny i efektywny. W monografii zaprezentowałem w jaki sposób obliczenia ewolucyjne, które są obecnie coraz popularniejszym i przede wszystkim skutecznym narzędziem rozwiązywanie złożonych problemów, mogą być wykorzystane w podstawowym zadaniu eksploracji jakim jest konstruowanie modeli predykcyjnych. W szczególności przedstawiłem globalne metody indukcji drzew decyzyjnych, dzięki którym wynikowe struktury są mniejsze niż uzyskiwane przy użyciu klasycznych algorytmów zastępujących. Jakość klasyfikacji osiągana przez zaproponowane algorytmy globalne jest przy tym nie gorsza od osiąganej przez konkurencyjne systemy drzew decyzyjnych.
Spis treści
-
Wprowadzenie do obliczeń ewolucyjnych
-
Struktura algorytmu ewolucyjnego
-
Reprezentowanie dopuszczalnych rozwiązań
-
Różnicowanie osobników
-
Operator mutacji
-
Operator krzyżowania
-
Selekcja
-
Eksploracja danych
-
Eksploracja danych w procesie pozyskiwania wiedzy
-
Zadanie eksploracji danych
-
Komponenty eksploracji wiedzy
-
Klasyfikacja
-
Drzewa decyzyjne
-
Rodzaje testów i drzew
-
Metody indukcji drzew decyzyjnych
-
Poszukiwanie optymalnego testu w węźle
-
Przycinanie drzew decyzyjnych
-
Reguły decyzyjne
-
Algorytm sekwencyjnego pokrywania
-
Zbiór reguł jako klasyfikator
-
Przegląd systemów indukcji reguł
-
Obliczenie ewolucyjne jako narzędzie eksploracji danych
-
Obliczenie ewolucyjne w indukcji drzew decyzyjnych
-
Obliczenia ewolucyjne w generowaniu reguł decyzyjnych
-
Globalna indukcja drzew jednowymiarowych
-
Reprezentacja
-
Tworzenie populacji początkowej
-
Operatory różnicowania
-
Mutowanie drzewa decyzyjnego
-
Krzyżowanie drzew decyzyjnych
-
Dodatkowe przetwarzanie
-
Selekcja i warunek zatrzymania
-
Funkcja dopasowania
-
Weryfikacja eksperymentalna globalnej indukcji
-
Poznawanie własności systemu
-
Wyniki uzyskane na zbiorach sztucznych i rzeczywistych
-
Skalowalność indukcji na dużych zbiorach
-
Algorytm memetyczny w indukcji drzew jednowymiarowych
-
Hybrydowa indukcja drzew jednowymiarowych
-
Tworzenie populacji początkowej
-
Modyfikacja operatora mutacji
-
Weryfikacja eksperymentalna
-
Wpływ częstości lokalnej optymalizacji na indukcję
-
Wyniki na zbiorach sztucznych i rzeczywistych
-
Generowanie drzew skośnych
-
Ewolucyjna indukcja drzew skośnych
-
Tworzenie populacji początkowej
-
Różnicowanie drzew skośnych
-
Funkcja dopasowania
-
Weryfikacja eksperymentalna
-
Rola operatora dipolowego
-
Eksperymenty ze zbiorami zawierającymi szum
-
Wyniki uzyskane na sztucznych i rzeczywistych zbiorach
-
Skalowalność indukcji na dużych zbiorach
-
Konstruowanie drzew mieszanych
-
Ewolucyjna indukcja drzew mieszanych
-
Różnicowanie drzew mieszanych
-
Funkcja dopasowania
-
Wyniki eksperymentów obliczeniowych
-
Zbiory sztuczne
-
Zbiory rzeczywiste
-
Szybkość i skalowalność ewolucji drzew mieszanych
-
Klasyfikacja uwzględniająca koszty
-
Ewolucyjna indukcja drzew jednowymiarowych uwzględniająca koszty
-
Funkcja dopasowania czuła na koszty
-
Modyfikacje operatorów genetycznych
-
Przypisanie klas w liściach drzew
-
Weryfikacja eksperymentalna
-
Minimalizacja kosztów błędnych decyzji
-
Eksperymenty z dwom rodzajami kosztów
-
Obliczenie równoległe w globalnej indukcji drzew
-
Implementacja równoległa globalnej indukcji drzew
-
Zaproponowane rozwiązanie
-
Realizacja na klastrze obliczeniowym
-
Rozwiązanie hybrydowe
-
Weryfikacja eksperymentalna
-
Rozproszona globalna indukcja drzew decyzyjnych
-
Wyniki eksperymentów obliczeniowych
-
Podsumowanie
-
Możliwe kierunki badań