Using Genetic Algorithm to Optimize Weights in Data Mining Task
2009
Irina Provorova, Sergejs Paršutins, Sergejs Provorovs

Rakstā izskatīta ģenētiskā algoritma (GA) pielietošana datu ieguves uzdevumam svaru optimizēšanas nolūkos. Datu ieguves uzdevumiem raksturīgs liels datu ierakstu un atribūtu skaits, kuru parasti nepieciešams apstrādāt, veidojot, piemēram, klasifikācijas likumus. Tā rezultātā, lielu datu ierakstu un atribūtu skaita dēļ klasisko metožu klasifikācija notiek ar lielu kļūdu. Šo problēmu risināšanai pielietots ģenētiskais algoritms, kura uzdevums ir atrast tādus svarus katram atribūtam, kas nodrošinātu klasifikācijas kļūdas samazināšanu. Par klasisko metodi tiek izvēlēts k tuvāko kaimiņu (KNN) klasifikators un svaru optimizēšanai tiek pielietots modificēts ģenētiskais algoritms. Balstoties uz ģenētiskā un k tuvākā kaimiņa algoritmu kopējās pielietošanas bāzes, izstrādāts GA/KNN algoritma hibrīds. Rezultātā piedāvāts algoritma hibrīds nodrošina stabilu klasifikācijas kļūdas samazināšanu neatkarīgi no ierakstu un atribūtu skaita, un izvēlētā tuvāko kaimiņu skaita. Ģenētiskā algoritma blokā modificēti krustošanas un mutācijas operatori strādā ar vienādu intensitāti un nodrošina no indivīdu pasliktināšanas.


Keywords
Genetic Algorithm, Genetic Operators Modification, Genetic Operators Control, K-Nearest Neighbour Algorithm, Data Mining Task

Provorova, I., Paršutins, S., Provorovs, S. Using Genetic Algorithm to Optimize Weights in Data Mining Task. Technologies of Computer Control. Vol.40, 2009, pp.123-128. ISSN 1407-7493.

Publication language
English (en)
The Scientific Library of the Riga Technical University.
E-mail: uzzinas@rtu.lv; Phone: +371 28399196