Zinātniskās darbības atbalsta sistēma
Latviešu English

Publikācija: Klašu blīvuma struktūras izmantošana lēmumu koku klasifikatoru ansambļu evolucionārajā indukcijā

Publikācijas veids Promocijas darbs
Pamatdarbībai piesaistītais finansējums Nav zināms
Aizstāvēšana: 19.05.2014 14:30, DITF, Meža ielā 1, 3.korpusā, 202.auditorijā
Publikācijas valoda Latviešu (lv)
Nosaukums oriģinālvalodā Klašu blīvuma struktūras izmantošana lēmumu koku klasifikatoru ansambļu evolucionārajā indukcijā
Nosaukums angļu valodā Evolutionary Induction of Decision Tree Classifier Ensembles Using Class Density Structures
Pētniecības nozare 2. Inženierzinātnes un tehnoloģijas
Pētniecības apakšnozare 2.2. Elektrotehnika, elektronika, informācijas un komunikāciju tehnoloģijas
Autori Inese Poļaka
Atslēgas vārdi Bioinformatics, data mining, classification, class decomposition
Anotācija Darbā apskatīta biomedicīniskās diagnostikas problēma. Tās specifika ir vairāki tūkstoši vienlaicīgi analizējamu bioloģisko pacienta stāvokļu rādītāju (gēnu, proteīnu vai antivielu), kuros jāatrod slimības marķieri. Šī problēma darba ietvaros formalizēta kā datu ieguves klasifikācijas uzdevums, kurā bioloģisko rādītāju vērtības sastāda pacienta stāvokli aprakstošo vektoru, bet diagnoze ir klase, kurai pieder pacients. Uzdevuma risināšanai darba ietvaros izstrādāta metodoloģija, kas iekļauj divas šī uzdevuma risināšanai darba ietvaros izstrādātas metodes – klašu dekompozīciju un hibrīdu klasifikācijas metodi, kas balstās uz ģenētiskajiem algoritmiem un lēmumu koku klasifikatoru ansambļiem. Klašu dekompozīcija ļauj uzlabot klasifikācijas precizitāti, aprakstot un klasifikācijā izmantojot datu iekšējās struktūras īpašības. Savukārt, uz lēmumu koku klasifikatoru ansambļiem un ģenētiskajiem algoritmiem balstītā klasifikācijas metode, pielietojot gadījuma apakštelpas metodi, ļauj atrast kvazi-optimālus viegli interpretējamus klasifikatoru ansambļus, kas satur tikai informatīvākos atribūtus un parāda to savstarpējās sakarības. Darbs ir sakārtots tā, ka pakāpeniski, pārbaudot darbā izvirzītās hipotēzes, tiek pierādīta izstrādātās metodoloģijas efektivitāte. Rezultātā tiek pierādīts neliela biomarķiera paneļa izmantošanas pamatojums (izstrādātajā klasifikācijas metodē ir iekļauta atribūtu atlase), klašu dekompozīcijas izmantošanas lietderīgums, izstrādātās klasifikācijas metodes precizitāte, kā arī izstrādātās metodoloģijas pārākums biomedicīnisko datu analīzē.
Anotācija angļu valodā The problem analyzed in the thesis is biomedical diagnostics. Its specifics is several thousand biological indicators of a patient status (genes, proteins and antibodies) that have to be analyzed simultaneously in order to find disease markers. This problem is formalized in the thesis as data mining classification task, in which patient status is described by vectors made up of biological indicator values and the diagnosis of the patient is the class label. A methodology is developed to solve the defined task, using two methods developed for the solution of this task – class decomposition and a hybrid classification method that is based on genetic algorithms and decision tree classifier ensembles. Class decomposition allows improving classification accuracy by describing the inner structure properties of the data and using the description in classification. The classification method that is based on genetic algorithms and decision tree classifier ensembles and that uses Random subspace method allows finding quasi-optimal and easily interpretable classifier ensembles that consist only of the most informative attributes and their relationships. The thesis is arranged so that confirming the initial hypotheses step-by-step it proves the efficacy of the developed methodology. As a result, the use of a smaller biomarker panel that is acquired due to the built-in feature selection of the developed method is justified, the usefulness of class decomposition application is proved, the accuracy of the developed classification method is confirmed and the advantages of using the developed methodology for the analysis of biomedical data are shown.
Atsauce Poļaka, Inese. Klašu blīvuma struktūras izmantošana lēmumu koku klasifikatoru ansambļu evolucionārajā indukcijā. Promocijas darbs. Rīga: [RTU], 2014. 141 lpp.
Kopsavilkums Kopsavilkums
ID 18214