RTU Research Information System
Latviešu English

Publikācija: Development of Interactive Inductive Learning Based Classification System's Model

Publication Type Doctoral Thesis
Funding for basic activity Unknown
Defending: 07.10.2013 14:30, Datorzinātnes un informācijas tehnoloģijas fakultāte, Meža ielā 1/3-202
Publication language Latvian (lv)
Title in original language Interaktīvas uz induktīvo apmācību balstītas klasifikācijas sistēmas modeļa izstrāde
Title in English Development of Interactive Inductive Learning Based Classification System's Model
Field of research 1. Natural sciences
Sub-field of research 1.2 Computer and information sciences
Authors Ilze Birzniece
Keywords Machine learning, inductive learning, multi-label classification, interactivity
Abstract Palielinoties informācijas apjomam pasaulē, daudzās sfērās pieaug nepieciešamība pēc datorizētas dažādu objektu klasifikācijas. Tāpēc arvien aktuālāka ir automātisku datu apstrādes tehniku izmantošana, kurās ir iesaistīta mašīnapmācība. Klasifikācija ir viens no mašīnapmācības uzdevumiem, kura mērķis ir noteikt objekta piederību noteiktai klasei, balstoties uz klasifikācijas algoritmam sniegtiem faktiem par zināma skaita objektu atbilstību šīm klasēm. Par automātisku klasifikāciju promocijas darbā tiek saukts datorizēts klasifikācijas process, kurā no klasifikatora apmācības brīža ar sagatavotiem apmācības datiem līdz lēmuma pieņemšanai par jaunu objektu klasifikāciju netiek iesaistīts sistēmas lietotājs vai eksperts. Risināmajiem uzdevumiem un apstrādājamajiem datiem kļūstot arvien sarežģītākiem, pilnībā automātiskas klasifikācijas pieejas ne vienmēr sniedz vēlamo rezultātu. Tādēļ promocijas darbs ir veltīts automatizēta jeb daļēji automātiska klasifikācijas risinājuma izveidei, kas izmanto gan mašīnapmācības sniegtās iespējas, gan interaktīvu sadarbību ar jomas ekspertu savu rezultātu uzlabošanai klasifikatora lietošanas laikā, ja klasifikators sastopas ar objektu, ko tas nespēj klasificēt vai nav pārliecināts par sava lēmuma pareizību. Viena no mašīnapmācībā izmantotajām klasifikācijas metožu grupām ir induktīvā apmācība. Induktīvajā apmācībā iegūtie rezultāti ir saprotami ne tikai datorsistēmai, bet arī tās lietotājam. Šī ir būtiska induktīvās apmācības priekšrocība, salīdzinājumā ar citām klasifikācijas metodēm. Lai pilnvērtīgi iesaistītu ekspertu, klasifikācijas sistēma balstās uz induktīvās apmācības izmantošanu cilvēkam saprotamu klasifikācijas likumu iegūšanai. Promocijas darbā ir izstrādāts interaktīvas uz induktīvo apmācību balstītas klasifikācijas sistēmas (InClaS) modelis, kas apvieno algoritmus, arhitektūras un vadlīnijas, kuras ļauj izstrādāt interaktīvu klasifikācijas sistēmu. Šādas sistēmas izstrādes mērķis ir samazināt nepareizi klasificēto objektu skaitu, salīdzinot ar „tradicionālu” automātisku klasifikācijas sistēmu. Modelis ir speciāli izstrādāts lietošanai jomās, kur objekts var piederēt vienlaicīgi vairākām klasēm (daudzkategoriju klasifikācija). InClaS modelis ir aprobēts divās problēmsfērās – izglītībā un medicīnā –, kas pierāda, ka nepareizi klasificēto objektu skaitu ir iespējams samazināt, ja klasifikatoram neskaidrie (neklasificētie un nepārliecinoši klasificētie) objekti tiek atlasīti un nodoti ekspertam izvērtēšanai. Promocijas darba rezultāti ir atspoguļoti 13 zinātniskajos rakstos un par tiem ir ziņots 12 dažādās starptautiskās konferencēs. Darbs sastāv no ievada, 6 nodaļām, galvenajiem rezultātiem un secinājumiem. Tajā ir 160 lappuses, 47 attēli un 34 tabulas pamattekstā, 139 nosaukumu literatūras sarakstā un 11 pielikumi.
Abstract in English Growing amount of information in the world has increased the need for computerized classification of different objects. Therefore, more important have become automatic data processing techniques which make use of machine learning. Classification is one of the machine learning tasks where the program learns to classify new instances from the provided facts. In the thesis the term automatic classification is used to denote a computerized classification process which excludes the user or expert involvement starting from the classifier’s training with provided data set till applying it for new instance classification. Application domains and data are getting more complex leading to inability for automatic classification approaches to always reach the desired result. Thereof, the thesis is devoted to the development of automated or semiautomatic classification solution which incorporates both machine learning facilities and interactive involvement of a domain expert in the classifier’s applying stage for improving its results if the classifier makes uncertain classification. One of the classification method groups used in machine learning is inductive learning. Results obtained from the inductive learning methods are interpretable not only for machines, but also for their users. This is a fundamental advantage over other classification methods. To fully utilize interactivity with an expert, the classification system is based on inductive learning for extracting human-readable classification rules. The doctoral thesis provides interactive inductive learning based classification system’s (InClaS) model which gathers algorithms, architectures and guidelines for developing an interactive classification system. The aim of developing this system is to decrease the number of misclassified instances regarding to the “traditional” automatic classification system. This model is particularly intended to be applied in domains with a multi-label class membership. The InClaS model has been approbated in two problem domains – education and medicine – which demonstrate the ability to reduce the number of misclassified instances supposing that instances with uncertain classification (unclassified and classified with low confidence) are detected and transferred to the expert for assessment. The results of the thesis are published in 13 international scientific publications and presented in 12 international conferences. The doctoral thesis includes introduction, 6 sections, main results and conclusions section. It consists of 160 pages, 47 figures and 34 tables in the main text, 11 appendices. The bibliography contains 139 references.
Reference Birzniece, Ilze. Development of Interactive Inductive Learning Based Classification System's Model. PhD Thesis. Rīga: [RTU], 2013. 160 p.
Full-text Full-text
Summary in English Summary in English
ID 16523