Zinātniskās darbības atbalsta sistēma
Latviešu English

Publikācija: Īsu laika rindu un to raksturojošo parametru apstrādes sistēma prognozēšanas uzdevumiem

Publikācijas veids Promocijas darbs
Pamatdarbībai piesaistītais finansējums Nav zināms
Aizstāvēšana: 17.02.2016 14:30, Rīgas Tehniskā universitāte Datorzinātnes un informācijas tehnoloģijas fakultāte, Sētas ielā 1, 202. auditorija
Publikācijas valoda Latviešu (lv)
Nosaukums oriģinālvalodā Īsu laika rindu un to raksturojošo parametru apstrādes sistēma prognozēšanas uzdevumiem
Nosaukums angļu valodā A System for Processing Short Time Series and Their Characteristic Parameters in Forecasting Tasks
Pētniecības nozare 2. Inženierzinātnes un tehnoloģijas
Pētniecības apakšnozare 2.2. Elektrotehnika, elektronika, informācijas un komunikāciju tehnoloģijas
Autori Arnis Kiršners
Atslēgas vārdi Īsas laika rindas, modificēts k-vidējo sadalošais algoritms, klasterizācija, klasifikācija, prognozēšana, datu iegūšana
Anotācija Promocijas darbs veltīts īsu laika rindu un to raksturojošo parametru apstrādes pētīšanai ar datu iegūšanas metodēm un algoritmiem, nosakot pētāmā objekta raksturlieluma iespējamo vērtību nākotnē. Promocijas darba mērķis ir izstrādāt uz datu iegūšanu balstītu īsu laika rindu un to raksturojošo parametru apstrādes pieeju kopumu prognozēšanas sistēmai, kas būtu pielietojams dažādās problēmvidēs un prognozes veikšanai izmantotu tikai analizējamā objekta raksturojošos parametrus. Īsu laika rindu un to raksturojošo parametru apstrādes process ir grūti formalizējams, jo atrast tajā likumsakarības ir sarežģīti. Pielietotajiem algoritmiem un pieejām ir jāspēj apstrādāt atšķirīgas datu struktūras. Īsu laika rindu apstrādes process darbā formalizēts kā klasterizācijas uzdevums, bet raksturojošo parametru apstrādes process formalizēts kā klasifikācijas uzdevums. Īsu laika rindu apstrādei izstrādāta k-vidējo sadalošā algoritma modifikācija, kas nodrošina piemērotākā klasteru skaita noteikšanu, vadoties pēc vidējās absolūtās klasterizācijas kļūdas. Piedāvātas jaunas pieejas klasterizācijas rezultātu un raksturojošo parametru apvienošanai. Izstrādāto prognozēšanas sistēmu ietvaros realizētas jaunas pieejas iegūto klasterizācijas un klasifikācijas rezultātu analīzei. Promocijas darbā piedāvātas trīs dažādas īsu laika rindu un to raksturojošo parametru apstrādes sistēmas, kas pielāgotas dažādām problēmvidēm: tirdzniecība, farmakoloģija un medicīna. Pirmā sistēma veic preču pārdošanas apjoma prognozēšanu nākamajam periodam, balstoties uz sistēmā ievadītajiem analizējamās preces raksturojošajiem parametriem. Otrā realizē sirds nekrozes riska prognozēšanu, pamatojoties uz indivīda raksturojošajiem parametriem. Bet trešā veic baktēriju proliferācijas sindroma noteikšanu tievajā zarnā, balstoties uz respondenta pašsajūtu raksturojošajiem parametriem. Izstrādāto sistēmu precizitāte un darbība ir pārbaudīta reālās problēmvidēs ar reāliem datiem. Sistēmu izveidē pielietoto algoritmu un pieeju izmantošana ir eksperimentāli pamatota. Promocijas darba gaitā izstrādāto sistēmu un pieeju kopuma analīze dažādām problēmvidēm ļauj sniegt vadlīnijas līdzīgu sistēmu izveidē, kurās tiek apstrādātas īsas laika rindas un to raksturojošie parametri. Promocijas darbs uzrakstīts latviešu valodā, kopējais darba apjoms ir 144 lappuses, tās satur ievadu, 4. nodaļas, secinājumus, 25 tabulas, 53 attēlus un 2 pielikumus. Darbā ir izmantotas atsauces uz 77 literatūras avotiem.
Anotācija angļu valodā This Thesis is dedicated to the research of the problem of processing short time-series and their characteristic parameter data by applying data mining methods and algorithms to determine the prospective future value of the analyzed object. The goal of the Thesis is to develop a data mining based set of approaches for the processing of short time-series and their characteristic parameters in a forecasting system that would be applicable in various fields and would only use the characteristic data of a analyzed object in order to determine the forecast. The process of analysis of short time-series and their parameters is hard to formalize because the process of finding patterns in these data is very complex. The algorithms and approaches applied in such task would have to perform well with different data structures. The process of short time-series analysis is formalized in the Thesis as a clustering task; whereas the process of descriptive parameter analysis is formalized as classification task. Processing of short time-series is carried out using an adapted k-means algorithm, which allows determining the most eligible number of clusters based on the mean absolute clustering error. New approaches are proposed for merging of clustering results and characteristic parameters. The developed forecasting systems also include implementations of new approaches to the analysis of clustering and classification results. The Thesis offers three different systems for short time-series and their characteristic parameter processing that are adapted to different fields of application: sales, pharmacology and healthcare. The first system makes forecasts of product sales volumes for a following period of time based on the characteristic parameters of a new product entered into the system. The second system is used to forecast the risk of heart necrosis based on the characteristic parameters of a analyzed individual. The third one carries out the forecasting of bacterial proliferation syndrome in the small intestine based on the characteristic parameters of health self-assessment of a respondent. The performance and functioning of the system is tested in practical fields with real data. The use of algorithms and approaches employed in the system implementation is experimentally substantiated. The analysis of the system and approach collection developed and proposed in the Thesis for different fields offers guidelines for development of similar systems that can be used to process data of short time-series and their characteristic parameters. The thesis is written in Latvian. It contains an introduction, 4 chapters, conclusions, the list of references, 2 appendixes, 53 pictures, 25 tables, 144 pages. The list of references contains 77 records.
Atsauce Kiršners, Arnis. Īsu laika rindu un to raksturojošo parametru apstrādes sistēma prognozēšanas uzdevumiem. Promocijas darbs. Rīga: [RTU], 2015. 144 lpp.
Pilnais teksts Pilnais teksts
Kopsavilkums Kopsavilkums
ID 21559