Zinātniskās darbības atbalsta sistēma
Latviešu English

Publikācija: Ambiguous States Determination in Non-Markovian Environments

Publikācijas veids Publikācija RTU zinātniskajā žurnālā
Pamatdarbībai piesaistītais finansējums Nav zināms
Aizstāvēšana: ,
Publikācijas valoda English (en)
Nosaukums oriģinālvalodā Ambiguous States Determination in Non-Markovian Environments
Pētniecības nozare 2. Inženierzinātnes un tehnoloģijas
Pētniecības apakšnozare 2.2. Elektrotehnika, elektronika, informācijas un komunikāciju tehnoloģijas
Autori Jurijs Čižovs
Tatjana Zmanovska
Arkādijs Borisovs
Atslēgas vārdi reinforcement learning, non-Markovian deterministic environments, intelligent agent control
Anotācija Klasiskās apmācības ar pastiprināšanu metodes veiksmīgi funkcionē tā saucamajās nemarkova vidēs. Šajā darbā tiek izvirzīta ideja un algoritma izpildīšana nemarkova videi. Ierosinātā pieeja piedāvā daudznozīmīgo stāvokļu apmeklēšanas paņēmienu. Raksts definē un sīki apskata daudznozīmīgu stāvokļu formas nemarkova vidēs. Apmeklēšana ir svarīga fāze pirms politikas uzbūvei nemarkova vidēs izmantojot stāvokļu iekšējo reprezentāciju. Savukārt, stāvokļu iekšējai reprezentācijai ir jāsaglābj konverģences noteikumi, apmācības ar pastiprinājumu īpašības un priekšrocības. Raksta būtiska daļa ir veltīta daudznozīmīgo stāvokļu izrādīšanas pazīmēm un atrāšanas algoritmiem. Kā ir rādīts rakstā, pats grūtākais uzdevums ir atšķirt viena un tā paša stāvokļa divus eksemplārus. Raksts iekļauj sevī teorētisko ievadu, problēmu aprakstu un tās izpausmi šūnu pasaulē. Tika formulēti daudznozīmīgu stāvokļu trīs formas un izvirzīta tās atklāšanās ideja. Lai iegūtu praktiskus rezultātus, tika izstrādāta programmatūra, kas dotai pasaulei veido visu daudznozīmīgu stāvokļu sarakstu. Pamatojoties uz iegūtiem rezultātiem, izvirzīti secinājumi. Šīs darbs ir nepieciešamā iepriekšēja fāze aģenta nemarkova vidē funkcionēšanas uzdevuma izpētē.
Atsauce Čižovs, J., Zmanovska, T., Borisovs, A. Ambiguous States Determination in Non-Markovian Environments. Informācijas tehnoloģija un vadības zinātne. Nr.36, 2008, 140.-147.lpp. ISSN 1407-7493.
Pilnais teksts Pilnais teksts
ID 4856