Strony: 1 |
2 |
3 |
4 |
5 |
»
Wprowadzenie do idei adaptacyjnego strojenia kontrolera pi przy użyciu algorytmów uczenia ze wzmocnieniem uwzględniając wielkości overshoot i steady state error
Sobota, 14 marca
Abstract
Niniejsza praca jest wprowadzeniem i przedstawieniem idei oraz sensu zastosowania algorytmów uczenia ze wzmocnieniem, w przypadku adaptacyjnego i automatycznego strojenia kontrolera PI, przy uwzględnieniu wielkości Overshoot i Steady State Error. Uczenie ze wzmocnieniem, dzięki wspieraniu systemów pracujące w trybie on-line, staje się potężnym narzędziem w praktycznych problemach i zagadnieniach sterowania elementami czasu rzeczywistego, gdzie parametry obiektu sterowanego nie są znane, zaś wszelkie operacje na nim opierają się na interakcjach. Prezentowane podejście znacznie zwiększa możliwości oraz poszerza ewentualne obszary zastosowań sterownika, strojonego przy użyciu proponowanych algorytmów.
Autor: Radosław RUDEK
1. WPROWADZENIE
Uczenie ze wzmocnieniem (Reinforcement Learning) RL umożliwia uczniowi zaadoptowanie się do określonego środowiska poprzez nieustanne zbieranie informacji. Algorytmy owe posiadają olbrzymie zalety w problemach stochastycznych oraz w zagadnieniach, bez wszystkowiedzącego nauczyciela, bądź w takich, gdzie środowisko działania jest nieznane. Jedyną informacją dostarczaną uczniowi-agentowi jest nagroda, tudzież kara [1]. Olbrzymią zaletą proponowanych metod jest doskonałą adaptacja i uczenie się w nieznanym otoczeniu, gdy wymagane jest działanie w czasie rzeczywistym. Dlatego też, wysunięta propozycja zastosowania uczenia ze wzmocnieniem do strojenia kontrolerów PI, które sterują obiektami o parametrach nieznanych, bądź zmie-niających się w sposób trudny do antycypacji.
Do tej pory pojawiło się niewiele publikacji w omawianej dziedzinie, natomiast dostępne [2] nie wyczerpują wszystkich pytań oraz możliwości.
Wart podkreślenia jest fakt, iż niniejsza praca posiada jedynie charakter wprowadzający do nowej idei. Dlatego też, niemożliwym jest, by w rozważaniach zostały uwzględnione wszystkie wielkości, charakteryzujące efektywność strojenia kontrolera.
Czytaj dalej
Artykuły z tej samej kategorii