Praca dotyczy zagadnienia strojenia kontrolera PI, używając algorytmów ucze-nia ze wzmocnieniem, przy uwzględnieniu dwóch wielkości charakteryzujących odpowiedź systemu: przesterowania oraz błędu ustalania. W pracy zostało ukazane, iż nawet stosując prostą funkcję wzmocnienia, przedstawiona metoda działa, gwarantując wymagane parametry odpowiedzi systemu. Jest to wskazówka, iż prace w danej dziedzinie mają sens i winny być kontynuowane. W przyszłe badania skoncentrują się na uwzględnieniu czasu ustalania (settling time), który tutaj został pominięty. Dodatkowo, zostaną użyte bardziej wysublimowane funkcje wzmocnienia. Docelowe jest stworzenie adaptacyjnego strojenia kontrolera PID, a w późniejszym czasie BPID.
Autor: Radosław RUDEK
REFERENCES
[1] MITCHELL T., Machine Learning, McGraw-Hill International Editions, (1997), Chapter 12.
[2] ANDERSON C. W., HITTLE D. C., Synthesis of Reinforcement Learning, Neural Ne-tworks, and PI Control Applied to a Simulated Heating Coil, Colorado State University, (1996).
[3] FRANKLIN G., Powell D., EMAMI-NAEINI A., Feedback Control of Dynamic Systems, Addison-Wesley, (1991), Chapter 3.
[4] WATKINS C., DAYAN P., Q-learning, Machine Learning, 8, 1992, pp. 279-292.
[5] SUTTON R., BARTO A., Reinforcement Learning, MIT Press, Cambridge, (1998)
[6] RUDEK R., Q-Learning Based Algorithms for Solving Unknown Multi-Criteria Problems, Proc. of IVth Polish Conference on Computer Pattern Recognition Systems KOSYR, Mił-ków, (2003), pp.190-195