3기(190911~)/강화학습

11/20 발표자료

KAU-Deeperent 2019. 11. 20. 02:29

 

 

(좌) cartpole PID (우) Length를 4m로 증가 시켰을 때

 

REINFORCE 알고리즘을 사용하여 제어
reward.pptx
0.13MB

지난번 카트폴발표때 reward에 대한 질문이 있어 이번 주제로 하게 되었습니다.