강화학습팀 : 조민성 이상민 임정환 차원범 백윤성 발표자 : 백윤성 강화학습팀은 David Silver의 Reinforcement Learning Course를 리뷰한 팡요랩 유튜브를 보며 스터디를 진행하였다. Lecture 1~6의 강의를 들었고 해당 리뷰에서는 Lecture 2~5의 내용에 대한 대략적인 리뷰를 진행한다. 리뷰에 앞서서 RL문제에 대한 분류를 보자면 1. environment에 대한 model을 아느냐, 즉 MDP를 모두 아는 상황의 문제를 model-based, MDP를 모두 알지는 못하는 문제를 model-free문제로 볼 수 있다. model-based 문제는 model을 통해 바로 다음 state를 planning이 가능하지만 model-free 문제는 알지 못하기 때문에 시뮬..