'5기(210102~)/강화학습' 카테고리의 글 목록

강화학습팀 스터디 Review

강화학습팀 : 조민성 이상민 임정환 차원범 백윤성 발표자 : 백윤성 강화학습팀은 David Silver의 Reinforcement Learning Course를 리뷰한 팡요랩 유튜브를 보며 스터디를 진행하였다. Lecture 1~6의 강의를 들었고 해당 리뷰에서는 Lecture 2~5의 내용에 대한 대략적인 리뷰를 진행한다. 리뷰에 앞서서 RL문제에 대한 분류를 보자면 1. environment에 대한 model을 아느냐, 즉 MDP를 모두 아는 상황의 문제를 model-based, MDP를 모두 알지는 못하는 문제를 model-free문제로 볼 수 있다. model-based 문제는 model을 통해 바로 다음 state를 planning이 가능하지만 model-free 문제는 알지 못하기 때문에 시뮬..

5기(210102~)/강화학습 2021.04.15

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

KAU-Deeperent

5기(210102~)/강화학습 1

티스토리툴바