KAU-Deeperent

  • 홈
  • 방명록

5기(210102~)/강화학습 1

강화학습팀 스터디 Review

강화학습팀 : 조민성 이상민 임정환 차원범 백윤성 발표자 : 백윤성 강화학습팀은 David Silver의 Reinforcement Learning Course를 리뷰한 팡요랩 유튜브를 보며 스터디를 진행하였다. Lecture 1~6의 강의를 들었고 해당 리뷰에서는 Lecture 2~5의 내용에 대한 대략적인 리뷰를 진행한다. 리뷰에 앞서서 RL문제에 대한 분류를 보자면 1. environment에 대한 model을 아느냐, 즉 MDP를 모두 아는 상황의 문제를 model-based, MDP를 모두 알지는 못하는 문제를 model-free문제로 볼 수 있다. model-based 문제는 model을 통해 바로 다음 state를 planning이 가능하지만 model-free 문제는 알지 못하기 때문에 시뮬..

5기(210102~)/강화학습 2021.04.15
1
더보기
프로필사진

안녕하세요. 한국항공대학교 머신러닝 동아리 (구 딥러닝학회) 입니다.

  • Deeperent (153)
    • 7기 (5)
    • 6기 (1)
    • 5기(210102~) (21)
      • 강화학습 (1)
      • 비전 (0)
      • Pattern Recognition (0)
      • A팀 (6)
      • B팀 (7)
      • C팀 (6)
    • 4기(20200711) (39)
      • 수학 스터디 (13)
      • 강화학습 (4)
      • 데이콘 (5)
      • 이론팀 (2)
      • 1팀 (5)
      • 2팀 (3)
    • 3.5기(200104~) (53)
      • 3팀 (8)
      • 출석체크 팀 (14)
      • 강화학습 (7)
      • 감정인식 (8)
    • 3기(190911~) (14)
      • pose estimation (2)
      • image segmentation (3)
      • 이론팀 (3)
      • 강화학습 (6)
    • Monthly Seminar (14)
    • Deeperent 활동 (4)
      • 1기&2기 (0)
      • 대외활동 (4)

Tag

DEEPSORT, RCNN, AI Winter, 샴네트워크, 딥소트, SNN, 부산대 딥러닝 강의 #소프트맥스 회귀 #군집분석, https://kr.mathworks.com/help/deeplearning/ug/layers-of-a-convolutional-neural-network.html, 백터화, https://metar.tistory.com/201, DDPG, data_augmentation, 자율주행, pytorch, https://angeloyeo.github.io/2019/08/01/SVD.html, MultipleObjectTracking, siamese Network, 튜닝프로세스, https://hwiyong.tistory.com/324, 강화학습,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 정기세션 블로그 활용법

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바