첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

강화학습 연구의 발자취

전문가 제언
강화학습(reinforcement learning)이란 목표지향형의 학습과 의사결정을 이해하고 실현하기 위한 계산론적인 접근법으로, 시행착오에 의한 환경과의 상호작용을 통해 학습해 나간다는 점에서 교사에 의한 교시나 환경의 완전한 모델에 의존하는 다른 학습과는 구별된다. 이 강화학습의 연구에는 크게 3가지 흐름이 존재한다고 생각된다. 첫 번째 흐름으로서는 분류자 시스템(classification system), 두 번째 흐름은 뉴럴 네트워크(Neural Network) 관련 연구에서의 시행착오 학습, 세 번째 흐름은 마코프(Markov) 결정과정의 최적 제어문제와 다이나믹 프로그래밍(DP: Dynamic Programming)을 들 수 있다.
저자
Hajime Kimura
자료유형
연구단신
원문언어
일어
기업산업분류
정보통신
연도
2013
권(호)
52(1)
잡지명
計測と制御
과학기술
표준분류
정보통신
페이지
68~71
분석자
박*준
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동