강화학습 연구의 발자취
- 전문가 제언
-
강화학습(reinforcement learning)이란 목표지향형의 학습과 의사결정을 이해하고 실현하기 위한 계산론적인 접근법으로, 시행착오에 의한 환경과의 상호작용을 통해 학습해 나간다는 점에서 교사에 의한 교시나 환경의 완전한 모델에 의존하는 다른 학습과는 구별된다. 이 강화학습의 연구에는 크게 3가지 흐름이 존재한다고 생각된다. 첫 번째 흐름으로서는 분류자 시스템(classification system), 두 번째 흐름은 뉴럴 네트워크(Neural Network) 관련 연구에서의 시행착오 학습, 세 번째 흐름은 마코프(Markov) 결정과정의 최적 제어문제와 다이나믹 프로그래밍(DP: Dynamic Programming)을 들 수 있다.
- 저자
- Hajime Kimura
- 자료유형
- 연구단신
- 원문언어
- 일어
- 기업산업분류
- 정보통신
- 연도
- 2013
- 권(호)
- 52(1)
- 잡지명
- 計測と制御
- 과학기술
표준분류 - 정보통신
- 페이지
- 68~71
- 분석자
- 박*준
- 분석물
-
이미지변환중입니다.