뇌의 옵션 활용과 탐구
- 전문가 제언
-
변화무쌍한 세계에서 뇌는 최적의 결과를 얻고자 행위 양식을 계속적으로 만들고 추적 관찰하며 조정한다. 자주 우리가 문제를 해결하거나 특별한 결과에 이르기 위하여 과거에 사용한 전략들을 유사한 상황에 직면하면 다시 수행한다. 이런 경우에 우리는 최대한의 이득을 위하여 그와 같은 전략을 활용할 수 있다. 그렇지만 환경이나 전후 상황의 중요한 측면이 변하면 우리는 우리의 행동을 바꿔서 새로운 행동 전략을 모색할 필요가 있다. 어떻게 뇌는 행위를 추적 관찰하고 적응하며 새 전략들을 만드는가? Donoso 등은 주요한 알고리즘과 신경생물학을 통하여 인간 뇌의 그와 같은 위업의 달성에 대한 이해를 이번 호{Science, 344(6191) 참조}의 1481쪽에 게재하였다.
광범위한 가능 행위로부터 최선의 반응에 대한 추론에 뇌가 신속하게 돌아갈 것 같지 않아서 어려운 계산이 자주 포함된다. 그럼에도 불구하고 인간은 자주 그와 같은 상황에서 잘 한다.
보상 학습 알고리즘은 자극이나 행위로 얻어진 이득에 대한 기대를 예측과 실제 상황 사이의 불일치를 수량화한 예측 오차 신호를 토대로 하여 새롭게 한다. 그 알고리즘은 기계 학습 응용과 다양한 측면의 인간과 동물의 행위에 대한 설명에 사용된다. 더욱이 예측 오차 신호는 중뇌에 위치하고 선조와 전전두의 학습과 결정 영역에 나타나는 도파민 신경세포와 관련이 있다. 그 신호들은 뇌가 다수 행위 전략의 이득을 동시에 추적할 수 있음을 시사하면서 실행된 행위뿐만 아니라 대체 행위로 나타난다.
- 저자
- Todd Hare
- 자료유형
- 연구단신
- 원문언어
- 영어
- 기업산업분류
- 바이오
- 연도
- 2014
- 권(호)
- 344(6191)
- 잡지명
- SCIENCE
- 과학기술
표준분류 - 바이오
- 페이지
- 1446~1447
- 분석자
- 현*옥
- 분석물
-