로봇 청각을 위한 정보통합의 현상과 과제
- 전문가 제언
-
○ 국제 로봇 연맹(IFR)에 따르면 현재의 로봇 산업은 시장형성 초기 단계다. 연맹은 세계시장 규모는 85억 달러 정도로 그 규모가 다른 산업보다 그리 크지 않지만 미래성장 가능성은 어느 산업보다도 클 것이라고 주장했다. 로봇 산업은 10년 이후부터 큰 폭으로 성장하여 2020년경에는 4200억 달러 이상의 거대시장으로 급성장할 것으로 예상하고 있다.
○ 3차원 입체음향 기술이란 인간이 청각만으로 음원의 위치를 3차원 상에서 파악할 수 있는 메커니즘을 이해하고, 이를 공학적으로 응용하는 전반적인 기술을 의미한다. 일반적으로 3차원 상의 위치는 3개의 변수로 표현하고, 이를 추정하려면 3개의 독립 변수를 측정해야만 가능하다.
○ 인간의 음원 위치파악 메커니즘을 정확히 파악하고, 이를 재현시킬 수 있다면 가상 입체 음장 구현이 가능하고, 이를 거꾸로 응용하여 두 개 또는 다수의 마이크로폰으로 측정한 신호로부터 실제 음원의 위치를 알아낼 수 있다. 이러한 기술은 기존의 시각위주 가상현실 시스템에 청각 가상현실을 추가하여 몰입감을 높이는 데 사용될 수 있을 것이다.
○ 로봇 청각에 적극적으로 활용해야 할 속성은 신체성(身体性)이다. 이는 인간과 가장 공통적인 점이며, 소프트웨어 에이전트로 개발된 기술이 로봇에게 잘 적용되지 않는 요인이기도 하다. 인간이나 로봇의 얼굴 모양은 귀(마이크로폰)에 들어오는 소리에 균일하지 않은 변형을 준다. 이 영향은 머리 음향 전달함수(HRTF: Head Related Transfer Function)라고 부르며, 인간은 HRTF를 적극적으로 활용하여 양 귀 사이의 시간차나 양 귀 사이의 강도 차에 의해 음원 방향을 정하고 있다.
○ 한국과학기술연구원(KIST) 인지 로봇 연구단 최종석 박사팀은 주변에서 나는 소리를 분석해 자신의 대화 상대를 찾아내고, 그 위치를 카메라로 추적할 수 있는 “지능 로봇을 위한 능동 청각 시스템”을 개발하였다. 이 시스템은 주변의 소리를 분석해 음성의 방향을 찾아내는 “음성방향인식 모듈”과 음성의 방향으로 카메라를 움직이는 “모터 구동 모듈”과 카메라에 들어온 영상을 분석해 대화 상대를 찾는 “카메라 영상분석 부분” 등으로 구성되어 있다.
- 저자
- Hiroshi Okuno
- 자료유형
- 학술정보
- 원문언어
- 일어
- 기업산업분류
- 정밀기계
- 연도
- 2007
- 권(호)
- 46(6)
- 잡지명
- 計測と制御
- 과학기술
표준분류 - 정밀기계
- 페이지
- 415~419
- 분석자
- 이*요
- 분석물
-
이미지변환중입니다.