알림마당

  1. home

로봇 청각을 위한 정보통합의 현상과 과제

전문가 제언
○ 국제 로봇 연맹(IFR)에 따르면 현재의 로봇 산업은 시장형성 초기 단계다. 연맹은 세계시장 규모는 85억 달러 정도로 그 규모가 다른 산업보다 그리 크지 않지만 미래성장 가능성은 어느 산업보다도 클 것이라고 주장했다. 로봇 산업은 10년 이후부터 큰 폭으로 성장하여 2020년경에는 4200억 달러 이상의 거대시장으로 급성장할 것으로 예상하고 있다.

○ 3차원 입체음향 기술이란 인간이 청각만으로 음원의 위치를 3차원 상에서 파악할 수 있는 메커니즘을 이해하고, 이를 공학적으로 응용하는 전반적인 기술을 의미한다. 일반적으로 3차원 상의 위치는 3개의 변수로 표현하고, 이를 추정하려면 3개의 독립 변수를 측정해야만 가능하다.

○ 인간의 음원 위치파악 메커니즘을 정확히 파악하고, 이를 재현시킬 수 있다면 가상 입체 음장 구현이 가능하고, 이를 거꾸로 응용하여 두 개 또는 다수의 마이크로폰으로 측정한 신호로부터 실제 음원의 위치를 알아낼 수 있다. 이러한 기술은 기존의 시각위주 가상현실 시스템에 청각 가상현실을 추가하여 몰입감을 높이는 데 사용될 수 있을 것이다.

○ 로봇 청각에 적극적으로 활용해야 할 속성은 신체성(身体性)이다. 이는 인간과 가장 공통적인 점이며, 소프트웨어 에이전트로 개발된 기술이 로봇에게 잘 적용되지 않는 요인이기도 하다. 인간이나 로봇의 얼굴 모양은 귀(마이크로폰)에 들어오는 소리에 균일하지 않은 변형을 준다. 이 영향은 머리 음향 전달함수(HRTF: Head Related Transfer Function)라고 부르며, 인간은 HRTF를 적극적으로 활용하여 양 귀 사이의 시간차나 양 귀 사이의 강도 차에 의해 음원 방향을 정하고 있다.

○ 한국과학기술연구원(KIST) 인지 로봇 연구단 최종석 박사팀은 주변에서 나는 소리를 분석해 자신의 대화 상대를 찾아내고, 그 위치를 카메라로 추적할 수 있는 “지능 로봇을 위한 능동 청각 시스템”을 개발하였다. 이 시스템은 주변의 소리를 분석해 음성의 방향을 찾아내는 “음성방향인식 모듈”과 음성의 방향으로 카메라를 움직이는 “모터 구동 모듈”과 카메라에 들어온 영상을 분석해 대화 상대를 찾는 “카메라 영상분석 부분” 등으로 구성되어 있다.
저자
Hiroshi Okuno
자료유형
학술정보
원문언어
일어
기업산업분류
정밀기계
연도
2007
권(호)
46(6)
잡지명
計測と制御 
과학기술
표준분류
정밀기계
페이지
415~419
분석자
이*요
분석물
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동