음원분리 기술의 최신 동향
- 전문가 제언
-
○ 사람은 다소 소란한 가운데서도 필요한 소리를 들을 수 있다. 2∼3명이 동시에 대화할지라도 대화 내용을 들을 수 있다. 이와 같은 능력을 컴퓨터로 실현하기 위해 다양한 연구가 오랫동안 실시되었다. 그 중에서도 마이크로폰을 여러 개 이용하는 방법이 효과적인 것으로 알려졌다. 사람의 두 귀에 의해 청취능력이 향상되고 음원의 공간적 위치 차이를 이용할 수 있기 때문이다.
○ 마이크로폰을 여러 개 이용하는 방법으로 마이크로폰 어레이 기술이 오래 전부터 연구되어 왔다. 이는 여러 개의 마이크로폰에서 수신음에 다른 시간지연 현상을 이용하여 지향성을 형성하는 기술이다. 이 기술에서는 필요로 하는 음원의 방향, 음원의 무음상태 등의 정보가 필요하다.
○ 음원분리 기술은 실제 환경에서 핸즈프리(hands free) 음성인식, 컴퓨터에 의한 음향환경 등을 이해하기 위해 필요한 기술이다. 음원의 위치, 말하는 사람의 특징 등 사전지식이 필요하지 않으며, 소위 블라인드(blind) 처리에 관한 기술이 크게 발전했다. 본고에서는 독립성분 분석, 스파스(sparse) 성질 등 블라인드 음원분리에 필요한 기본기술의 연구동향을 고찰하였다.
○ 음원분리 기술에 의해 음원의 수가 2∼4개이고 3초 이상의 관측신호를 수신하면 남은 음향의 영향이 어느 정도 있을지라도 비교적 좋은 분리신호를 얻을 수 있다. 기존의 음원부리 방법으로는 주파수 영역에서 음원신호를 다차원 벡터로 모델화한 방법이 알려지기도 하였다. 최근에 홈시어터 시스템과 같은 멀티채널 오디오 시스템의 보급이 활발해지면서 이들 시스템의 음장특성(音場特性)의 최적화를 실현하는 연구가 활발하게 이뤄지고 있다.
- 저자
- Hiroshi SAWADA, Shoko ARAKI, Shoji MAKINO
- 자료유형
- 학술정보
- 원문언어
- 일어
- 기업산업분류
- 정보통신
- 연도
- 2008
- 권(호)
- 91(4)
- 잡지명
- 電子情報通信學會誌
- 과학기술
표준분류 - 정보통신
- 페이지
- 292~296
- 분석자
- 장*석
- 분석물
-
이미지변환중입니다.