육도음성을 이용한 음성인식
- 전문가 제언
-
○ 음성정보 처리기술은 음성신호에 포함된 정보를 자동으로 분석하거나 정보로부터 음성을 생성하는 기술을 의미한다. 여기에는 사람의 말을 알아듣는 음성인식, 문장을 말로 바꿔주는 음성합성, 말하는 사람이 누구인지를 식별하는 화자인식 등이 포함된다.
○ 통신기술의 발전과 함께 휴대단말기를 통해 언제 어디서나 주고받는 시대가 도래하면서 키보드를 쉽게 사용할 수 없는 환경에서 인터페이스 수단으로 음성의 필요성이 증가하고 있다. 운전 중에 자동차 내에서 각종 정보를 처리할 수 있는 텔레매틱스 서비스에서도 음성 인터페이스는 필수요소가 되고 있다.
○ 음성인식은 잡음과 채널특성에 따라 왜곡된 음성신호를 문장으로 복원하는 과정이며 다양한 변화요인이 있기 때문에 어려운 문제를 많이 수반하고 있다. 따라서 음성인식의 목표는 잡음이 있는 실제상황에서 임의의 화자가 어휘에 제한 없이 자연스럽게 발음한 연속음성을 실시간으로 인식하고 이해하는 수준을 만족시키는 시스템을 개발하는 것이다.
○ 사람과 아무런 제한 없이 자유롭게 의사소통하는 음성 인터페이스를 확보하기 위한 노력이 계속되고 있다. 현재 기술의 한계를 극복하기 위한 기반기술, 현재의 기술수준으로 해결할 수 있는 특정한 응용분야에 최적화된 솔루션 등을 개발해야 할 것이다. 꿈의 인터페이스인 음성기술의 발전이 정보통신, 자동차, 가전기기 등 산업분야에 전개될 파급효과를 기대한다.
- 저자
- Yoshitaka Nakajima, Kiyohiro Shikano
- 자료유형
- 학술정보
- 원문언어
- 일어
- 기업산업분류
- 전기·전자
- 연도
- 2006
- 권(호)
- 62(6)
- 잡지명
- 일본음향학회지(L142)
- 과학기술
표준분류 - 전기·전자
- 페이지
- 454~459
- 분석자
- 장*석
- 분석물
-
이미지변환중입니다.