알림마당

  1. home

MSVQ의 코드 북을 이용한 고 인식률 화자독립단어 음성인식시스템

전문가 제언
○ 최근 들어 인간의 의지를 각종의 전자시스템에 전달하기 위한 수단으로 음성인식 기술을 이용하고자 하는 연구가 널리 진행되고 있다. 음성인식 인터페이스에서 가장 중요한 이슈는 높은 인식률과 처리시간의 단축 및 범용 인터페이스의 개발이라고 할 수 있을 것이다.

○ 오늘날 연속음성의 자동인식은 실용단계에 들어가 있으나 불특정화자에게 즉석에서 대응하는 것과 같은 인식률이 높은 음성인식 시스템은 아직 실현되고 있지 않다. 따라서 많은 음성인식의 응용 면에서는 인식시스템이 임의화자에게 즉시 대응할 필요성이 제기되고 있다.

○ 이 논문에서 제안하는 인식시스템은 인식의 기본 시스템에서 2개의 고정밀도의 단어후보사이의 언어음을 비교해서 가중평균거리를 구하는 것으로 인식을 실행한다. 인식대상의 520개 단어의 어휘 중에 음성이 유사한 단어를 포함한 경우에서도 오차가 적고 실험한 남녀 80명의 평균인식률이 98.44%로 아주 양호한 결과를 얻고 있다.

○ 제안한 인식시스템의 실용화를 위해서는 잡음환경 아래서의 인식문제나 HMM 등의 타방식의 인식시스템과의 성능비교평가 실험 등이 개선되어야 할 부분이다. 또한 신경망과 HMM을 결합한 모델도 연구대상이 될 수 있을 것이다.

○ 음성인식 전반적으로서는 대규모의 음성데이터에 기초를 둔 일상의 언어모델을 구축하는 일과 다수화자의 개인차의 모델을 구축하여 다수 화자의 음성에 대한 적응 알고리즘의 개발 및 여러 종류의 잡음이나 왜곡에 자동적으로 적응되는 방법을 강구하는 것 등이 중요한 기술적 과제가 될 것이다.
저자
Yutaka Sakaguchi and Satoshi Imai
자료유형
학술정보
원문언어
일어
기업산업분류
전기·전자
연도
2008
권(호)
64(5)
잡지명
日本音響??誌
과학기술
표준분류
전기·전자
페이지
298~309
분석자
이*영
분석물
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동