알림마당

  1. home

음성합성 연구도 협력과 경쟁의 시대로

전문가 제언
○ 음성은 인간의 의사소통 수단으로 가장 편리하게 사용되는 매체이다. 음성 중에 포함된 기본적인 정보로 언어 정보, 개인성 정보, 정서 정보 등을 들 수 있다. 음성 언어를 이용한 인터페이스를 실현하기 위해서는 기계가 음성을 이해하는 음성인식, 기계가 음성을 생성하는 음성합성 기술이 필요하다. 기계에 의해 합성된 음성은 명료하고 자연스러워야 한다.

○ 자연스러운 음성의 합성을 위한 기본적인 기술인 언어처리 기술, 운율제어 기술, 음성생성 기술 등이 현재로서는 충분한 수준에 도달되었다고 보기 어려운 실정이다. 음성합성에 대한 연구는 인간의 발성 모델을 토대로 이루어지고 있으며 성대의 진동특성, 전달함수 등을 모델링하여 구현되고 있다.

○ 음성합성의 종류로는 그 원리에 따라 파형부호화 합성, 분석 합성, 규칙 합성 등을 들 수 있으며 각각 장단점을 갖고 있다. 음성합성 시스템의 이상적인 목표는 자연성과 명료성이라 할 수 있다. 자연성을 위해서는 한국어 언어처리에 기반을 둔 운율 정보의 생성 및 제어 기술이 필요하며 명료성을 위해서는 음운변동의 규칙, 합성 방식, 합성 단위의 접속 기술이 필요한 것으로 알려졌다.

○ 음성 신호처리 기술은 음성분석, 음성합성, 음성인식, 화자인식, 발성변환 기술 등 다양한 측면에서 연구 개발되고 있다. 정보통신 기술의 발전에 따라 이 기술들은 협력과 경쟁 관계를 조화롭게 유지하면서 개발되기를 기대한다.
저자
Keiichi Tokuda, Alan W Black
자료유형
학술정보
원문언어
일어
기업산업분류
전기·전자
연도
2006
권(호)
62(6)
잡지명
일본음향학회지(L142)
과학기술
표준분류
전기·전자
페이지
466~472
분석자
장*석
분석물
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동