첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

코퍼스 기반 음성합성기술 동향(Technology Trends in Corpus-based Speech Synthesis)

전문가 제언
□ 최근 인간과 컴퓨터간의 자연스러운 통신을 위하여 음성언어를 이용한 휴먼 인터페이스기술에 대한 관심이 높아지고 있다. 음성언어를 이용한 인터페이스를 실현하기 위해서는 기계가 음성을 이해하고, 기계가 음성을 생성하는 음성인식, 음성합성기술이 필요하다.

□ 음성합성기술은 현재 상용화되어 서비스에 응용될 만큼 많은 기술적 발전이 진행되어 왔다. 음성합성기술은 기계가 인간의 음성을 합성하여 내는 기술로서, 기계에 의한 합성음성은 명료하고 자연스러워야 한다.

□ 음성합성은 인간의 발성모델을 토대로 연구되어 왔으며, 성대의 진동특성과 전달함수를 모델링하여 구현되고 있다. 이러한 모델링에 의한 합성방식의 대표적인 것으로 LPC 계열의 파라미터 합성방식이 주류를 이루어 왔다. 그 후 프랑스의 CNET에서 PSOLA 합성방식을 개발하여 합성음성의 명료도와 자연성을 대폭 향상시켰다.

□ 음성합성의 종류는 합성원리에 따라 세 가지로 분류할 수 있다. 즉, 음성파형을 그대로 이용하는 파형부호화 합성방법, 통신량을 감소하기 위하여 음성을 분석한 파라미터를 구한 후 이것을 이용하여 다시 음성을 합성하는 분석합성방법, 음성학과 언어학의 규칙을 기본으로 하여 문자와 운율 특징으로부터 음성을 합성하는 규칙합성방법 등으로 분류된다.

□ 컴퓨터의 연산속도 및 기억용량이 급속히 발전함에 따라, 음성합성 연구의 궁극적인 목표는 단순히 인간의 발성기관 모델링에 그치지 않고, 문서치리기술을 포함한 문서-음성변환(TTS) 시스템기술의 개발로 확장하는 것이며, 이로 인하여 음성변환 기술의 발전을 가져 올 것이다.
저자
Masanobu ABE
자료유형
원문언어
일어
기업산업분류
전기·전자
연도
2004
권(호)
87(2)
잡지명
전자정보통신학회지(A104)
과학기술
표준분류
전기·전자
페이지
129~134
분석자
장*석
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동