첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

자연스러운 음성대화처리 기술의 종합개발

전문가 제언

○ 최근에 정보통신 기술이 발전함에 따라 누구든지 쉽게 정보를 교환할 수 있는 수단으로 사람과 기계 사이에 자연스러운 음성대화를 실현할 필요가 있다. 이에 따라 일본에서는 2003년부터 5년간 음성의 인식 및 합성 기술을 보급하기 위해 ‘정보화사회기반 소프트웨어 종합개발' 프로젝트를 추진해 왔다.

○ 본고에서는 이 프로젝트와 관련하여 이용자 부담이 없는 화자(話者) 및 환경 적응성을 실현하는 자연스러운 음성대화 처리기술의 종합개발 개요를 고찰하였다. 여기서 음성대화 처리기술에는 음성의 인식 및 합성 기술이 포함된다.

○ 최근에 인간과 컴퓨터 간의 자연스러운 통신을 위하여 음성언어를 이용한 휴먼 인터페이스 기술에 대한 관심이 높아지고 있다. 음성언어를 이용한 인터페이스를 실현하기 위해서는 기계가 음성을 이해하고, 기계가 음성을 생성하는 음성인식, 음성합성 기술이 필요하다.

○ 음성인식 기술은 음성에 포함된 음향학적 정보로부터 음운과 언어적 정보를 추출하여 이를 기계가 인지하고 반응하게 만드는 일련의 과정이라 할 수 있다. 음성합성 기술은 현재 상용화되어 서비스에 응용될 만큼 많은 기술적 발전이 진행되어 왔다. 음성합성 기술은 기계가 인간의 음성을 합성하여 내는 기술로서 기계에 의한 합성음성은 명료하고 자연스러워야 한다.

○ 음성합성 기술은 인간의 발성모델을 토대로 연구되어 왔으며, 성대의 진동특성과 전달함수를 모델링하여 구현되고 있다. 이러한 모델링에 의한 합성방식의 대표적인 것으로 LPC 계열의 파라미터 합성방식이 주류를 이뤄왔다.

○ 음성합성 연구의 궁극적인 목표는 문서처리 기술을 포함한 문서-음성변환(TTS) 시스템 기술의 개발로 확장하는 것이며 이로 인하여 음성변환 기술이 발전될 것이다.
저자
Kiyohiro SHIKANO, et al
자료유형
학술정보
원문언어
일어
기업산업분류
전기·전자
연도
2009
권(호)
92(6)
잡지명
電子情報通信學會誌
과학기술
표준분류
전기·전자
페이지
475~492
분석자
장*석
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동