인간형 발화 로봇(Humanoid talking robot)
- 전문가 제언
-
□ Honda 등은 인간형 발화 로봇(Humanoid Talking Robot)을 1999년부터 개발에 착수하여 여러 가지 개량을 거듭한 후 오늘날 Waseda Talking No.4(WT-4)를 구축하였다. 최근에 와서 2족 보행 로봇이 개발되었으며, 음성 인식 기술과 음성 합성 기술에 의해 대화기능을 실현하고 있다. 인간의 발화(發話)는 음성기관을 동작시켜 성도(聲道) 내에서 음향유체현상을 조정함으로써 행해지며, 이를 직접적으로 재현할 수 있는 음성기관을 직접 제어함으로써 다양한 성질(聲質)이나 발화 스타일을 생성할 수 있는 가능성이 제기되었다.
□ 인간형 발화 로봇인 WT-4는 전체적으로 19개의 자유도를 가지고 있는데, 이들은 조음기관(입술 · 치아 · 혀 · 비강과 연구개)의 14개의 자유도와 발성기관(성대 · 폐)에 5개 자유도이다. 그리고 이 WT-4의 주요 기구로는 입술 구동기구, 혀 구동기구, 치아 구동기구, 연구개 기구, 폐 구동기구 및 성대 구동기구 등이 있다.
□ 인간형 발화 로봇인 WT-4를 이용하여 모음 발성실험과 자음 발생실험을 하였다. 먼저 모음 발생실험에서는 모음 음성 스펙트럼을 인간의 음성과 로봇 음성으로 비교하여 나타내었는데 로봇 음성의 스펙트럼은 인간의 음성에 비해 전체적으로 평탄한 스펙트럼가 되는 경향이 있었다. 다음으로 자음 발성실험에서 발화 로봇에서는 폐로부터 송출된 공기류 때문에 성도 내가 좁아져 마찰자음이 발성되고, 성도 내에서의 폐쇄를 개방함으로써 파열자음이 발성된다. 이 실험 결과 자음에 대한 약간의 음질 흐트러짐이 있었으나 어느 일본어 자음에 관해서도 양호한 명료성을 가지고 있음이 확인되었다.
□ 인간형 발화 로봇에 의한 들음 흉내 발화를 위해 은닉 마코프 모델(HMM)인 음성 생성 모델을 이용하여 음성으로부터 발성자의 발화동작을 결정하고, 발성자의 조음운동을 로봇 파라미터로 변환한다. HMM 음성 생성 모델은 발화동작의 행동거지를 표현하는 HMM과 발성동작, 그리고 음성 스펙트럼 사이의 비선형적인 관계를 나타내는 조음 · 음향 매핑에 의해 구성된다.
- 저자
- Masaaki Honda ; Kazufumi Nishikawa ; Atsuo Takanishi ; Sadao Hiroya (etc.)
- 자료유형
- 학술정보
- 원문언어
- 일어
- 기업산업분류
- 전기·전자
- 연도
- 2005
- 권(호)
- 61(2)
- 잡지명
- 일본음향학회지(L142)
- 과학기술
표준분류 - 전기·전자
- 페이지
- 91~96
- 분석자
- 이*요
- 분석물
-