지적 화상처리에의 최첨단 연구동향-커뮤니케이션 갭을 메우는 얼굴 화상처리기술
- 전문가 제언
-
□ 지적 화상처리에의 최첨단 연구동향의 일환으로서 커뮤니케이션 갭을 메우는 얼굴 화상처리 기술에 대해 언급하였다. 여기서 커뮤니케이션 갭이란 언어의 장벽이나 비언어 정보의 결여에 기인하는 것으로서 이 갭을 얼굴인식과 합성기술을 구사하여 보충하고, 보다 원활한 커뮤니케이션을 실현시키기 위해 제거되어야 할 대상이다.
□ 얼굴 화상처리를 위해서는 개인 얼굴 모델의 작성, 발화(發話)모델의 작성, 텍스처 블렌딩의 실현, 얼굴의 트래킹, 멀티 모우들(multi modal) 번역 시스템의 이용, 상호작용적 영화 시스템의 활용, 보다 높은 현실감을 추구하기 위한 표정의 동적 모델링, 두발의 운동 모델링, 골격의 모션 캡쳐 등이 실현되어야 한다.
□ 얼굴 화상합성 연구자와 음성인식 · 합성 · 대화의 연구자가 공동으로 의인화 에이전트에 의한 멀티 모우들 대화를 실현하는 프리 소프트웨어의 개발이 필요하다. 그리고 음성인식, 음성합성, 얼굴 화상합성의 각 모듈을 독립된 컴포넌트로서 통합적으로 제어하는 에이전트 관리자(Agent Manager)와 대화중에 갑자기 끼어들기를 고려한 대화 태스크도 제어하는 태스크 관리자까지 포함하여 누구나 용이하게 대화 시스템의 구성이 가능하며, 합성음성과의 립싱크도 자동적으로 실현될 수 있도록 해야 할 것이다.
□ 실감나는 의인화 에이전트의 실현이라는 관점에서 Morishima 등이 제안한 여러 가지 요소기술을 융합하여 충실도가 높은 사본을 실현하는 것이 앞으로의 과제가 될 것이다.
- 저자
- MORISHIMA Shigeo
- 자료유형
- 원문언어
- 일어
- 기업산업분류
- 정보통신
- 연도
- 2004
- 권(호)
- 42(4)
- 잡지명
- 광기술콘택트(N140)
- 과학기술
표준분류 - 정보통신
- 페이지
- 190~197
- 분석자
- 이*요
- 분석물
-