제4세대의 음성인식 기술
- 전문가 제언
-
○ 음성인식(speech recognition)은 사람이 말하는 음성언어를 컴퓨터가 해석하여 그 내용을 문자데이터로 바꾸는 것이다. 음성인식과 관련이 있는 기술로서 사전에 기록하여 둔 음성패턴과 비교하여 개인을 인증하는 화자인식(speaker recognition)이 근래에 많이 응용되고 있다.
○ 1950년대 이후 연구개발한 음성인식 기술은 근래에 다양한 음성인식 시스템에 응용되고 있으나 그 성능은 인간의 능력에 비하면 매우 열악하여 인간 능력에 근접시키기 위해서는 많은 연구가 필요하다. 본고에서는 음성인식 기술의 변천과 앞으로의 음성인식에 대하여 기술하였다.
○ 음성인식 기술의 본격적인 연구개발은 컴퓨터가 보급되기 시작한 1970년대부터이다. 1971년 미국 국방부의 재정지원에 의한 SUR(Speech Understanding Research) 프로그램은 음성인식 역사상 가장 큰 프로젝트의 하나이며 음성인식 기술의 발전에 기여해왔다. 일본 동경공업대학에서는 현재의 음성인식 시스템을 차량내의 잡음환경 중에서도 이용할 수 있는 잡음에 강한 특징량이나 모델을 개발하고 있다.
○ 한국전자통신연구원(ETRI)에서는 음성인식 기술을 연구하고 있으며 세계 최초로 음향탐색 과정과 철자탐색 과정을 분리하여 음성을 인식하는 2단계 탐색기술을 개발하였다. 한국파워보이스에서 개발한 음성기반 기술은 화자인식기술, 개인인증, 생체인식, 보안 솔루션분야에 응용되고 있다. 한편 삼성전자, LG전자 등 전자업계에서는 스마트 폰에 음성인식기능을 탑재할 계획이다.
○ 실세계에서 음성인식을 이용할 경우에 자연스럽게 사용하기 쉬운 인터페이스가 필요하다. 또한 음성인식의 오류를 간단한 조작으로 정정할 수 있는 시스템의 개발, 대화행위의 해석, 복수 대화자의 음성을 동시에 인식하는 중첩 음성인식, 다 언어 음성인식 등의 연구는 앞으로 계속되어야 할 중요한 과제이다.
- 저자
- Sadaoki FURUI
- 자료유형
- 학술정보
- 원문언어
- 일어
- 기업산업분류
- 정보통신
- 연도
- 2012
- 권(호)
- 95(5)
- 잡지명
- 電子情報通信學會誌
- 과학기술
표준분류 - 정보통신
- 페이지
- 422~426
- 분석자
- 유*로
- 분석물
-
이미지변환중입니다.