문장을 애매한 슈퍼비전 논리 형태로 매핑하기 위한 세미슈퍼비전 학습 모델
- 전문가 제언
-
○ 의미구문분석(Semantic Parsing) 처리는 자연어(NL) 문장을 컴퓨터가 실행할 수 있는 완벽하고 형식적인 의미표현(MR)으로 매핑하는 작업이다. 의미표현은 문장을 문맥자유문법으로 정의하는 비형식언어로 나타내는 것이다. 형식 언어의 질의나 명령어를 비형식언어로 전환하는 능력은 로봇과 같은 실제 프로그램에서 사용자 친화적 인터페이스 개발에 매우 중요하다. 의미구문분석을 위한 학습은 대응하는 MR과 한 쌍으로 된 NL 문장의 훈련 코퍼스(Corpus)로 주어진다.
○ 애매한 훈련 코퍼스에 있는 문장의 의미구문분석 처리 결과는 이에 대응하는 여러 개의 의미표현을 얻을 수 있으나 대응하는 의미표현은 오직 한 개가 필요하다. 이 문제를 해결하기 위하여 정렬과 훈련의 결합 과정이 요구된다. 이 논문에서는 최대 엔트로피 모델과 지원 벡터기계와 같은 학습 모델에 워드 클러스터를 통합한 애매한 슈퍼비전을 가진 세미 슈퍼비전 의미구문분석으로 문장의 의미표현을 해결한다.
○ 자연어 자체가 애매한 의미를 내포함으로 의미구문분석을 통하여 한 문장과 그에 상응하는 의미표현을 얻는 문제는 쉬운 일이 아니다. 이전부터 많은 연구자가 이의 해결을 위하여 도전하고 있다. 더욱이 로봇에게 인간의 언어로 된 문장을 전달하여 컴퓨터로 실행 가능한 의미표현으로 바꾸는 문제는 인공지능 연구와 더불어 관심 영역이다.
○ Semantic Parsing에 대한 검색 결과는 전 세계적으로 논문이 758건, 특허가 221건으로 이론적인 연구보다 실용적 응용이 강하게 나타나고 있으며 국내 연구는 48건에 불과하고 그나마 2013년 이전의 논문이 대부분을 차지하고 있어 저조한 편이다(NDSL 자료). 자연어 처리에 속하는 이 분야는 인공지능 분야와 더불어 로봇 분야에 널리 활용될 것으로 보인다. 컴퓨터 과학의 특성상 자연어처리 연구가 대부분 영어에 국한되어 있어 자연어에 하나로 한글을 적용하기에는 무리가 있을 수 있다. 그러나 한글에 대한 구문분석과 의미표현에 관련된 알고리즘 개발도 도전할만한 과제이다.
- 저자
- Minh Le Nguyen , Akira Shimazu
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2014
- 권(호)
- 90()
- 잡지명
- Data & Knowledge Engineering
- 과학기술
표준분류 - 정보통신
- 페이지
- 1~12
- 분석자
- 김*기
- 분석물
-