심층 구문구조를 사용한 특허청구 텍스트에서 동사 내용관계의 도출
- 전문가 제언
-
○ 텍스트모음(corpus)으로부터 내용관계의 추출에 관한 연구는 자연어 처리에서 높은 우선순위를 가진 주제이다. 이것은 내용관계의 형태가 온톨로지의 기반을 형성하고 온톨로지들이 지식 기반 애플리케이션에서 그 사용이 점차 증가하고 있기 때문에 그리 놀라운 일이 아니다.
○ 지금까지 대부분의 연구는 특히 IS-A, HAS-PART, CAUSE와 같은 제한된 수의 독특한 동사 내용 관계의 검출에 초점을 두고 있다. 따라서 보다 복잡한 함수적인 문장에서 내용표현을 이해하기 쉽게 제공하고 사전에 제한 없이 많은 수의 내용관계를 도출할 방법이 필요하다.
○ 더욱이 특허청구문과 같은 문장은 일반이 이해하기가 쉽지 않고 내용관계가 복잡하므로 여기에서 동사 내용관계를 도출하기란 쉽지 않다. 이를 위하여서는 문장 구문구조에서 모든 내용관계를 포함하는 심층 구문 의존 구조를 이용하는 것이 바람직하다. 구문구조에서 심층 구조란 실제로 발현되는 문장의 구조인 표면구조에 대하여 표면구조에는 나타나지 않는 기저 구조를 말한다. 말하자면, 심층구조에 변형이 적용되어 문장의 표면구조가 만들어지는 것이다.
○ 이 논문에서는 특허청구 텍스트모음의 내용관계를 도출할 심층 구문구조를 검색하기위하여 특허청구 텍스트모음을 해부(parse)하고 여기서 내용관계를 도출하며 도출된 내용관계를 의미상의 기준에 따라 클러스터링하고 마지막으로 각 클러스터에 라벨을 부쳐 일반화된 관계에 알맞은 명칭을 확인하는 방안을 제안한다.
○ 내용관계 추출에 관련된 연구에 필요한 언어 정보로는 어휘적 구문 패턴, 순수한 구문 패턴 및 관계가 표현되는 단어들의 동시 발생 등이 있다. 이 분야는 온톨로지와 인공지능에서 동사, 명사 형용사와 같은 품사의 시맨틱 관계를 표현하기 위하여 사용되는 영역에 속한다. 따라서 영어 언어학과 밀접한 관계가 있다. 이 연구는 특히 빅 데이터로부터 시맨틱 온톨로지를 구축하는 기술을 연구하는 컴퓨터 연구자들에게 참고할 만한 내용이다
- 저자
- Gabriela Ferraro, Leo Wanner
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2011
- 권(호)
- 24
- 잡지명
- Knowledge-Based Systems
- 과학기술
표준분류 - 정보통신
- 페이지
- 1233~1244
- 분석자
- 김*기
- 분석물
-
이미지변환중입니다.