웹에서 온톨로지 속성의 학습 방법
- 전문가 제언
-
○ 온톨로지(ontology)는 시스템 안에 지식을 표현하고 형성화하기 위한 도구이다. 즉 온톨로지는 도메인 안에 있는 개념의 집합과 이들 개념 사이의 관계를 사용하여 지식을 나타낸다. 이것은 그 도메인의 성질에 관하여 추론하는 데 사용되고 도메인을 기술하는 데 사용될 수도 있다. 온톨로지는 도메인 즉, 객체의 형태 또는 존재하는 개념 및 그들이 성질과 관계를 모델화하는 데 사용될 수 있는 공유된 어휘를 제공한다.
○ 그런데 온톨로지를 개발할 때, 속성이나 특징과 같은 클래스(class)의 표현은 좀처럼 고려되지 않는다. 심지어 WordNet조차도 축소된 part-of 관계만을 포함한다. 그러나 이들 데이터는 지식 표현에서 개념을 정의하는 데 매우 중요하다. 어떤 시도들은 일반적인 메로니미(meronymy: 본질어의 일부) 검출 패턴을 사용하여 텍스트로부터 이들 관계를 추출하여 왔다.
○ 온톨로지 학습(learning)은 온톨로지 추출, 온톨로지 생성 및 온톨로지 획득과 같은 일종의 정보 추출 작업이다. 그 목표는 온톨로지를 구성하기 위하여 다른 종류의 데이터 셋 또는 주어진 코퍼스(corpus: 말뭉치)로부터 적절한 개념과 관계를 자동적으로 추출하는 것이다.
○ 이 논문은 개념 속성의 온톨로지 학습에 관한 자동화되고 도메인에 독립인 방법을 제안하고 구현한 것이다. 특히 패턴 기반 데이터를 최소화하기 위하여 데이터의 검색과 정보 분포를 추론하기 위한 온톨로지 학습 코퍼스로서 웹의 사용을 제안하고 도메인에 따라 통계적 방법으로 그 결과를 분석한다. 이 경우 코퍼스는 습득된 지식과 학습 처리량에 따라 적응 방식으로 자동적으로 갱신된다.
○ 온톨로지는 인공지능, Semantic Web, 시스템 공학, 생물공학, 서지과학 등과 같은 세계 또는 세계의 일부에 관한 지식을 표현하기 위하여 사용된다. 특히 일상용어에 대한 온톨로지의 자동 생성, 온톨로지 질의에 대한 언어 생성 및 메로니미에 의한 본질어의 생성과 같은 문제는 이 분야에서 앞으로 계속 추구할 연구 대상이다.
- 저자
- David Sanchez
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2010
- 권(호)
- 69
- 잡지명
- Data & Knowledge Engineering
- 과학기술
표준분류 - 정보통신
- 페이지
- 573~597
- 분석자
- 김*기
- 분석물
-