첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

온톨로지 기반 정보 콘텐트의 계산

전문가 제언
○ 하나의 개념에 대한 정보 컨텐트(Information Content: IC)는 개념의 시맨틱을 이해하는 차원인 일반성과 구체성 정도를 계산할 수 있게 한다. 결과적으로 정보 컨텐트는 개념들 사이에 시맨틱 유사성의 자동 평가에 성공적으로 응용되고 있다. 과거의 정보 컨텐트는 코퍼스(corpus)들에 등장하는 개념의 확률로서 계산되어 왔으나 이 방법의 응용성과 확장성은 코퍼스의 의존성과 데이터의 희박성 때문에 제한되고 있다.
○ 개념들 사이에 시맨틱 유사성의 계산은 공유된 정보의 양으로 측정된다. 여기에는 확률적인 방법을 비롯하여 WordNet을 이용한 방법 등이 사용된다. 특히 개념들이 온톨로지로 나타내었을 때는 확률적 방법이 아닌 다른 방식의 시맨틱 유사성 측도가 요구된다. 한편 IC의 계산은 이들 유사성의 측도에 기반하여 계산하게 된다. 최근에는 특정한 개념을 위한 온톨로지 기반으로부터 축출된 분류학적인 특성을 사용하여 IC 기반 측도를 제안하는 학자들도 있다.

○ 이 논문은 IC 계산을 위한 기존의 온톨로지 기반 방법을 분석하고 특정한 개념을 위하여 온톨로지로 모델화된 시맨틱 증거를 더 잘 포획하기 위한 여러 가지 개선된 새로운 방안을 제안한 것이다. 이 방법의 타당성을 위하여 여기서는 시맨틱 유사성을 용용할 때 사용되는 코퍼스 기반 IC 계산과 온톨로지 기반 코퍼스에 관련된 IC 계산 방법들과 비교 분석하고 평가한다.

○ IC의 계산을 위한 시맨틱 유사성을 측정하는 문제는 기계가 얼마나 정확하게 IC를 자동적으로 계산하는가에 달려있다. 이는 컴퓨터 언어론 뿐만 아니라 실제로 시맨틱 웹 상에서 어떤 개념을 참조하는 단어의 시맨틱 일반성과 구체성의 정도를 평가하여 그 의미를 이해하는데 매우 중요하기 때문이다.

○ 이 분야는 단어 의미 명확성, 유의어나 자동 철자 검출 및 교정과 같은 자연어처리 분야와 시소러스 생성, 정보추출, 시맨틱 주석과 온톨로지 삽입과 같은 지식 관리 분야 등에서 응용될 수 있어서 이 분야를 연구하는 학자들에게 많은 참고가 될 것이다.
저자
David Sanchez, Montserrat Batet, David Isern
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2011
권(호)
24
잡지명
Knowledge-Based Systems
과학기술
표준분류
정보통신
페이지
297~303
분석자
김*기
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동