스키마 매칭에서 의미론 : 조사 연구
- 전문가 제언
-
○ 기업은 사업상의 팽창과 새로운 이윤 도출을 위하여 기존의 데이터베이스를 갱신하거나 기업 간의 원활한 거래 처리를 위하여 타 업체의 데이터베이스 안에 있는 데이터와의 통합을 필요로 할 때가 있다. 이 경우, 데이터 통합을 위하여서는 데이터 간의 매칭 활동이 필요하고 데이터베이스 통합을 위하여서는 데이터베이스의 스키마 매칭이 필요하게 된다.
○ 스키마 매칭은 데이터베이스 통합에서 중요한 단계이다. 데이터베이스 에서 매칭에 사용되는 데이터는 이름, 설명, 데이터 형, 관계 형, 제약, 및 스키마 구조 등과 같은 스키마 요소이고 객체의 속성과 같은 아톰(atom) 요소 또는 구조적 수준에서 이들 성질들도 두 스키마의 매칭을 확인하는 데 사용된다.
○ 언어 기반 매칭에서는 이름이나 텍스트(text)를 사용하여 의미상으로 유사한 스키마 요소들을 발견한다. 제약 기반 매칭에서는 스키마에 포함된 제약을 탐구한다. 이들 제약은 데이터 형과 값의 범위, 유일성, 선택적 관계 형 및 크기 등을 정의하는 데 사용된다. 두 입력 스키마에서 제약은 스키마 요소의 유사성을 결정하기 위하여 매칭된다.
○ Evermann은 이 연구에서 데이터베이스 요소의 인지된 유사성에 관한 7가지 요인의 효과를 비교하는 5가지 의미이론에 기초한 실험연구를 수행하고 스키마 매칭 연구의 문제점에 대하여 논의하고 있다.
○ 오늘날 스키마 매칭 문제는 전자상거래, 데이터 통합, 웨어하우징 및 시맨틱(semantic) 웹 등에서 핵심 문제로 등장하고 있고 특히 인공지능 분야와 데이터베이스 및 지식표현 분야에서 활발히 연구되고 있다.
○ 두 데이터베이스의 스키마 요소가 매칭될 때, 어떤 이유와 의미를 가지고 매칭될 수 있는가의 기준이 필요하다. 이런 관점에서 이 연구는 어떻게 의미가 데이터베이스 요소에 할당되고 결과적으로 어떻게 의미의 유사성이 수립되는가를 규정짓는 연구로서 참고할 만한 내용이다.
- 저자
- Joerg Evermann
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2009
- 권(호)
- 34
- 잡지명
- Information Systems
- 과학기술
표준분류 - 정보통신
- 페이지
- 28~44
- 분석자
- 김*기
- 분석물
-