첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

워드넷을 사용하는 빅 데이터 객체 상관관계를 추론하는 알고리즘

전문가 제언

 

빅 데이터 값은 여러 소스에서 수집된 데이터의 다양성에서 기인한다. 중요한 빅 데이터 도전의 하나는 여러 데이터 소스을 통하여 같은 지역 개체에 관련이 있거나 그것을 나타내는 데이터를 식별하는 것이다. 이 도전은 전통적으로 스키마 매칭으로 알려져 있다. 데이터 매칭에 접근하는 빅 데이터 속도는 사용하지 않는다. 이 문헌은 데이터 객체 상관관계를 조사하는 방법을 제시하고 객체 메타데이터에 관련하고 워드넷 시소러스(Word Net thesaurus)로 살피는 알고리즘을 제안한다.

 

DB 객체 상호관계를 추론하는 제안하는 방법은 스키마 요소 이름과 데이터 형태와 같은 스키마 메타데이터에 기반 하는 유사함수를 사용한다. 스키마 객체간의 잠재적 의미론적 유사성을 발견하기 위하여 워드넷 시소러스를 사용한다. 스키마 인스턴스에서 의미를 발견하기 위하여 유시함수의 확장과 값의 분포, 용어 빈도 그리고 평균과 같은 종합 인스탄스 정보를 사용함으로 유사의미를 갖는 속성의 식별을 지원하는 함수에 관한 연구는 향후연구로 계획한다.

 

빅 데이터에 관한 연구는 인공지능 연구와 함께 도래한 제4차 산업혁명의 핵심 연구과제로 부상하고 있다. 특히 지난 알파 고포켓몬 고사건이후에 빅 데이터, 인공지능 그리고 가상현실의 융합 연구가 뜨거운 감자가 되고 있다. ‘알파고인공학습 바둑이지 전통적인 바둑이 아니고 포켓몬 고는 빅 데이터의 데이터 공개 문제로 야기된 게임이다. 이 문헌은 빅 데이터의 객체의 복잡한 상관관계를 배열로 함수화하여 동치관계를 이용하여 알고리즘으로 계측하여 [0, 1] 간의 수 값으로 비교하는 새로운 방법을 제시한 문헌이다.

 

이 문건에 제시된 방법은 빅 데이터의 객체간의 상관관계를 수치화함으로 빅 데이터의 기계학습의 한 아이디어를 제공하는 단초가 될 것으로 사료되어 빅 데이터 기본연구에 중요한 연구의 바탕이 될 수 있을 것이다. 우리나라의 열성 연구자와 기술자는 반드시 살펴봐야 할 문건이라 하겠다.

 

 

저자
M. Basel Almourad, et al.
자료유형
니즈학술정보
원문언어
영어
기업산업분류
정보통신
연도
2016
권(호)
83()
잡지명
Procedia Computer Science
과학기술
표준분류
정보통신
페이지
1238~1243
분석자
김*진
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동