첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

무일관성 재분류에서 차원 계층구조의 효율적 회복

전문가 제언

데이터 웨어하우스(data warehouse: DW)는 기업의 여러 부분에서 발생하는 데이터를 모두 모아놓은 일종의 데이터 창고이다. 따라서 DW는 그 기업의 메인프레임 서버에 구축되고 기업 전체의 지식 근로자를 위한 분석 보고서를 작성하기 위한 현재와 과거의 이력 데이터까지도 데이터베이스에 저장된다.

 

DW에서의 데이터는 OLAP(OnLine Analytical Processing) 시스템을 이용하여 질의, 데이터마이닝 등의 프로세스를 처리할 수 있도록 계층구조로 된 다층 차원의 스키마로 구성된다. 이 스키마에서 각 차원의 모든 원소는 조상 카테고리에 유일하게 연결되는 엄격성과 모든 원소들이 링크되는 커버링을 갖게 된다.

 

데이터 갱신과 삽입 및 삭제에 따라 차원 안에 있는 원소들이 변경되거나 그래프의 위치가 바뀔 경우 계층구조의 차원 안에 있는 각 원소는 커버링과 엄격성이 회복되도록 재분류되어야 한다. 이 경우 새로운 엄격성 차원을 위한 최소의 재분류 회복(r-repair) 프로세싱이 요구된다.

 

일반적으로 실세계 계층구조 스키마에서 재분류 회복의 문제는 어려운 일(NP-complete)이나 이 논문에서는 재분류 회복을 위한 휴리스틱 기반의 알고리즘을 제안하고 그 효율성을 평가한 것이다.

 

NDSL 자료에 의하면 데이터 웨어하우스에 관련된 국내 연구는 17편의 논문과 3건의 국내 특허가 발표되고 있으며 대부분 특정 분야의 데이터 웨어하우스 구축과 운영 및 프로세스에 관련된다. 이는 이 분야의 관심이 빅데이터와 클라우드 컴퓨팅의 등장의 영향을 받고 있은 탓인 듯하다. 그럼에도 불구하고 기업의 특성상 특수 분야에서 데이터 웨어하우스의 구축과 처리기법의 개발 등은 앞으로도 계속 이어질 것으로 전망된다. 특히 사물인터넷을 비롯한 인터넷상의 빅데이터 등장은 기업의 데이터 웨어하우스 구축과 운영에 많은 해결을 요하는 문제가 등장할 것으로 보인다.

저자
Monica Caniupan, Alejandro Vaisman, Raul Arredondo
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2015
권(호)
95()
잡지명
Data and Knowledge Engineering
과학기술
표준분류
정보통신
페이지
1~22
분석자
김*기
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동