내 신청현황
종류	모집공고명	진행상태
신청내용이 없습니다.

첨단기술정보

home
알림마당
과학기술정보분석
첨단기술정보

대규모 비즈니스데이터에 대한 지식 발견 시스템 - MUSASHI(System for Knowledge Discovery in Large Business Data: MUSASHI)

전문가 제언: □ 컴퓨터의 사용이 보편화되고 정보화 사회가 되면서 각 분야에서 취급하는 데이터양은 급속하게 증가하고 있으며, 과거와는 달리, 이러한 대용량의 데이터로부터 우리가 필요로 하는 정보나 지식을 찾아내는 작업은 점점 더 어렵게 되고 있다. 따라서 최근에는 대용량의 데이터를 고속으로 처리하면서도 그 중에서 의미 있는 지식을 찾아낼 수 있는 데이터 처리 시스템의 필요성이 높아지고 있다.

□ 데이터 웨어하우스나 데이터 마트(Data Mart) 등은 사용자가 원하는 테이블을 미리 만들고 이를 활용하는 개념이지만, 데이터마이닝은 데이터에 숨겨진 새로운 상관관계를 밝혀내고 수치화하기 힘든 데이터 간의 연관도 찾아주는 기법이기 때문에 최근에 각광을 받고 있는 분야이다. 데이터마이닝은 아직 초기단계에 있지만 활용 분야는 광범위하며, 특히 소비자 대상의 기업들은 앞으로 이를 어떻게 활용하느냐에 따라 그 성패가 갈릴 것으로 전망되고 있다. 즉 수많은 서비스나 광고가 스팸 메일이 되지 않으려면 데이터마이닝을 통해 고객의 성향을 정확히 파악해나갈 수밖에 없을 것이다.

□ 여기에 소개되고 있는 MUSASHI는 일본에서 오픈 소스로 개발되고 있는 대용량 비즈니스데이터에 대한 지식 발견 데이터 처리 시스템이며, 데이터의 전처리에 강점이 있고 관계 데이터베이스(RDB)나 데이터 웨어하우스(DW)의 도입 없이 XML로 기술된 대용량의 데이터를 효율적으로 유연하게 처리할 수 있는 구조이고, 표준 PC 1대로 수백～수천만건의 데이터 처리가 가능하다고 한다.

□ 이 자료는 MUSASHI의 구성과 설치방법을 설명하고, 비즈니스데이터로부터 우량 고객의 조기 발견 모델을 구축하는 사례를 보여주고 있다. 기존 데이터를 변환하고 시스템에서의 명령들을 조합하여 스크립트를 작성하며, 결정목(decision tree)에 의해 원하는 모델을 구축하는 모든 과정을 보여주는 구체적인 자료이기 때문에, 우리나라의 기업이나 일반 상점의 관계자들도 시스템을 내려받아 데이터 마케팅에 활용해볼 수 있다.

저자: Yukinobu Hamuro ; Naoki Katoh ; Katsutoshi Yada ; Takashi Washio
자료유형: 학술정보