메타학습을 기반으로 한 능동적 마이닝
- 전문가 제언
-
○ 지식발견 프로세스는 사전 처리, 마이닝, 사후 처리의 세 가지 서브 프로세스로 이루어져 있다. 지식발견기술의 적용현장에서는 서브 프로세스와 지식발견 프로세스 전체 단계에서 다양한 시행착오를 겪고 있어, 이에 따른 금전적 손실도 크다. 능동적 마이닝은 데이터 마이닝 개발 프로세스에 사용자의 의도를 반영하거나, 프로세스를 자동화시킴으로써 지식발견을 보다 효율적으로 처리하기 위해서, 데이터 사전 처리, 마이닝과 결과의 사후처리에 관련된 평가기준을 축적하여, 이러한 프리미티브(Primitive)의 효과적인 조합을 학습하는 구조이다.
○ 여기서 제안한 구성적 메타학습은 마이닝 애플리케이션을 반자동화한 시스템으로, 데이터 사전처리에 있어서는 속성선택 Method Repository를 체계화하여, 이전의 속성 선택법보다 정밀도가 높아지는 것을 확인하였다. 또한 마이닝 Repository를 체계화하여 Stacking 보다도 정밀도가 높아지는 것을 확인할 수 있었다. 결과의 사전처리에 있어서는 객관적 평가 지표를 Repository화 하고, 이러한 평가치를 조합함으로써, 단일 평가 지표를 사용하는 경우보다 높은 정밀도를 얻을 수 있었다. 그리고 이를 통합한 시스템을 개발하여, 만성간염 데이터 세트에 적용시켜, 어떤 조건하에서 GPT가 약 3년 주기로 변동한다는 규칙을 얻을 수 있었다. 향후에는, 구성적 메타 프로세스를 통합하여, 보다 많은 사례연구를 통해, 그 유효성을 검증해 가는 것이 과제로서 남아있다.
○ 국내에서도 데이터 마이닝에 관한 연구가 대학과 연구소를 중심으로 활발하게 진행되고 있으며, 최근 일부 기업에서는 인터넷을 통한 고객정보의 비중이 증가함에 따라 웹 환경의 데이터 처리를 지원할 수 있는 기능이 보강된 데이터 마이닝 솔루션을 출시하였다. 이 제품은 데이터 마이닝 전 프로세서의 생산성을 높여 주고 비용을 효과적으로 줄여주는 기능을 제공하며, 간단한 분석 프로세서와 깊이 있는 통찰력을 제공하기 때문에 다양한 산업분야에서 활용이 가능하다.
- 저자
- Hidenao Abe ; Miho Ohsaki ; Takahira Yamaguchi
- 자료유형
- 학술정보
- 원문언어
- 일어
- 기업산업분류
- 과학기술일반
- 연도
- 2005
- 권(호)
- 20(2)
- 잡지명
- 인공지능학회지(N316)
- 과학기술
표준분류 - 과학기술일반
- 페이지
- 180~187
- 분석자
- 양*승
- 분석물
-
이미지변환중입니다.