첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

데이터 마이닝에서 결정 규칙 기반의 특징 선정

전문가 제언
○ 분류 문제에서 특징 선정은 주어진 문제와 연관성이 가장 높은 특징의 부분집합을 찾아내는 것이다. 특징 선정은 대분하여 필터와 래퍼(wrapper)로 분류되는데, 필터 방법에서는 미리 정해진 분류 알고리듬과는 무관한 척도를 사용하여 부분 집합을 평가한다. 반면에 래퍼(wrapper) 방법에서는 평가하려는 부분집합을 채택된 분류 알고리듬에 포함시켜서 평가한다.

○ 논문에서는 필터를 사용하는데 필터는 세분하여 등급 방법과 검색 방법으로 구분된다. 등급 방법은 통계 기법 등의 알고리듬을 적용하여 단순히 상위 k 특징을 선정하는 것이고, 검색 기법에서는 체험적인 검색 기법을 사용하여 연관성이 높은 특징의 부분 집합을 찾아낸다. 연관성 기반의 특징 선정은 자주 사용되는 기법이며 CFS는 이 접근 방법의 대표적인 예이다.

○ 연관성 기반의 특징 선정에서 가장 어려운 점은 특징 연관성에 대한 공인 기준이 없다는 것이다. 따라서 기준의 정의에 따라서 여러 가지 기법이 파생되는데, 이 논문에서는 분류-특징과 특징-특징 연관성의 유일한 조합을 통해서 연관성의 종류를 확장하고 체험적인 검색 방법을 적용하여 분야 전문 지식을 융합하고 성능을 향상했다.

○ 국내 동향을 보면 필터 연구의 등급 방법에 적용되는 통계 기법 및 이들의 성능 향상에 대한 연구는 진행되고 있으나 검색 기법에서 연관성 기반의 문제나 체험적 검색을 가미한 이의 성능 개선에 대한 연구는 이 논문에서 인용되지 않고 있다. 일반적으로 저널 형태의 논문에서는 새로운 아이디어를 내기 때문에 전 단계 혹은 구성 요소에 대한 부분적인 인용만 있는 것이 통례이기 때문이다.

○ 이 논문의 특성은 규칙 기반의 특징 선정에 의해서 응용 영역의 구체적인 특성을 특징 선정 과정에 연계시킬 수 있다는 것이다. 특징 부분 집합을 찾는 과정에서 결정 규칙 기반의 알고리듬을 적용하면 수학적인 함수를 사용하는 경우보다 좋은 결과를 얻는다. 이에 따라서 분류 예측의 정확도를 높일 수 있다.
저자
Patricia E.N. Lutu, Andries P. Engelbrecht
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2010
권(호)
37(1)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
602~609
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동