첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

필터와 랩퍼를 조합한 혼성 특징 선정

전문가 제언

○ 특징 선정의 두 가지 맥락인 필터와 랩퍼(wrapper)는 각기 다른 장단점을 가지고 있는데 필터는 빠르나 결과가 좋지 않고 반면에 랩퍼는 느리나 성능이 우수하다. 본 논문에서는 랩퍼를 사용하여 필터의 단점을 보강하는 것인데 필터의 결과를 랩퍼에서 정제하는 혼성 시스템을 제안하여 순수한 필터보다는 느리지만 성능이 좋고 랩퍼만 사용하는 것보다는 계산의 복잡성을 줄일 수 있는 장점을 얻었다.

○ 정보 이론의 관점에서는 특징 세트의 정보는 다양한 통계 측정에 의해서 계산되는데 이러한 측정이 필터의 핵심이고 이에 따라서 결과가 결정되는데 특징 세트 생성, 측정 그리고 결과를 한계치에 비교하는 테스트의 세 과정이 있다. 기본적으로 랩퍼는 필터와 같으나 측정 단계가 학습 알고리듬으로 대치된 것이 다른 점이다. 결과는 학습 알고리듬의 편차에 의해서 좌우된다.

○ 분야 정보 검색을 한 결과 가장 상위 분야인 feature selection은 51,294편의 논문이 있어 큰 분야이고 이 중에서 filter는 12,743(본 저널 840)편, wrapper는 1,376(172)편으로 특징 선택에서 필터가 많이 사용됨을 보였고 필터에서는 IG가 F-score를 채택한 경우보다 40% 더 많았다. filter는 논문이 많아서 wrapper에 대해서 본 저널에 실린 논문을 스캔한 결과 13편(약 8%)의 한국인 논문이 있어 특징 선택에 대한 국내 연구는 활발한 편이라고 생각된다.

○ 검색 결과를 보면 외국인과의 공저가 비교적 많았는데 이에 대한 정확한 분석은 하기 어려우나 국제 연구 또는 박사 논문의 가능성을 생각할 수 있다. feature selection에서 hybrid로 분야를 축소하면 11,348 (1,314)편의 많은 논문이 나와 본 논문에서 제시하는 필터와 랩퍼의 혼성 이외에도 다른 가능성이 많음을 알 수 있었다. filter and wrapper를 키로 하면 314(81)편이 나와서 이들을 스캔한 결과 논문의 주제와 같은 의미의 필터와 랩퍼의 혼성임이 확인되었다.
저자
Hui-Huang Hsu, Cheng-Wei Hsieh , Ming-Da Lu
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2011
권(호)
38(7)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
8144~8150
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동