필터와 랩퍼를 조합한 혼성 특징 선정
- 전문가 제언
-
○ 특징 선정의 두 가지 맥락인 필터와 랩퍼(wrapper)는 각기 다른 장단점을 가지고 있는데 필터는 빠르나 결과가 좋지 않고 반면에 랩퍼는 느리나 성능이 우수하다. 본 논문에서는 랩퍼를 사용하여 필터의 단점을 보강하는 것인데 필터의 결과를 랩퍼에서 정제하는 혼성 시스템을 제안하여 순수한 필터보다는 느리지만 성능이 좋고 랩퍼만 사용하는 것보다는 계산의 복잡성을 줄일 수 있는 장점을 얻었다.
○ 정보 이론의 관점에서는 특징 세트의 정보는 다양한 통계 측정에 의해서 계산되는데 이러한 측정이 필터의 핵심이고 이에 따라서 결과가 결정되는데 특징 세트 생성, 측정 그리고 결과를 한계치에 비교하는 테스트의 세 과정이 있다. 기본적으로 랩퍼는 필터와 같으나 측정 단계가 학습 알고리듬으로 대치된 것이 다른 점이다. 결과는 학습 알고리듬의 편차에 의해서 좌우된다.
○ 분야 정보 검색을 한 결과 가장 상위 분야인 feature selection은 51,294편의 논문이 있어 큰 분야이고 이 중에서 filter는 12,743(본 저널 840)편, wrapper는 1,376(172)편으로 특징 선택에서 필터가 많이 사용됨을 보였고 필터에서는 IG가 F-score를 채택한 경우보다 40% 더 많았다. filter는 논문이 많아서 wrapper에 대해서 본 저널에 실린 논문을 스캔한 결과 13편(약 8%)의 한국인 논문이 있어 특징 선택에 대한 국내 연구는 활발한 편이라고 생각된다.
○ 검색 결과를 보면 외국인과의 공저가 비교적 많았는데 이에 대한 정확한 분석은 하기 어려우나 국제 연구 또는 박사 논문의 가능성을 생각할 수 있다. feature selection에서 hybrid로 분야를 축소하면 11,348 (1,314)편의 많은 논문이 나와 본 논문에서 제시하는 필터와 랩퍼의 혼성 이외에도 다른 가능성이 많음을 알 수 있었다. filter and wrapper를 키로 하면 314(81)편이 나와서 이들을 스캔한 결과 논문의 주제와 같은 의미의 필터와 랩퍼의 혼성임이 확인되었다.
- 저자
- Hui-Huang Hsu, Cheng-Wei Hsieh , Ming-Da Lu
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2011
- 권(호)
- 38(7)
- 잡지명
- Expert Systems with Applications
- 과학기술
표준분류 - 정보통신
- 페이지
- 8144~8150
- 분석자
- 김*창
- 분석물
-
이미지변환중입니다.