첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

결정 트리형 분류기의 클러스터링에 의한 분류

전문가 제언

○ 결정 트리는 분류 문제에서 객체를 부류에 배정하는 규칙을 만들고 결과를 쉽게 해석할 수 있게 한다. 그러나 실제로 적용할 경우에는 자료의 변형에 민감하여 명확한 분류 규칙을 만들기가 힘들다. 본 논문에서는 결정 트리를 구성하기 위해서 크러스터 분석 기법을 사용하여 예비 분석을 하는 방법을 제안한다. 이 방법은 특징과 부류 변수간의 통계적인 관계가 아니고 유사성을 찾는 것이 특징이다.

○ 분류 문제에서는 통계적인 기법으로 목적 특징의 값을 구하는 결정 트리가 전통적으로 많이 사용되고 있다. 반면에 크로스터링 방법에서는 목적 특징을 사용하지 않고 자료 세트를 유사성 값을 사용하여 분할한다. 크러스터링의 특징은 결정 트리가 실패하는 경우에도 항상 해답을 준다는 것이다.

○ 분야 정보 검색을 한 결과 가장 상위 분야인 classification은 56,164편의 논문이 있어 큰 분야이고 이 중에서 clustering은 12,263편, decision tree는 15,519편으로 분류 문제에서 크러스터링과 결정 트리가 많이 사용됨울 알 수 있다. decision tree와 clustering이 같이 나오는 져널도 4,254편이나 되어 상세한 분석이 불가능했다.

○ 위의 결과 4,254편을 세분하기 위해서 그 결과를 decision tree와 직접적인 관계가 있는 것으로 제한한 결과 97편의 논문이 검색되었는데 그 중에 4편의 한국인 논문이 있었으나 일반적인 결정 트리를 다루는 것이었다. 다른 접근 방법으로 전의 결과를 preliminary analysis로 축소한 결과 150편의 논문이 검색되고 이중에 8편의 한국인 논문의 주제는 본 논문과 관계가 없었다.

○ 종합적으로 분류, 결정 트리 및 크러스터링에 대한 국내 연구는 있는 것으로 판명되나 본 논문과 같이 보다 정확한 결정 트리를 얻기 위해서 크러스터링을 통한 예비 분석을 하는 분야에 대한 국내 활동은 없다도 생각된다. 또한 논문에도 국내 연구자의 논문이 인용되지는 않았다는 사실이 이를 입증한다고 본다.
저자
Barak Aviad, Gelbard Roy
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2011
권(호)
38(7)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
8220~8228
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동