첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

분류기 평가를 위한 참신한 측도

전문가 제언
○ 분류 과정에서 분류기의 성능 평가는 중요한 단계로서 척도가 필요한데 정확도가 오래 동안 사용되었다. 그러나 정확도는 분류기 간의 미세한 차이를 파악하지 못한다. 이러한 문제를 해결하기 위해서 RCI (Relative Classifier Information)가 제안되어 사용되었다. 본 논문에서는 다중 분류 문제에서 사용할 수 있는 새로운 척도인 혼란 엔트로피(CEN, Confusion ENtropy)를 제안한다.

○ 분류기의 결과는 혼란 행렬의 형태로 표시된다. 행렬의 행 i를 보면 그 열의 요소는 올바른 부류 i를 다른 부류로 분류한 것을, 열 j는 j로 분류된 부류의 수를 표시한다. 이와 같이 비대각선 요소는 잘못 분류된 자료의 수, 그러나 대각선 요소는 바로 분류된 정보를 표시한다. 이들을 사용하면 오분류 확률을 구할 수 있는데 이는 어떠한 부류를 전제로 하여 계산한다.

○ 이 논문에서는 CEN이 일부 자료에 대해서 정확도나 RCI보다 우수함을 보였을 뿐만 아니라 모든 자료에 대해서도 같은 결과임을 보이가 위해서 이론적 분석과 통계적 결과를 통해서 증명했다. 일반적으로 이러한 형태의 논문에서는 공적 자료를 사용한 검증이 제안의 타당성을 입증하는 보편적인 방법인데 이에 더해서 이론적인 분석과 통계적 결과를 사용한 것이 본 논문의 특이한 점이다.

○ classifier는 28,208(1,321) 큰 분야 이고 이 안에서 comparison 또한 활발한 연구 제목으로 10,442(1,074)이다. accuracy와 measure는 일반적인 용어이기 때문에 새로운 정보를 제공하지 못한다. RCI는 570(11)인데 본 저널의 11편의 논문 중에 한국인의 이름은 볼 수 없었다. confusion matrix는 5,709(263)이고 confusion entropy 973(74)인데 이 저널에 실린 74편의 논문 중에 classifier와 관련된 것은 58편인데 한국인의 논문이 1편 있었고 응용 분야는 기계 번역이었다. 따라서 논문의 내용과는 상이하다. 참고로 classifier에서 Kim씨 저자를 찾은 결과 286(42)로서 전체적인 참여도는 더 조사를 요하나 classifier 수준에서는 상당한 국내 연구가 있을 것으로 짐작된다. IT 분야 중에 ( )는 본 저널 출현도.
저자
Jin-Mao Wei , Xiao-Jie Yuan , Qing-Hua Hu, Shu-Qin Wang
자료유형
학술정보
원문언어
영어
기업산업분류
정보통신
연도
2010
권(호)
37(5)
잡지명
Expert Systems with Applications
과학기술
표준분류
정보통신
페이지
3799~3809
분석자
김*창
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동