데이터베이스 분류를 위한 결정 트리 접근 방법
- 전문가 제언
-
○ 분류 문제는 많은 분야에서 응용되고 있는데, 기본적으로 어떠한 특성에 의해서 묘사되는 객체를 특정된 부류에 속하게 하는 것이다. 데이터베이스를 분류하려면 두 가지 어려운 문제에 봉착하게 된다. 하나는 자료의 차원이 높다는 것이고 다른 문제는 기존 자료의 동적인 변화이다. 기존 데이터베이스를 미리 작은 단위로 분해하여 자료 차원의 문제를 해결하고 작은 단위의 부분 데이터베이스에는 같은 종류의 자료를 포함하고 있어서 분류기가 이들을 처리함에 있어서 정확도가 높아진다.
○ 전통적인 자료 묶음 알고리듬은 계층, 분할, 모델 맞추기 그리고 밀도 기반의 4가지 종류로 구분할 수 있다. 그러나 본 논문에서 제시하는 사건 기반 방법은 판사가 판결을 내릴 때에 판례를 중요시하는 것과 같이 비슷한 처리를 한 사례로서 새로운 문제를 이전에 처리한 유사한 문제와 동일하게 처리하는 새로운 접근 방법이다. 이러한 자료 묶음과 함께 이들을 분류하는 FDT가 본 논문에서 제안하는 내용이다.
○ 연구 분야의 동향 파악을 위해 자료 검색을 한 결과, 데이터베이스 분류에 자료 묶음을 사용한 경우는 수백 편의 논문이 있는 넓은 분야이나 혼성 시스템을 구성하여 분류를 한 경우는 52편의 논문이 있고, 혼성 시스템에서 CBR을 사용한 논문은 18편(이 중에 한국인 논문이 2편), FDT를 사용한 논문은 9편이 있었으나 두 기법을 모두 사용한 혼성 시스템에 관한 논문은 단지 1편이었다.
○ 자료 묶음 분야를 보면 계층 기법을 제외한 분할, 모델 맞추기 및 밀도 분야에는 수백 편의 논문이 있고 계층 기법에 3편, 그리고 CBR에 360편의 논문이 있었다. 결론적으로 논문과 같은 혼성 시스템에 대한 연구는 국내에서 아직 없으나 자료 묶음의 기법으로서의 CBR에 대한 연구는 비교적 활발하여 14편의(약 3.5%) 국내 저자 논문을 발견할 수 있었다. CBR 자체에 대한 논문은 1,742편으로 자료 묶음이라는 전제를 제거하면 CBR에 대한 국내 연구는 다수 있을 것으로 추측된다.
- 저자
- Pei-Chann Chang, Chin-Yuan Fan, Wei-Yuan Dzan
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2010
- 권(호)
- 37(1)
- 잡지명
- Expert Systems with Applications
- 과학기술
표준분류 - 정보통신
- 페이지
- 214~225
- 분석자
- 김*창
- 분석물
-