자료 수열 분할을 위한 클러스터링 시스템
- 전문가 제언
-
○ 기업에서 의사 결정을 하기 위해서 많은 양의 자료를 처리해야 한다. 일반적으로 자료의 정보는 자료 수열의 형태를 가지고 있는데 대표적인 예로는 재무 비율을 생각할 수 있다. 그러나 같은 형태를 가진 비율의 중복 처리를 피하기 위해서 크러스터링을 하고 같은 크러스터에 있는 자료는 유사한 특성을 가지고 있다.
○ 본 논문에서 제안하는 것은 퍼지 2진 관계에 구축된 크러스터링 방법인데 이는 두 개의 다른 자료 수열 간의 차이를 표시한다. 이에 더해서 최대-최소 transitive closure 를 적용하여 퍼지 호환 관계를 등가 관계로 이전한다.
○ 본 논문에서 제안한 크러스터링은 쉽고 빠르게 진행된다. 더욱이 분할 결과를 평가하기 위해서 k-평균의 결과와 비교한 결과 유사한 수준에 있었다. 따라서 시스템은 k-평균 시스템의 장점은 가지나 k-평균 시스템의 약점은 대부분 제거할 수 있음을 의미한다. 또한 이 시스템에 약간의 수정을 가하면 다양한 조건을 가진 응용에 적용될 수 있다.
○ data sequence 문제는 여러 분야에서 발생하는데 이를 IT 저널에서 검색하면 총 76,850(본 저널 2,081)로 주로 신경망, 신호 처리, 인공 지능, 전문가 시스템, 형태 인식, OR, 정보 시스템 및 결정 지원 등 컴퓨터 과학의 거의 모든 분야에서 발생한다. data sequence에서 partitioning 문제는 전체 논문의 1/10을 차지하여 논문의 편수는 8,605(219)이다. 분할 문제에서 clustering을 사용하는 것은 2,135(121)로서 상당히 활발한 분야이다. 논문에 인용된 국내 과학자 논문이 없어서 본 저널에 나온 121편을 조사한 결과 6편의 한국인 논문이 있었으나 주제인 cluster와 관련된 것은 1편에 지나지 않고 나머지는 text 또는 data mining에 관한 것이었다. 나머지 논문의 자세한 내용은 알 수 없으나 data sequence의 partition과는 관계가 있을 것이다. 그러나 분야 자체가 방대하여 이 수준에서의 조사는 불가능하나 본 논문과 유사한 clustering을 사용한 data sequence partition에 관한 국내 연구는 미미한 단계라고 생각할 수 있다.
- 저자
- Yu-Jie Wang
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2011
- 권(호)
- 38(1)
- 잡지명
- Expert Systems with Applications
- 과학기술
표준분류 - 정보통신
- 페이지
- 659~666
- 분석자
- 김*창
- 분석물
-
이미지변환중입니다.