확장 가능한 국부적 밀도 기반의 분산 클러스터링
- 전문가 제언
-
○ 전통적인 클러스터링에서는 모든 자료가 한곳에 있는 반면 이동 네트워크와 같이 여러 다른 지역에서 쉬지 않고 자료를 수집하는 경우, 정보 보호와 제한된 회선 문제로 다량의 자료를 중앙 사이트로 전송하는 것이 불가능해서 분산 클러스터링 기법이 필요하다. DBDC와 SDBDC는 비대칭적인 자료 분산에 대해서 좋은 결과를 주지만 높은 차원의 클러스터링에는 적합하지 않다.
○ 이 논문에서는 SLDBDC(Scalable Local DBDC) 알고리듬을 소개하는데, 이는 기존의 LDBDC에 기반을 두고 있으나 이 알고리듬의 약점을 보강하여 고차원의 공간 자료의 클러스터링 품질을 높이고 전송 비용을 낮게 한다. SLDBDC에서는 각 사이트에서 독립적으로 국부 자료를 처리하고 가장 좋은 결과를 중앙 사이트로 보내서 전체 결과를 만들고 이를 다시 각 사이트로 보내서 국부 클러스터링을 조절한다.
○ ScienceDirect에서 최상위 개념인 distributed clustering을 검색하면 11,169편의 논문이 있어 상당히 큰 분야이고, 다시 density-based로 축약하여 보아도 4,378편의 논문이 있어 density-based 방법이 많이 사용되고 있음을 알 수 있다. local이라는 제약을 가해도 편수는 3,104로서 그리 줄지 않는데, 분산 시스템에는 main site와 local site가 있기 때문이라고 생각된다.
○ 이 중에 본 논문이 나온 Expert System with Applications에 실린 140편 가운데 한국인 저자 논문이 10편으로 8%를 차지하고 있어서 상대적으로 활발한 분야라고 생각되나 상당히 응용적인 논문이 대부분이어서 본 논문에서 인용된 것은 없다. 다시 scalable이라는 제약을 가하면 570여 편의 논문이 있으나 이들이 많은 저널에 골고루 분산되어 있어서 이 분야가 다양하게 연구된다는 사실 이외에 다른 의미 있는 결론은 내릴 수 없었다.
- 저자
- Liu Yan-bing, Liu Zhang-xiong
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2011
- 권(호)
- 38(8)
- 잡지명
- Expert Systems with Applications
- 과학기술
표준분류 - 정보통신
- 페이지
- 9491~9498
- 분석자
- 김*창
- 분석물
-
이미지변환중입니다.