DENCLUE-IM: 빅 데이터 클러스터링을 위한 새로운 접근
- 전문가 제언
-
○ 매일 다중소스, SNS, 모바일 기기 등은 대용량의 데이터를 생성하고 있다. 이 데이터 소스의 다양성은 아주 빈번히 이종의 데이터를 생산한다. 이와 같은 복잡한 데이터를 사용하고 조사하는데 보다 효용적으로 하는 기술의 하나가 클러스터링이다. 성과와 응답시간 간을 절충하는 발견은 이 가공할 데이터를 분류하는 주요한 도전이 된다. 이것을 해결하기 위하여 DENCLUE-IM이라고 하는 개선된 DENCLUE (DENsity- based CLUstEring)버전인 효과적인 알고리즘을 제안한다. 이 연구의 배후 아이디어는 언덕 오르기 계단인 DENCLUE에서 결정적 단계를 피하여 속도계산을 하는 것이다. 대형 데이터 셋을 사용하는 실행의 결과로 제안하는 알고리즘의 효율성을 입증한다.
○ 최근의 빅 데이터 분야의 최대 도전의 하나는 타당한 시간 내에 방대한 양의 정보를 처리하는 인간의 무능이라 하였다. 최근에 ‘알파고’와 이세돌의 바둑 대국에서 인간이 패함으로써 빅 데이터를 기반으로 하는 기계학습의 놀라운 상황이 세상을 떠들썩하게 한 바 있다. ‘알파고’와의 대결은 이길 수 없는, 해서는 안 되는 게임이었다. 병렬로 연결된 슈퍼컴퓨터는 이세돌 뿐만 아니라 세상에 있는 거의 모든 기보를 학습하여 인지하고 있었을 것이다. 이 사실이 우리를 두렵게 하고 빅 데이터 처리의 중요성을 깊이 각인하였다.
○ 최근 새로운 가치를 창출하는 빅 데이터 관련 연구가 전 세계적 이슈로 부상했다. 미국을 위시한 ICT 주요 선진국은 한편으로는 공공정보이용을 촉진하거나 직접 빅 데이터 기술개발을 지원하는 방식으로 민간부분을 지원하고, 다른 한편으로 개인 정보보호, 인프라구축 지원 등 제도적 기반을 개선하는 방식으로 진흥정책을 추진하고 있다.
○ 국내에서도 유사한 빅 데이터 진흥정책이 추진되고 있으나 상대적으로 공공정보 개방 등 정부주도의 역할이 중심으로 구성되어 있다. 향후 국내 빅 데이터 관련 시장 활성화를 위해서는 이러한 공공부문의 시장형성 노력과 함께 민간부문 참여를 유인할 수 있도록 빅 데이터 환경에 맞는 정보 활용에 대한 인식제고, 기준정립, 연관 인프라 등 제도적 기반에 대한 논의가 병행되어야 할 것이다.
- 저자
- Hajar REHIOUI et al
- 자료유형
- 니즈학술정보
- 원문언어
- 영어
- 기업산업분류
- 정보통신
- 연도
- 2016
- 권(호)
- 83()
- 잡지명
- Procedia Computer Science
- 과학기술
표준분류 - 정보통신
- 페이지
- 560~567
- 분석자
- 김*진
- 분석물
-