첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

정보 폭발 시대의 고차원 데이터 마이닝

전문가 제언
○ 최근 스마트-폰, CCTV, RFID, 센서 등 새로운 IT환경은 사람, 사물, 환경의 스마트화를 가속시키고 있고, 데이터 생성/소비에도 큰 변화를 가져오고 있다. 실생활에서의 상황정보가 바로 디지털화 되고 있음에 따라 최신 데이터기반의 서비스 요구도 증가하고 있다. 특히 온라인 비디오, 디지털사진 서비스, 이메일, 소셜 네트워킹 서비스 등을 통해 개인들도 많은 양의 정보를 생산/소비하여 데이터 폭증의 원인이 된다.

○ 정보 분석기술은 앞으로 5~10년 이내에 웹 콘텐츠 분석, 음성 데이터 마이닝, 대화분석 등이 주요 기술이 될 것으로 예측되고 있다. 텍스트, 영상, 음성, 동영상 등 콘텐츠 자체 분석을 위해서는 많은 양의 컴퓨팅이 필요하다. 따라서 분산병렬처리에 대한 요구도 증대할 것으로 보인다. 또 메모리기반 분석에 대한 요구의 증대는 그만큼 빠른 분석의 필요성도 커진다.

○ 인터넷 서비스에서는 특화된 데이터 저장관리 시스템이 필요하며, 주요 고려사항은 ①데이터/사용자 증가에 따른 확장성, ②서비스 중단 최소화를 위한 고가용성, ③인터넷 서비스에서 요구하는 기능/성능에 적합한 데이터 관리기능 등이다. 구글의 Bigtable, 아마존의 Dynamo, 야후의 PNUTS 등 글로벌 인터넷 서비스 업체에서는 자체적으로 데이터 저장관리 시스템을 개발, 활용하고 있다.

○ ETRI에서는 2010년부터 iFlow를 개발하고 있다. 분산스트림 처리 시스템으로 클러스터 시스템을 기반으로 폭증하는 데이터 스트림을 실시간 처리하는 환경을 지원한다. 정형/비정형 데이터의 통합 분석이 요구하는 미래 서비스를 위해 유연한 서비스 정의, 선택적 데이터 복구지원, 데이터의 분할병렬 처리, load shedding 등 데이터 폭증에 대한 동적 대처, 서비스 간 태스크 공유, 태스크 단위의 분배기능 등을 제공한다. 활용분야는 웹 정보검색, 지능형 영상감시, 웹 로그 분석, 금융거래 정보 분석 등이다. 앞으로의 연구 결과와 활용이 기대된다.
저자
Takashi WASHIO
자료유형
학술정보
원문언어
일어
기업산업분류
정보통신
연도
2011
권(호)
94(8)
잡지명
電子情報通信學會誌
과학기술
표준분류
정보통신
페이지
679~683
분석자
김*우
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동