첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

통계모델을 활용한 빅 데이터검색 초고속화

전문가 제언

빅 데이터(Big data)는 저장·검색·분석이 어려운 방대한 데이터라고 말할 수 있지만, 빅 데이터와 기존 데이터의 차이점은 각 분야나 업계 의견이 다르다고 생각한다. 거대 데이터이기 때문에 요구되는 고속 검색 알고리즘의 설계관점에서 말하면 최근의 빅 데이터 특징은 다음의 두 가지라고 생각한다. ① 데이터 증가량이 무어(Moore)의 법칙을 넘고 있고 ② 보다 복잡한 검색이 요구된다.

 

빅 데이터의 예로서는 생물의학 분야에서 화제가 되고 있는 차세대 시퀀서(Sequencer) 데이터를 수집한 SRA(Sequence Read Archive) 데이터베이스의 데이터양 추이를 볼 수가 있다. 18개월에 2배라고 하는 데이터양의 증가가 무어의 법칙을 능가하고 있다. 단순한 문자열 검색 등은 이 속도로 데이터가 거대화해도 효율적인 색인구조로 대처할 수 있다. 그러나 검색이 더 복잡해지면, 이러한 색인구조로는 조만간 무어의 법칙을 넘는 데이터 폭발로 실행이 불가능하게 될 것이다.

저자
?谷哲朗
자료유형
연구단신
원문언어
일어
기업산업분류
정보통신
연도
2014
권(호)
97(5)
잡지명
電子情報通信學會誌
과학기술
표준분류
정보통신
페이지
384~387
분석자
신*래
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동