통계모델을 활용한 빅 데이터검색 초고속화
- 전문가 제언
-
빅 데이터(Big data)는 저장·검색·분석이 어려운 방대한 데이터라고 말할 수 있지만, 빅 데이터와 기존 데이터의 차이점은 각 분야나 업계 의견이 다르다고 생각한다. 거대 데이터이기 때문에 요구되는 고속 검색 알고리즘의 설계관점에서 말하면 최근의 빅 데이터 특징은 다음의 두 가지라고 생각한다. ① 데이터 증가량이 무어(Moore)의 법칙을 넘고 있고 ② 보다 복잡한 검색이 요구된다.
빅 데이터의 예로서는 생물의학 분야에서 화제가 되고 있는 차세대 시퀀서(Sequencer) 데이터를 수집한 SRA(Sequence Read Archive) 데이터베이스의 데이터양 추이를 볼 수가 있다. 18개월에 2배라고 하는 데이터양의 증가가 무어의 법칙을 능가하고 있다. 단순한 문자열 검색 등은 이 속도로 데이터가 거대화해도 효율적인 색인구조로 대처할 수 있다. 그러나 검색이 더 복잡해지면, 이러한 색인구조로는 조만간 무어의 법칙을 넘는 데이터 폭발로 실행이 불가능하게 될 것이다.
- 저자
- ?谷哲朗
- 자료유형
- 연구단신
- 원문언어
- 일어
- 기업산업분류
- 정보통신
- 연도
- 2014
- 권(호)
- 97(5)
- 잡지명
- 電子情報通信學會誌
- 과학기술
표준분류 - 정보통신
- 페이지
- 384~387
- 분석자
- 신*래
- 분석물
-