내 신청현황
종류	모집공고명	진행상태
신청내용이 없습니다.

첨단기술정보

통계모델을 활용한 빅 데이터검색 초고속화

전문가 제언: 빅 데이터(Big data)는 저장·검색·분석이 어려운 방대한 데이터라고 말할 수 있지만, 빅 데이터와 기존 데이터의 차이점은 각 분야나 업계 의견이 다르다고 생각한다. 거대 데이터이기 때문에 요구되는 고속 검색 알고리즘의 설계관점에서 말하면 최근의 빅 데이터 특징은 다음의 두 가지라고 생각한다. ① 데이터 증가량이 무어(Moore)의 법칙을 넘고 있고 ② 보다 복잡한 검색이 요구된다.

빅 데이터의 예로서는 생물의학 분야에서 화제가 되고 있는 차세대 시퀀서(Sequencer) 데이터를 수집한 SRA(Sequence Read Archive) 데이터베이스의 데이터양 추이를 볼 수가 있다. 18개월에 2배라고 하는 데이터양의 증가가 무어의 법칙을 능가하고 있다. 단순한 문자열 검색 등은 이 속도로 데이터가 거대화해도 효율적인 색인구조로 대처할 수 있다. 그러나 검색이 더 복잡해지면, 이러한 색인구조로는 조만간 무어의 법칙을 넘는 데이터 폭발로 실행이 불가능하게 될 것이다.