첨단기술정보

  1. home
  2. 알림마당
  3. 과학기술정보분석
  4. 첨단기술정보

생명과학 데이터 조합의 발견

전문가 제언

개인 게놈 시대에 들어 생명과학에서 취급하는 데이터는 증가 일로에 있어 각 개인의 게놈, 에피게놈(epigenome), 유전자 발현, 단백질 발현, 대사물 프로파일 등을 비교적 염가로 구할 수 있게 되었다. 이처럼 세포의 빅 데이터는 대량일 뿐만 아니고 다양성을 가진다. 다양한 데이터에서 유용한 규칙을 발견하기 위해서는 데이터 마이닝 기법이 유효하지만, 결과에 관한 통계적 유의성이 보증되지 않는 등 생명과학에 적용하기에는 문제점이 있다.

 

생명과학에서는 다른 종류의 데이터 간의 통합 해석이 주된 작업이므로 그 계산양은 심각한 수준이다. 예를 들면 100SNP, 1만 발현양, 1만 카피 수의 변이 관련을 밝히려면 100조 번의 평가치 계산이 필요하게 된다. 데이터의 증가 자체가 문제가 아니라 다양한 데이터가 일으키는 조합의 폭발이 가장 심각한 문제인 것이다. 따라서 조합효과를 데이터에서 신속하게 발견할 수 있는 기법이 요구되고 있다. 이 글에서는 다중 검정법과 무한차수 다중 검정법에 대하여 소개한다.

 

미국, 영국 등은 생명정보의 생성 및 분석연구가 활발하며 특히 글로벌 기업들은 생명 데이터에 대한 각종 분석 소프트웨어를 상용화하여 시장을 주도하고 있으며 생명정보 분석서비스도 시행하고 있다. 그리고 일본도 생명과학데이터의 분석 알고리즘을 개발하고 이의 소스도 공개하는 등 연구를 활발히 진행하고 있다. 그러나 국내는 기존 분석법에 의한 적용 연구논문은 발표되고 있으나 연구 및 적용 실적은 미흡하며 그 기반도 취약하다고 할 수 있다.

 

향후 생명정보 분석 서비스산업은 빠르게 성장하고 있는 이머징 마켓으로 2007년 이후 매년 25% 고속성장이 예상되는 분야이다. 이의 육성을 위하여 먼저 정부 주도로 분석 통합플랫폼을 구축하고 국내 연구진에 개방하여 분석 소프트웨어를 만들 수 있는 환경을 조성해야 한다. 그리고 정부출연 연구기관과 대학이 협동하여 분석 소프트웨어를 개발하여 관련 기업에 이전할 필요가 있다. 산업체는 선진기업과의 제휴 등을 통하여 기술력을 확보하고 전문 인력을 육성해야 한다.

 

저자
Tsuda Koji, et al.
자료유형
니즈학술정보
원문언어
일어
기업산업분류
정보통신
연도
2014
권(호)
97(5)
잡지명
電子情報通信學會誌
과학기술
표준분류
정보통신
페이지
359~363
분석자
신*래
분석물
담당부서 담당자 연락처
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동