전체 게놈 발현 데이터의 재활용
- 전문가 제언
-
○ 지난 십 년 동안 유전자발현에 대한 이해는 대단한 진전을 가져왔는데 이는 주로 마이크로어레이, 차세대 시퀀스 기술의 발달로 대용량으로 처리할 수가 있어 유전체의 전체에 대한 발현데이터를 수집해서 공공의 기록으로 보관하게 된 것이다. 그리고 이 데이터의 분석과 주석을 달아 추가적인 가치를 부과하고 생물학자 누구나 이를 이용할 수 있게 됐다.
○ 이 리뷰이서는 공중의 도메인으로 보관된 유전자발현 데이터를 연구자들이 어떻게 이용할 것인지에 대해서 논의하고 있다. 이러한 데이터를 재활용하는 것은 중요한 일이면서도 데이터를 준비하는 과정이나 분석 그리고 기존의 데이터와 새로운 데이터의 통합하여 결과를 해석하는 일이 쉽지만은 않다.
○ 이 논문의 저자들은 차세대 시퀀스 데이터세트를 재활용할 수 있게 하는 최소한의 정보를 갖추기 위한 시퀀스실험에 있어 여섯 가지를 추천한다. (1) 연구의 개관(논문에 대해 접촉할 수 있는 정보 포함), (2) 연구 설계(표본과 데이터 파일, 실험 변수), (3) 표본정보(생물재료와 실험조건), (4) 표본처리에 대한 프로토콜(라이브러리 준비, 시퀀싱, 데이터처리), (5) 원 시퀀스를 읽은 데이터(질적인 수치), (6) 분석해서 연구에 결론을 얻은 가공한 데이터(도표와 결론에 상응하는 인용논문)를 아카이브에 제출하도록 권한다.
○ 여러 데이터를 통합하여 가공해서 가치 있는 데이터로 만들어 유지하면서 쉽게 접근하고 검색할 수 있게 하는 것도 그리고 업데이트하는 일도 상당한 재원이 필요하다. 데이터 소스가 복잡해질수록 기관이나 재원을 마련해 데이터를 장기적으로 유지하기란 쉽지가 않다. 다행히 유럽의 ELIXIR 프로젝트와 같은 생물정보학 인프라에 장기적인 지원의 노력으로 이러한 재원이 지속될 수 있는 것이 표본이 되고 있다. 국내에서도 시퀀스 데이터는 계속 축적되고 있어 장기적으로 유지하고 재활용하는 문제를 체계적으로 고려할 때가 아닌가 생각한다.
- 저자
- Johan Rung and Alvis Brazma
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 바이오
- 연도
- 2012
- 권(호)
- 14(2)
- 잡지명
- Nature Reviews Genetics
- 과학기술
표준분류 - 바이오
- 페이지
- 1~11
- 분석자
- 강*원
- 분석물
-
이미지변환중입니다.