RNA-Seq : 정보전달자의 노출
- 전문가 제언
-
○ 전형적인 RNA Seq실험은 RNA Seq 라이브러리를 만들기위해 cDNA로 전환되는 mRNA로부터 시작된다.라이브러리에 있는 수백만개의 DNA조각의 염기서열을 차세대염기서열결정방법(NGS)으로 결정하여 비교적 풍부한 각각의 전사물(transcripts)과 splice variants를 정확하게 측정할 수 있다.최근에는 광범위한 생물정보학 프로그램이 개발되어 차세대염기서열결정에 의한 산물을 유전자발현 수준에 관한 정보로 번역하는데 필요한 개별단계를 처리할 수 있게 되었다.
○ 가닥(strand)특이 reads를 만들어내는 대체(alternative)라이브러리 조제 프로토콜이 개발되었는데 이것은 sense 와 antisense RNA간의 구별이 용이하다.차세대염기서열분석 이전에는 각 라이브러리의 cDNA조각에 여섯염기짜리 독특한 지표(indices)를 종종 붙였다.이것은 reads로 정확한 샘플을 역추적할 수 있기때문에 같은 반응에서 다수의 샘플의 분석을 가능하게 해주고 있다.
○ 벼(rice)같이 반복서열이 많거나 제놈크기가 클경우의 유전자발현이나 splice variants분석은 양쪽 말단에서 100bp 나 150bp를 읽어야 제놈상에 정확하게 reads를 위치시킬 수 있다.
○ 유전자발현 수준의 계량화에 이어 일반적인 목표는 다른 조건들간에 차별적으로 발현되는 유전자를 동정하는 것이다. 다른 샘플간의 유전자발현수준을 정확하게 비교하기위해서는 계산 데이터가 반드시 표준화 되어야 한다.계산데이터를 표준화할 때 두가지 중요한 염기서열결정상의 편중(bias)을 고려해야 하는데 하나는 전사물 길이의 차이에서 일어나는 샘플내의 편중이며 두번째는 염기서열결정심도의 차이에서 주로 일어나는 샘플내의 편중이다.
○ 다른 샘플간에 같은 유전자의 발현을 비교할때는 단지 샘플간 표준화만이 필요하다.이 경우에 가장 간단한 방법은 샘플에 위치된 reads의 전체 숫자에 따라 counts를 맞추는 것이다(RPKM/FPKM표준화에서와 같이).비록 직관적이지만 이 방법은 만일 전체 reads count의 대다수를 포함하는 유전자들의 작은 부분(minor fraction)이 있다면 부정확하다.
- 저자
- Marcel C. Van Verk et al
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 바이오
- 연도
- 2013
- 권(호)
- 18(4)
- 잡지명
- Trends in Plant Science
- 과학기술
표준분류 - 바이오
- 페이지
- 175~179
- 분석자
- 김*일
- 분석물
-
이미지변환중입니다.