알림마당

  1. home

기계학습에 의한 DNA 후생유전 관련 영역의 예측

전문가 제언
○ 현재까지 식별된 인간세포는 약 200종류 정도이며, 1개체의 체내에 있어 이들은 완전히 동일한 DNA와 동일한 유전체를 지니고 있다. 이런데도 불구하고 특정세포 중에서만 발현을 하는 유전자가 있으며, 또한 발현하지 않는 종류의 다른 세포는 각각 자기 역할을 하고 있으므로 다세포 생물에 있어서는 필수적인 기구라 할 수 있다. 따라서 일반적인 세포분열에서는 분열 전의 세포 발현 패턴이 분해 후의 세포에 정확히 이전된다.

○ 진핵 생물의 경우 핵 내의 DNA는 일정한 구조로 접혀져 쌓여 있으며, 이 구조의 기본 단위는 히스톤이라는 8량 체의 단백질에 DNA가 둘러싸여 있다. 그리고 1개의 히스톤 8량 체에는 145~147 염기 길이의 DNA 영역이 있으며, 크로마틴 구조에는 잘 정돈된 해태로-크로마틴 영역과 비교적 느슨하게 흩어진 유-크로마틴 영역이 있다. 이 두 가지 영역의 차이는 DNA나 히스톤이 메틸화 되어 있는 영역에서는 유전 발현이 억제되는 경향이 있다.

○ 히스톤이나 DNA의 화학변화는 실재로 짧은 부분 배열에서 결정되지 않고, 어떤 종의 긴 배열 패턴(κ-gram보다 긴 배열)에서 영향을 주고 있으므로 κ-gram 빈도에서는 이의 화학변화를 충족시키지 못할 가능성이 있다. 여기서는 SVM(support vector mechine)으로 히스톤의 메틸영역을 측정하였으나 다른 HMM 등의 기계학습 방법으로 검토할 필요가 있다. 그리고 이들의 길이를 알았다고 하여 세포 내의 실재 화학변화나 그의 길이가 어떻게 변할 것인지에 대한 판단은 할 수가 없다. 따라서 주어진 배열이 특정 화학변화를 받고 있는지에 대한 문제는 앞으로의 과제로 되고 있다.
저자
Kenji Satou
자료유형
학술정보
원문언어
일어
기업산업분류
바이오
연도
2007
권(호)
22(1)
잡지명
人工知能??誌 
과학기술
표준분류
바이오
페이지
63~69
분석자
홍*준
분석물
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동