알림마당

  1. home

유전체학의 쉬운 학습_유전체 데이터마이닝

전문가 제언
○ 많은 생물 종에서 게놈서열이 밝혀지고 인간 게놈서열의 완성과 계속 늘어나는 이러한 데이터를 저장하고 활용할 수 있는 데이터베이스가 생물학 연구에 많은 도움을 주고 있다. 통합된 게놈 데이터베이스로는UCSC, Ensembl, NCBI MapViewer 등이 있으며 인터넷으로도 검색이 가능하다. 또한 실험실에서 얻은 데이터와 함께 게놈의 병열과 바이오인포메틱스 분석이 가능하다. 이러한 분석과 검색을 위한 다양한 softwares 역시 개발되고 있어 실제로는 컴퓨터의 프로그램을 몰라도 쉽게 접할 수 있도록 하고 있다.

○ 이렇게 게놈을 찾아볼 수 있는 부로우서(browsers)가 나오기 전에는 유전체에 대한 데이터를 찾으려면 여러 데이터베이스를 찾아다녀야 했고 그 포맷이나 인터페이스도 각각 다르게 되어 있었다. 그리고 가장 유용하게 생각하는 여러 종간의 서열을 비교하거나 데이터를 관리 보존하는 일은 할 수 없었다. 아직도 데이터베이스는 여러 개가 있고 검색에 프로그램이 필요한 경우도 있으나 통합데이터와 browsers의 역할은 늘어나리라 생각한다.

○ 그러나 이러한 데이터베이스나 사용도구가 아직은 복잡해서 실제로 연구자들은 그 일부분만을 이용하고 있다고 보고 있다. 여기서는 독자들에게 게놈에 들려보고 Ensembl과 UCSC에서 찾을 수 있는 게놈데이터를 총합해 표준화된 포맷으로 데이터를 취득하고 분석하는 것이 다양한 특성화된 데이터베이스를 이용해 분석하는 것보다 간단하다는 사실을 설득하고 있다. 그리고 Galaxy와 같은 인터넷 프로그램이 실제로 생물학자들이 컴퓨터 프로그램을 몰라도 게놈 데이터를 정교하게 분석할 수 있는지도 보여준다.

○ 끝으로 이러한 도구를 완전하게 사용하기까지는 어느 정도의 노력이 있어야 하지만 새로 만들어 놓은 온라인은 프린터의 이용과 개인학습으로 쉽게 배울 수 있다. 이 도구를 마스터하게 되면 점점 늘어나는 게놈 데이터베이스를 통합해 빠르게 분석할 수 있다.
저자
Peter Schattner
자료유형
학술정보
원문언어
영어
기업산업분류
바이오
연도
2009
권(호)
93
잡지명
Genomics
과학기술
표준분류
바이오
페이지
187~195
분석자
강*원
분석물
이 페이지에서 제공하는 정보에 대하여 만족하십니까?
문서 처음으로 이동