유전체학의 쉬운 학습_유전체 데이터마이닝
- 전문가 제언
-
○ 많은 생물 종에서 게놈서열이 밝혀지고 인간 게놈서열의 완성과 계속 늘어나는 이러한 데이터를 저장하고 활용할 수 있는 데이터베이스가 생물학 연구에 많은 도움을 주고 있다. 통합된 게놈 데이터베이스로는UCSC, Ensembl, NCBI MapViewer 등이 있으며 인터넷으로도 검색이 가능하다. 또한 실험실에서 얻은 데이터와 함께 게놈의 병열과 바이오인포메틱스 분석이 가능하다. 이러한 분석과 검색을 위한 다양한 softwares 역시 개발되고 있어 실제로는 컴퓨터의 프로그램을 몰라도 쉽게 접할 수 있도록 하고 있다.
○ 이렇게 게놈을 찾아볼 수 있는 부로우서(browsers)가 나오기 전에는 유전체에 대한 데이터를 찾으려면 여러 데이터베이스를 찾아다녀야 했고 그 포맷이나 인터페이스도 각각 다르게 되어 있었다. 그리고 가장 유용하게 생각하는 여러 종간의 서열을 비교하거나 데이터를 관리 보존하는 일은 할 수 없었다. 아직도 데이터베이스는 여러 개가 있고 검색에 프로그램이 필요한 경우도 있으나 통합데이터와 browsers의 역할은 늘어나리라 생각한다.
○ 그러나 이러한 데이터베이스나 사용도구가 아직은 복잡해서 실제로 연구자들은 그 일부분만을 이용하고 있다고 보고 있다. 여기서는 독자들에게 게놈에 들려보고 Ensembl과 UCSC에서 찾을 수 있는 게놈데이터를 총합해 표준화된 포맷으로 데이터를 취득하고 분석하는 것이 다양한 특성화된 데이터베이스를 이용해 분석하는 것보다 간단하다는 사실을 설득하고 있다. 그리고 Galaxy와 같은 인터넷 프로그램이 실제로 생물학자들이 컴퓨터 프로그램을 몰라도 게놈 데이터를 정교하게 분석할 수 있는지도 보여준다.
○ 끝으로 이러한 도구를 완전하게 사용하기까지는 어느 정도의 노력이 있어야 하지만 새로 만들어 놓은 온라인은 프린터의 이용과 개인학습으로 쉽게 배울 수 있다. 이 도구를 마스터하게 되면 점점 늘어나는 게놈 데이터베이스를 통합해 빠르게 분석할 수 있다.
- 저자
- Peter Schattner
- 자료유형
- 학술정보
- 원문언어
- 영어
- 기업산업분류
- 바이오
- 연도
- 2009
- 권(호)
- 93
- 잡지명
- Genomics
- 과학기술
표준분류 - 바이오
- 페이지
- 187~195
- 분석자
- 강*원
- 분석물
-
이미지변환중입니다.