생명정보학이란 무엇인가?
한 생물체가 지닌 모든 유전정보를 완전히 밝혀, 그 특성을 분석, 규명하고자 하는 전세계적인 연구사업이 현재 진행 중에 있는데 이를 Genome Project (유전체 사업)이라고 한다. Genome이라는 용어는 H. Winker (1920년)가 반수성의 염색체 1조를 나타내기 위하여 처음 사용하였는데, 일반적으로 배우자에 들어있는 염색체 또는 유전자 전체를 뜻한다. Genome은 gene + some의 합성어로, gene은 유전자이고 some은 형체를 뜻하기 때문에 유전체라고 번역되며, 그냥 게놈이라고 하기도 한다. (본 교재에서는 유전체라는 용어를 사용하기로 한다.)
바이러스로부터 미생물, 식물, 동물 그리고 인간에 이르기까지 수많은 유전체사업이 이미 완료되었거나 계획, 추진되고 있다. 이러한 유전체 사업의 결과로 각종 생물체의 유전체 염기서열에 대한 정보가 쏟아져 나오고 있다. 금광에서 금을 캐듯 우리는 방대한 유전체 자료부터 유용한 정보를 발굴하고 적절하게 가공하여 이용하여야 한다. 이와같이 컴퓨터를 이용하여 생명체 관련 자료를 체계적으로 정리하고, 분석, 이용하는 방법을 연구하는 분야를 생명정보학 (bioinformatics) 또는 생물정보학이라고 한다. (본 교재에서는 생명정보학이라는 용어를 사용하기로 한다.)
컴퓨터를 이용하여 생명체 관련 자료를 체계적으로 정리하고, 분석, 이용하는 방법을 연구하는 분야를 생명정보학 (bioinformatics) 이라고 한다. 이처럼 생명정보학은 21세기를 주도할 두 핵심 분야인 컴퓨터 정보통신 분야와 생명과학 및 생명공학 분야가 접목된 매우 중요한 학문 분야이다.
생명체 관련 정보는 생물 종의 다양성 만큼 다양하다. 그러나 현재 가장 방대하게 축적되어 있고, 보건의료 생명과학 분야에서 기초적으로나 응용적인 측면에서 활발하게 이용되고 있는 정보는 DNA와 단백질의 서열 및 구조에 관한 정보이다. 본 교재의 내용도 이러한 디지털 정보 분석에 국한하여 기술될 것이다.
(DNA 서열 정보의 표시법: 일반적으로 한 가닥만 나타낸다.)
(단백질 서열 정보의 표시법)
생명정보학 (bioinfomatics)
Bio (생명) + Informatics (정보학)
큰 의미 - 컴퓨터를 이용하여 생명과학을 연구하는 모든 분야
좁은 의미 - DNA나 단백질의 서열 및 구조에 관한 정보를 저장, 관리, 이용하고자 하는 분야
이러한 의미로는 분자생명정보학 (molecular bioinformatics)이라는 용어를 사용한다.
유전체학 (genomics)
유전체는 한 생물체의 단일 배우자가 가지고 있는 유전자들의 총합을 의미한다.
유전체학은 개개의 유전자 수준이 아닌 유전체 전체를 대상으로 연구하는 학문 분야로서, 유전체의 구조와 기능, 진화 등을 다룬다. 또한 생명체가 임의의 환경에서 발현하는 모든 유전자들을 총체적으로 분석하는 분야도 포함한다. 흔히 아래와 같이 두 분야로 나누기도 한다.
구조 유전체학 (structural genomics)
기능 유전체학 (functional genomics)
생명정보학과 매우 밀접한 관계가 있다.
생명정보학
예전부터 컴퓨터를 이용하는 생물학이라는 뜻으로 전산생물학 (computational biology)이라는 용어가 사용되어 왔지만, 이 용어는 주로 복잡한 계산이 필요한 생명과학 분야에서 제한적으로 사용되어 왔다. 예를들면 단백질의 구조를 컴퓨터로 연구하는 전산구조생물학 (computational structural biology) 분야가 이에 포함된다.
그러나 최근들어 분자유전학, 분자생물학, 유전공학의 급격한 발전과 유전체사업의 결과로 방대한 생명정보가 축적되자 컴퓨터를 이용하여 체계적인 데이터베이스를 구축하고 이를 효율적으로 분석, 이용하려는 노력이 증대되어 왔다. 그리고 정보화 시대를 맞이하여 정보학이라는 용어가 각광을 받게 되자 최근에 생명정보학이라는 용어가 새로 등장한 것이다.
생명정보학 유관 분야:
분자진화
생명의 기원
유전체학 및 단백체학
이론 생물학
DNA 컴퓨터
생명정보학이라는 용어와 유사하게 사용되는 용어들에 대해서 살펴보자.
Computational biology (전산생물학)
주로 전산구조생물학을 일컫는다.
Biocomputing (또는 biological computing, molecular computing, biological computation)
생명정보학과는 정반대 개념의 학문
생명과학에서 얻어지는 지식으로 컴퓨터를 발전시켜보자는 것이 목적
예) DNA 컴퓨터
유전체 사업
1970년대 유전자조작 기술의 발전으로 분자생물학과 유전공학 등 새로운 학문 분야가 정립되면서 유전자의 염기서열이 갖는 의미가 점점 크게 부각되었다. 이렇게 되자 80년대 중반 경에는 제임스 왓슨 등을 중심으로 한 생물체가 가진 모든 유전정보를 한꺼번에 체계적으로 밝히는 것이 더 효율적일 것이라는 주장이 제기되었다. 이에 대한 반발도 심했는데, 그 주된 이유는 대규모의 인력과 자금이 한 방향으로 몰려서 다양하고 균형있는 학문 발전을 저해한다는 것과, 우수한 연구인력들이 기계적인 일에 매달려 창의적인 연구를 방해한다는 것이었다. 많은 논란 끝에 결국 인간유전체 사업 (Human Genome Progect)으로 이름 지어진 대규모 국제 협력사업이 91년부터 본격적으로 시작되었다. 이러한 유전체 사업의 목표는 유전체의 지도를 작성하고 염기서열을 완전히 밝혀, 그 특성을 분석, 규명하는 것이다.
인간 유전체 사업 이외에 바이러스로부터 미생물, 식물, 동물에 이르기까지 수많은 유전체사업이 이미 완료되었거나 계획, 추진되고 있다. 대장균 유전체 사업(http://www.genetics.wisc.edu/)을 비롯하여 여러 세균, 바이러스, 엽록체와 미토콘드리아의 유전체, 효모 (Saccharomyces cerevisiae, http://www-genome.stanford.edu), 아기장대 (Arabidopsis thaliana, http://weeds.mgh.harvard.edu), 초파리 (Drosophila melanogaster, http://www-leland.stanford.edu), 그리고 선충 (Caenorhabditis elegans), 두꺼비 (Zenopus), 제브라다니오 열대어 (http://zfixh.uoregon.edu), 생쥐, 쌀 (http://bioserver.myongji.ac.kr) 등 많은 생물체의 유전체 사업이 현재 이미 완료되었거나 진행 중에 있다. 가장 먼저 완성된 Haemophilus influenzae를 비롯하여 10여종의 원핵생물 유전체의 염기서열은 이미 완전히 결정되었으며 인간 유전체의 경우도 현재 약 3% 정도 진척되었다. 이러한 사업들은 전세계적으로 수많은 과학자들이 분담하여 각기 다른 부분에 대하여 연구하고 그 결과 및 정보를 서로 공유하는 유기적인 협조체제를 구축하여 수행되고 있다.
이러한 유전체 사업이 보건의료생명과학분야에서 갖는 의미는 매우 크다. 우리가 한 생명체의 모든 유전정보를 알아내는 일은 각종 생명 현상과 유기체의 형성 원칙 및 진화를 이해하는 데 필수적이며, 사람 유전병 또는 암과 관련된 새로운 유전자의 발견 등 의학, 약학, 농학, 식품 및 발효산업의 발전과 인류 복지 증진에 크게 기여할 것으로 믿고 있기 때문이다.
|