-유전제 사업-(이동석 박사: 일동제약 감사)
"생명 지배하고 운영하는 Genome"
인간 유전체 23쌍, 올 1월 염기서열지도 발표
-DNA염기서열은 유전적 기능을 지시한다
-세포분열시 연기사이의 결합이 깨지면서 나선이 분리, 동일한 DNA를 만든다.
-복제과정에 착오가 발행하면 후손에게 영향을 끼친다.
"DNA의 5%만이 유전자 기능수해”
<유전자〉
액손과 유전정보가 없는 인트론으로 구성
기본단위는 작동·조절·구조
조절유전자가 만드는 억제물질에 의해
구조유전자의 발현 조절(오페론 設)
"인간 3만개 유전자를 파헤친다”
`Human Genome Project'
18개국 참여, 2003년 완성
"유전자 염기서열지도 작성〉
-30억개의 염기, 정확한 순서 추적
-DNA안에 존재하고 있는 인간의 유전자와 이들을 제어하는 위치 확인
-올 1월, 세레라와 국제 인간 유전체 서열 컨소시엄에 의해 90%이상 밝혀져
사람은 대략 200종의 세포 60조 개로 이루어진 유기체다. 이들 세포는 크게 체세포(신체 내 모든 기능을 담당. 그러나 다음세대로 전달하지 않음)와 생식세포(신체 내 기능과는 관계가 없고 다만 다음 세대로 유전 능력을 갖는다-난자와 정자) 두 가지로 나눌 수 있다.
세포 핵 속에 들어있는 수많은 유전자(Gene)가 염색사에 들어있고 이 염색사가 응축해서 막대 모양으로 뭉친 것을 염색체(Chromosome)라고 하는데 이 염색체 전체를 유전체 (Genome)라고 명명한다.
세포와 유기체의 생명이 지속되는 동안 이를 지배하고 운영하기 위한 모든 정보는 바로 유전체 (Genome)가 담당하고 있다.
인간의 유전체는 모두 23쌍 (46개)의 염색체로 되어 있음이 1956년 티지오(Joe-Hin Tjio) 와 레반(Albert Levan)에 의해서 밝혀졌다.
우리는 지난 2월12일 21세기 인류 역사의 새로운 이정표 혹은 인류에 가공할 재앙을 몰고 올지도 모르는 인류 역사상 획기적 사건인 유전체 사업의 일차 작업 즉, 유전체의 염기 서열과 유전자 위치를 나타내는 지도를 미국을 위시한 6개국 과학자들의 국제 컨소시엄인 인간지놈지도작성팀과 미국 벤처기업인 세레라 지노믹스사가 각각 독립적으로 수행, 이를 Nature지와 Science 지에 발표한 것이다.
이 유전체 사업을 이해하기 위해서 먼저 유전에 관한 여러 가지 기초 지식을 복습하고자 한다.
유전자와 DNA
모든 생명은 생명체를 통해서만이 발생한다는 사실이 실험에 의해서 확인됐고 생물의 종도 신에 의해서 만들어진 것이 아니고 처음 원시 종이 오랫 동안 분화와 진화를 거쳐 이루어진 것이라고 다윈은 일찍이 주장했던 것이다.
그러나 근대 유전학의 원조는 체코슬로바키아 브르노(Brno) 수도원에서 멘델(Gregor Johann Mendel: 1822~1884) 수도사에 의해 수도원의 뜰에 자라고 있는 완두콩을 대상으로 실험 관찰하여 1865년 `식물의 잡종에 관한 실험'이라는 논문을 발표했고 이어 세 가지 유전 법칙 즉 우열의 법칙, 분리의 법칙, 독립의 법칙을 정립했던 것이다.
유전자는 계속 연구 관찰되다가 독일 튜빙겐 대학 25세의 젊은 스위스 학자 미숴 (Johann Fridrich Miesher: 1844~1895)가 상처의 고름에서 발견한 백혈구의 핵을 연구했다. 그는 1869년 비교적 큰 세포인 백혈구에 희석 염산을 가하면 다른 성분은 모두 용해되고 핵만 남아 이를 분리함을 알게 되었다. 이 핵은 단백질, 탄수화물, 지방과는 달리 산성 물질로 인이 함유된 거대한 분자임을 밝혀 이를 뉴클레인 (Nuclein) 이라고 명명하였다.
그후 1910년 독일의 생리학자 코셀(Albrecht Kossel:1855~1927) 박사는 세포핵 물질에서 아르기닌, 히스티딘을 발견했고 또한 아데닌 (adenine) 구아닌 (guanine) 사이토신 (cytosine), 티민 (thymine), 우라실 (uracil) 5종의 염기를 발견하여 노벨의학상을 수상했다.
1889년 미숴의 제자인 알트만 (Richard Altmann: 1852~1900)은 뉴클레인이 염기, 인산, 당으로 이루어진 DNA와 단백질의 복합체로 밝혀 내고 염기와 인산 당만을 포함하는 물질을 핵산 (Nucleic acid) 이라고 명명했다.
그러나 미숴가 DNA를 발견한 이후 70여년 간 DNA가 유전 물질이라고 생각하는 사람은 거의 없었다. 그러다가 1952년 미국의 분자 생물학자인 허쉬(Alfred Day Hershey, 1908~) 박사와 체이스 (M. Chase) 박사는 바이러스 연구에서 DNA가 유전물질이라는 사실을 규명했다.
이는 실로 획기적인 사건으로 이제 모든 학자들은 이 유전물질인 DNA의 정체를 규명해내는 일에 집중 노력하게 됐다.
그러나 이것만으로는 DNA의 결정적인 연구의 열쇠를 마련할 수 없었다.
결국 1960년 초 젊은 과학자에 의해서 DNA의 화학 구조가 판명되므로 드디어 신의 비밀 박스를 여는 열쇠를 얻게된 것이다. (그림 1:DNA의 분자 구조)
DNA의 이중나선 구조 규명
1951년 23세의 젊은 미국인 과학도 왓슨 (James Dewey Watson, 1928~)은 박사연구원으로 영국 케임브리지의 캐번디시 연구소로 가 거기에서 물리학자 크릭 (Francis Harry Compton Crick, 1916~)을 만나게 된다. 크릭은 물질의 X-선 회절 사진에 대한 전문가였다.
이때 노벨화학상으로 유명한 폴링 (Linus Carl Pauling:1901~1994) 박사는 X-선 회절을 이용하여 주로 단백질의 알파 헬릭스 (alpha-helix) 구조를 규명했던 것이다. 그리하여 그는 DNA 분자도 이와 유사한 3중 나선형으로 되었을 것이라고 미리 짐작하여 발표했었다.
바로 이 선입관 때문에 DNA의 구조 연구는 많은 시련을 거쳐야 했던 것이다.
그때 뉴질랜드의 생물 물리학자인 윌킨스 (Maruice Hugh Fredrick Wilkins, 1916~)는 원자탄 개발의 맨해튼 계획에 참여한 학자로 전후에는 생물연구에 몰두한 학자였다.
그는 DNA의 X-선 회절을 관찰, DNA가 이중 나선을 하고 있다는 사실을 주장했다.
따라서 왓슨과 크릭은 DNA의 분자 구조를 폴링의 3중 나선이 아닌 2중 나선임을 어렴풋이 추정하고 있었다. 그러다가 결정적인 단서를 발견했는데, 당시 오스트리아 출신 미국 컬럼비아 대학의 샤르가프 (Erwin Chargaff) 의 DNA의 염기 즉, 아데닌, 티민, 구아닌, 사이토신의 염기 비율 조사내용이었다.
즉 아데닌의 양과 티민의 양이 동일했고 구아닌과 사이토신의 양이 동일한 사실을 발견, 유명한 샤르가프 법칙을 유도 1950년에 발표했다.
샤르가프 박사는 영국 캐번디위 연구소에 있는 왓슨과 크릭에게 자신의 연구 결과를 자랑삼아 얘기해 준 사실이 이들에게 DNA분자 구조 연구에 귀중한 단서를 제공해 주었고 계속 DNA에 대하여 많은 연구를 거듭한 결과 DNA는 이중 나선으로 꼬여있다는 사실을 규명하게 된 것이다.
이는 이중 나선이 DNA분자가 쉽게 풀리고 안전성이 효과적으로 유지된다는 사실과 일치한다고 보고 드디어 DNA의 이중 나선에 대한 분자 구조를 완성, 오늘날 유전체 사업의 근간을 제공하게 됐고 이는 인류 역사상 엄청난 발견으로 그 업적을 인정받아 1962년 윌킨스와 함께 3인이 노벨 의학상을 수상하됐다.
DNA는 두 개의 나선이 사다리 모양으로 꼬여있는데 이 나선은 각각 뉴클레오타이드 (Nucleotide)라는 단위가 중복으로 선형을 이루어진 것이다.
뉴클레오타이드는 1개의 당 (리보스)과 4개의 각기 다른 질소함유 염기 (아데닌, 티민, 구아닌, 사이토신) 로 구성되었으며 이 염기 배열이 일정한 질서에 의해 이루어졌는데 이를 DNA 염기 서열 (Sequence)라 하고 이 배열이 특유의 유기물질 생산에 필요한 유전적 기능을 지시하게 된다 (그림1).
두 개의 나선은 각 나선에 있는 염기 사이에 약한 결합으로 염기 쌍(base pairs=bp)을 형성한다. 유전체(Genome)의 크기는 이 염기쌍(bp) 수의 총합계로 판정한다.
인간의 유전체는 그러므로 30억개의 염기쌍(bp)으로 구성되었다.
세포가 분열할 때마다 세포는 두 개의 자세포로 이루어지고 각기 유전체가 이중으로 복제된다.
이 이중 복제는 인간이나 고등 생물인 경우 세포핵에서 이루어진다.
세포가 분열하면 DNA분자는 풀려져 염기사이에 이어진 약한 결합은 깨지며 나선은 각기 분리하면서 DNA 복제가 이루어 동일한 DNA를 만들어 낸다. 이 복제 과정에서 착오가 발생하게 되면 (변이현상) 그 후손들에게 영향을 끼친다.
유전자의 정보 기능
각 DNA 분자에는 많은 유전자를 함유하고 있다.
한 개의 유전자는 유전자 특유의 단백질을 합성하게 하는 정보를 담은 뉴클레오타이드 염기 배열인 셈이다.
이 염기 3개가 하나의 아미노산을 만들어내며 이렇게 만들어진 아미노산의 집단인 펩타이드 결합을 거쳐 단백질이 형성되고 이 단백질은 곧 세포와 조직을 구성하며 생화학적 반응에 절대 필요한 효소를 이루어 생체 기능을 수행하고 있다.
이러한 유전자가 인간에게는 약 3만개 정도로 밝혀지고 있다.
DNA에는 유전정보가 마치 암호문처럼 나열되었다.
즉 -TATACTAGAAGGTAGAGCTGTGGTCGTTCAATAA
위의 암호문을 해독하여 아미노산을 합성하고 이를 폴리펩타이드로 만들어 단백질을 형성하는 기능을 유전자의 발현이라고 한다.
이 유전 암호를 해독하는 실마리를 크릭이 제시했다.
즉, 단백질은 20종류의 아미노산으로 이루어지고 있는데 4종의 염기를 3개씩 사용하면 20종류의 아미노산을 충분히 지정할 수 있다는 것이다. 이 유전자의 해독은 니렌버그 (Marshall Warren Nirenbert)와 코라나 (Har Gobind Khorana) 박사에 의해서 밝혀지고 1964년 이들은 64종의 트리뉴클레오타이드 합성에 성공, 이를 응용하여 많은 아미노산 코드의 배열을 결정하게 되어 이 공로로 1968년 노벨 의학상을 받았다. 이처럼 뉴클레오타이드 3개가 하나의 아미노산을 지정한 것을 코든(Codon) 이라고 한다.
인간의 유전자는 그 길이가 각기 다르고 수천 개의 염기로 배열되어 있으나 유전체(Genome)의 10%만이 단백질을 생성케 하는 유전자인 엑손(Exon:Express에서 유도됨)으로 되어 있다.
엑손 사이사이에 유전 정보를 가지고 있지 않은 인트론 (Intron)으로 구성되었다〈표1〉.
한편 프랑스 자콥 (Francois Jacob) 박사는 대장균을 이용한 연구로 유전자의 기본 단위가 작동 유전자, 조절 유전자와 실질적으로 단백질을 생성하는 구조 유전자로 구성되었다고 밝히고 조절유전자가 만들어 내는 억제물질(repressor)에 의해 구조유전자 발현 조절된다는 소위 오페론 (Operon) 설을 제기, 유전자의 상호작용 기전을 알게 되었다.
즉, 유전자는 하나의 완벽한 독립적인 생명 시스템을 만드는데 구석구석 관여하여 세포 안에서만 그치는 것과 이웃 세포에 미치는 세포간의 신호전달물질을 만드는 유전자 그리고 조직을 구축하는데 영향을 미치는 유전자 등의 발현 경로로 생명 시스템의 한 가운데 자리잡고 있으며 모든 것을 통제하고 있다는 것이다.
유전자와 염색체
인간 유전체(Genome)에는 약 30억개의 유전자 쌍(bp)이 24개의 염색체 안에 존재하고 있음을 1956년 티지오(Joe-Hin Tjio)와 레반(Albert Levan)가 규명했다.
모든 유전자는 염색체를 따라 선형으로 배열되었다. 인간의 세포핵에는 두 조의 염색체가 있고 한 조는 각기 부모로부터 물려받은 것이다.
각 조는 23개, 단일 염색체는 22개의 상염색체와 성별을 구별하는 성염색체 X. Y로 이루어졌다. 정상 여성은 X 염색체 한 쌍이 있고 남자는 각기 X와 Y염색체를 가지고 있다.
염색체는 대략 동일한 단백질과 DNA를 함유하고 있고 염색체 DNA는 평균 1억 5,000만개의 염기를 함유하고 있다.
DNA 는 지금까지 알려진 가장 큰 분자이다(그림2: 염색체상의 유전자).
염색체는 염색시약으로 물들일 수 있고 염색하여 염색체 수를 현미경으로 헤아릴 수 있게 되었으며 그 크기 등을 짐작할 수 있게 되었다. 일반적으로 염색체 수가 많으면 고등 생물이나 꼭 그러한 것은 아니다.
단세포 생물인 원핵생물들은 DNA가 그대로 세포질 속에 들어있으나 진핵 생물의 DNA는 그 양이 많아 특별한 보관이 필요해 단백질과 함께 일차적으로 핵막 속에 보존되어 있다. DNA를 둘러싸는 단백질들은 5개의 히스톤 단백질들과 30여종의 비 히스톤 단백질, 약간의 RNA 들로 이루어졌다. 염색체는 굵기가 2 nano meter (nm)인 매우 가는 새끼줄 같은 DNA가 염기성을 띤 히스톤 단백질을 두 바퀴 정도 감아 뉴클레오좀 (Nucleosome)을 이루고, 뉴클레오좀은 약 200개 DNA 염기 쌍과 5종의 히스톤 단백질로 구성됐는데 이 뉴클레오좀이 연결된 것을 크로마친(Chromatin) 이라고 부른다. 이 크로마친이 응축 뉴클레오좀 필라멘트가 되고 이것이 스프링처럼 감겨지고 감겨진 것이 다시 코일 같은 모양으로 되고 나선형으로 감겨 염색체가 된다.
염색체의 구조는 가운데 잘룩 들어간 부분이 있다.
이를 중심립(Centromere)이라고 하고 이 중심립 양쪽에 복재 개시점과 말단립(Telomere)이 존재하고 있다.
이 개시점과 말단립이 하나라도 없는 염색체는 그 기능을 수행하지 못한다.
중심립을 중심으로 염색체의 짧은 부분을 p팔(p arm)이라하고 긴 부분을 q팔 (q arm)이라고 한다.
염색체를 염색하면 염색이 짙게 되는 부분과 엷게 염색되는 부분이 나타난다. 이런 염색 부분을 Band라고 한다.
검게 염색된 부분을 G/Q band라고 하는데 여기에 Adenine과 Thymine 의 함량이 많이 함유되어있고 흰색은 R band라 하여 Guanine과 Cytocine이 상대적으로 많다.
말단립(Telomere)은 노화연구의 권위자인 캘리포니아 대학의 생물학 교수인 헤이프릭(Leonard Hayflick) 박사가 그 기능을 연구하였다.
그는 정상적인 사람인 경우 체세포가 50~60회 분열하면 분열이 정지하는데 이 분열 횟수를 결정하는 것이 염색체의 말단립 (Telomere: telos(끝)+meros(부위))의 기능이라 하고 분열이 더 이상 되지 않는 현상을 헤이프릭 한계 (Hayflick limit)라고 칭하였다.
중심립(Centromere)은 여러 종류의 DNA로 구성돼 있으며 중요한 기능은 세포분열시 염색체들을 끌어가는 두 개의 동원체를 형성시켜 세포의 극을 향하여 염색체를 배열하게 한다.
만약 동원체가 정상적인 위치로 정열하지 못하면 세포분열도 정상적으로 이루지 못하는데 생식기관의 감수 분열 시 발생하면 염색체 수가 많거나 적어져 소위 다운증후군(Down syndrome: 선천성 지능 저하 및 불구 증후군) 등의 기형을 유발한다(그림 3: 유전자 구조).
인간의 24개 염색체는 각기 서로 다르며 염색체는 체세포의 핵형(karyotype)을 통해서 분석한다. 이를 핵형 분석법이라고 한다. 이런 분석에 의해서 발견한 DNA 이상(변이)은 낭포성 섬유증(cystic fibrosis), 식클 세포성 빈혈 등의 선천성 유전 질환을 유발하거나 혹은 암, 주요 정신질환 기타 복합 질환의 소인을 유발한다(그림 4: 24개의 염색체).
유전자, 염색체 또는 DNA의 차이
어떤 생물의 전체 DNA는 나뉘어 염색체에 들어있다. 즉, 사람은 DNA가 23개의 염색체로 나뉘어 있다.
염색체는 DNA와 단백질이 복합되어 있어 마치 실같은 DNA를 감아서 여러개의 실패에 해당하는 염색체 안에 저장하는 것이다.
앞에서 설명한 것처럼 DNA가 전부 유전자를 의미하지 않으며 전체 DNA 중 5% 정도만이 유전자로 그 기능을 수행한다는 것이다. 나머지 95% DNA는 휴지처럼 불필요한 부분(Junk DNA)으로 되어있다.
고등 동물일수록 유전자는 유전체에서 듬성듬성 존재한다는 것이다. 원핵생물인 대장균, 고초균은 유전체 크기와 유전자수를 비교하면 대략 1,000 개의 염기쌍 마다 하나의 유전자가 나타나고 있으나 사람은 약 3만 개의 염기쌍에 1개의 유전자가 존재한다는 것이다.
따라서 사람의 경우 총 30억개의 염기쌍 중에서 5% 만이 실제로 단백질을 합성하는 유전자(Exon)이고 나머지 대부분은 별다른 역할 없이 동일한 염기서열만 반복되는 소위 반복 DNA(Repetitive DNA)이다.
그렇다면 왜 비 유전자 DNA가 이렇게 많은 수로 존재할까?
이는 14억년 전 무렵 원핵생물로부터 원시 진핵생물이 탄생하는 시기 수천 개 유전자를 보유한 원핵생물로부터 1만개에 가까운 유전자를 지닌 원시 진핵생물이 탄생했고 그후 원시 척추동물이 출현했던 시기에 다시 유전자가 5만여개로 증가를 보이면서 이러한 비 유전자 DNA가 늘어난 것이 아닌가 학자들은 추정하고있다.
같은 영장류인 사람과 침팬지의 유전자 DNA염기 서열 차이는 1.5%에 불과하고 유전자 DNA를 제외하면 그 차이가 3%로 더 늘어난다.
유전자 DNA를 뺀 나머지 유전체 대부분이 반복체이므로 이 차이가 결국 사람과 침팬지의 차이를 낳게 한 것으로 보고 있다.
인간 유전체 사업(Human Genome Project)
인간 유전체 사업(Human Genome Project)은 인간 유전체의 유전적·물리적 고밀도 지도를 작성, DNA의 구성 염기(A.T.C.G) 서열과 3만~4만개의 유전자의 위치와 제어 부위를 밝히는 작업으로 1984년 유타주의 알타시에서 과학자들이 모여 유전체 사업의 필요성을 인식하였고 이어 1986년 2차 대전 당시 맨해튼 계획으로 유명한 미국 에너지성(Department of Energy)에서 유전체에 대한 사업을 추진할 것을 제안하여 미국 국립보건원(NIH)과 합의하에 1988년 국립 연구위원(National Research Council)에서 인간 유전체의 지도와 배열에 대한 보고서를 발표하면서 보다 구체화되기 시작했다.
1990년 10월에 미국 에너지성(the Department of Energy:DOP) 과 국립 보건원(the National Institutes of Health: NIH) 은 1단계 5개년 계획을 수립, 유전자 지도, 염기 서열 및 염기 서열 기술개발, 모델 생명체의 유전체 연구, 생명 정보학, 윤리적·법적 사회적 고려, 연구 연수 기술개발 및 이전 등을 포함하는 인간 유전체 사업의 모든 것을 망라하였다.
이어 이 유전체 사업에 세계적인 호응을 얻게 되었고 프랑스 등 18개국이 참여하는 13년간의 국제 사업으로 이 사업은 15년간 지속하는 계획을 세웠으나 그 동안의 기술 발달로 2003년에 완성된다.
사업의 목적은 ①인간의 DNA에 3만개의 유전자를 확인하고 ②DNA를 이루고 있는 30억개의 염기 서열을 결정하며 ③이 정보를 데이터 베이스에 저장하고 ④더 빠르고 더 효과적인 서열 추적 기술을 개발하고 ⑤이러한 자료 분석 기구를 개발하며 ⑥이 사업에서 연유된 윤리적, 법적, 사회적 이슈(ELSI)를 제기함에 있다.
이러한 목적을 달성하기 위해서 대장균, 초파리, 실험 쥐 등 다른 유기체의 유전자를 함께 연구하고 있고 미국 연방 정부는 사기업에 장기간 기술 이전으로 기여하는 중요한 역할을 수행하게 된다.
미국정부가 이러한 기술을 사기업에 이전하고 첨단 혁신 기술 연구를 위한 보상을 허락함으로써 이 유전체 사업은 수십억불의 미국 바이오 산업에 촉매 역할을 수행하게 되고 새로운 의학적 응용 개발을 촉진시킬 것으로 보고 있다.
1989년 설립된 미국 국립인간유전체연구 센터가 1997년 1월부로 국립인간유전체연구소(NHGRI)로 개칭, 각 연구 부처간의 상호 조정과 대회 협력연구 수행을 담당하게 되었다.
또한 인간유전체기구(Human Genome Organization: HUGO)에서 국제간 유전체 사업에 대한 협력을 맡고 있다.
일본은 과기처 후생성·농림성 문부성·통산성의 주관으로 이 연구를 추진하고 있으며 정부차원에서 1995년 인간 유전 염색체 3, 6, 8, 11 및 21번을 중점적 연구투자하고 있으며 산업 미생물과 cDNA에 관한 연구, 벼의 유전체 연구에 전력하고 있다.
프랑스는 유전자 지도 작성에 몰두하고 있으며 유전다형성연구소(CEPH)에서 사람의 질병에 관련된 유전 정보를 수집하여 인체 유전체의 일차지도를 완성했다.
영국에서도 모델 동물의 유전체 연구에 주력하고 있으며 영국의학원(MRC)이 주관하고 있고 노벨상 수상자인 생거 박사의 생거지놈센터에서 인체 효모 C. elegans 등의 유전체 연구를 추진하고 있으며 제약회사인 Wellcome이 연구 투자에 나서고 있다.
우리나라도 `한국유전체학술협의회'와 국회의 `국회유전체연구지원모임' 등이 발족, 과기처·복지부·교육부·농림수산부·해양부·통상산업부 등에서 유전체 연구에 관심을 기울이고 있다.
유전자 염기서열과 지도 작성
앞에서도 언급했지만 24개의 염색체 안에 존재하고 있는 유전자의 위치를 확인하기 위해서는 30억개의 염기 서열 확인작업이 선행돼야 한다.
따라서 유전체 사업은 DNA염기 서열을 검사, 24개의 염색체DNA를 구성하고 있는 30억개의 염기(A: adenine, T: thymine, C: cytocine 및 G: guanine)의 정확한 순서를 추적하는 작업이다.
이는 인간 유전체 사업에 있어 참으로 방대하고도 어려우며 기술적으로도 가장 도전적인 과업이다.
이 염기 서열이 밝혀지면 DNA안에 존재하고 있는 인간의 유전자(약 3만~4만개로 추정)가 규명되고 이들을 제어하는 위치를 확인할 수 있게 된다.
염기 서열 확인작업은 당초 2003년에 완료시키려던 계획이었으나 그동안 이를 규명하는 기술의 눈부신 발전과 민간 기업에서 참여함으로써 급진적인 발전으로 금년 1월에 일차 발표가 이루어졌다.
이 발표에는 개인업체인 미국의 세레라(Celera Genomics) 회사와 국제 인간 유전체 서열 컨소시엄(International Human Genome Sequencing Consortium) 두 라이벌의 노력으로 이루어졌다.
이 두 곳에서 발표된 유전체 서열과 유전자 지도의 발표는 마치 `인공 위성에서 지구를 보는 기분'이라고 감탄했다.
15년 전에 상상도 못했던 작업이 드디어 밝혀진 것이다.
2000년 3월에 밝혀진 초파리의 염기 서열은 180MB였으며 인간은 이보다 더 커 30억개의 염기는 뉴욕 전화번호부 200개에 맞먹는 분량으로 밝혀졌고 인터넷으로 세레라사 데이터베이스를 클릭하면 접근할 수 있게 되었다.
15년 전은 겨우 10%만이 규명되었으나 지금은 세레라나 공공 데이터 베이스에서 거의 90%가 밝혀진 것이다〈표2〉.
세레라와 컨소시움에서 발표한 인간 유전자 수는 종래 10만 개로 추정했던 것과는 사뭇 다르게 불과 3만2,000개 내외로 추정하게 되었고 이는 선충보다 두 배에 지나지 않았다.
또한 염색체 구조도 예상보다는 매우 다른 형태였다는 것이다.
즉, 개체마다 다른 염기의 유전체에 단일 뉴클레오타이드 다중체(single-nucleotide polymorphisms : SNPs)의 분포가 각기 달랐다는 사실이다.
어떤 부위에는 SNP의 밀도가 예상보다 높고 다른 곳은 예상보다 낮았다는 것이다.
그 이유에 대해서는 앞으로 풀어야 할 과제로 남고 있다.
유전자 근접에서 닥친 소위 CpG island라는 유전자 제어 부위가 유전자 없는 DNA보다 유전자가 밀집되어 있는 부위에 밀집되어 있다는 것이다.
또한 13번 염색체 부분은 비교적 안정하고 남자 12번과 여자 16번 염색체는 매우 변화가 심했다.
더 놀란 일은 유전체는 실제로 단백질 생성을 위한 유전자 엑손(exons)들이 적었다는 것이다.
즉, 단백질 생성을 위한 유전체 코드는 세레라에서는 1.1%, 컨소시움에서는 1.5%로 발표했다.
이는 1970년대 DNA 배열에 선구자적 연구로 노벨상을 받은 생거(Fred Sanger) 박사의 추정과는 사뭇 다른 것이었다.
또한 유전자들은 암호 해독을 할 수 없는 쓸모 없는 DNA, 일명 misnomer로 가득하다고 한다.
인간 유전체는 선충이나 초파리와 효모에는 없으나 균에 존재하는 223개의 유전자를 발견했다.
이는 고대척추 동물의 유전체가 균의 유전자를 취하였기 때문으로 추정하고 병원균이 항생제에 내성을 나타내게 하는 유전자를 취하는 방식과 같은 이유로 보고 있다.
그러나 인체에서 균으로 이전되었는지 아니면 균체에서 인체로 이전되었는지는 아직 알 수 없다고 과학자들은 얘기하고 있다.
염기 서열 검사 방법
앞에서 설명한 바와 같이 DNA는 하나의 당(Ribose) 분자와, 염기(Base: Adenine, Guanine, Cytocin 및 Thymine)와 인(phosphate)으로 이루어졌으며 다음과 같은 구조를 나타낸다(그림1 참조).
-5,000만에서 2억5,000만개의 염기의 크기로 잘라서 연구한다(subcloning step).
-이렇게 절단된 조각을 젤 전기영동(gel electrophoresis) 법으로 분리한다(분리단계). 4개의 조각을 젤상에 하나의 줄로 분리한다.
이때 새로운 형광 염색을 이용한다.
-각 조각의 말단 부위 최종 염기를 확인함(base calling step).
이 과정은 첫 단계에서 발생된 각 조각에 대한 A. T. C. G들의 배열을 재생한 것이다.
현재 전기 영동법은 1회 해독에 500~700개의 염기 뿐이 읽을 수 없다.
자동 서열기가 결과로 나타난 전기영동 도표를 분석하고 결과는 4종의 색깔로 된 크로마토그램으로 나타내어 4개 DNA 염기의 각각을 나타내는 픽크를 보여주고 있다.
염기를 읽고 나면 컴퓨터가 각 500개의 염기 불럭으로 된 짧은 배열을 긴 연속 서열로 조합하는데 사용된다.
이 연속 서열을 가지고 오류, 유전자 코드 부위와 기타 특성을 분석한다.
-완성된 서열은 GenBank나 HGP 등의 배열 데이터 베이스에 제출하여 공중에 자유로이 계시하게 된다.