한철규
△ 숭실대학교 화학과 박사
△ 종근당 신약연구소 책임연구원
△ (주)아이디알 부사장
기술의 정의
컴퓨터를 이용하여 생명 현상 관련 연구에서 나오는 다양한 정보를 수집, 관리, 분석하는 데 필요한 제반 분야를 말한다.
즉 Genome의 배열정보, 유전자 발현정보, 프로테옴정보, 단백질 입체구조정보, 분자간 상호작용정보등 다양하고 방대한 데이터를 정보과학적 해석을 통해서 개개의 유전자나 단백질의 구조나 기능을 규명하고 최종적으로 생명현상을 유전자나 단백질이 만들어 내는 시스템으로서 이해하는 영역에 해당한다.
관련기술
Bioinformatics(생명정보)에 관련된 기술은 유전자 mapping, 분자진화 및 계통분류, 서열분석과 관련된 base calling, assembly등, 염기 및 아미노산 서열의 상동성비교, 유전자, exon/intron, 프로모터등 예측, 단백질 구조예측, 수용체-리간드 상호작용, 유전자 발현 및 유전자 네트워크, 데이터베이스 구축 및 마이닝기술, 사용자 인터페이스 및 가시화등이 있다.
바이오인포매틱스의 역할
바이오인포매틱스의 주된 역할은 유전자원으로부터 바이오제품을 개발하는 생명공학적 기술개발 과정에서 유전정보의 체계적 해석과 정보화 및 컴퓨터 시뮬레이션을 통해서 생명공학관련 부가가치를 극대화해줄 수 있다는데 있다.
유전자 및 유전체의 서열정보, 발현정보, 상호작용정보 등을 DB화하고 체계적으로 분석하여 유전자의 기능과 세포내 유전자 네트웍 경로 등을 파악한 시스템을 개발하는 것이 중요한 분야로 부상하고 있다.
바이오인포매틱스의 궁극적인 목표중 한가지는 컴퓨터 상에서 생명현상을 시뮬레이션할 수 있는 가상생물에 구현에 있다.
선진국에서는 바이오인포매틱스를 적극 활용하여 실제 제품 개발에 큰 기여를 하고 있으며, 지적재산권 독점의 주요 도구가 되고 있다.
Nature Biotechnology 보고에 의하면 생명정보의 주요 활용분야는 제약(21%), 지노믹스(12%), 농업(11%), 생물학(7%), 진단(6%), 화학(5%), 환경(2%), 기타(36%)등 다양한 산업에 영향을 미치고 있어 앞으로 5~10년 내에 관련 기술의 발전과 더불어 여러 혁신적 성과들이 가시화될 전망이다.
해외 현황
미국, 유럽, 일본에서는 이미 국가기관을 설립하여 개별기업이나 연구소가 투자하기 어려운 유전체 데이터베이스 등과 같은 국가 인프라를 구축하여 서비스하고 있으며 관련 연구개발도 추진하고 있다.
이들 중 가장 대표적인 것이 미국의 NCBI(National Center for Biotechnology Information)에서 관리하는 GeneBank이다.
대용량의 데이터 처리와 데이터 표준화가 중요한 바이오인포매틱스의 특성상, NCBI를 비롯한 유럽연합의 EBI(European Bioinformatics Institute)를 비롯한 EMBL의 생물정보학 관련 연구개발 결과는 생물정보학 벤처기업인 Lion과 같은 생명정보기술전문회사를 통해 사업화 되고 있으며 일본의 CIB(Center for Information Biology)등의 국가기관을 중심으로 관련 기술이 발전되어 왔다.
정부가 주도하는 밀레니엄 프로젝트와 민간이 주도하는 Helix 프로젝트 두 개의 큰 프로젝트가 수행중에 있다.
이들 기관에서는 DNA 서열 데이터베이스 외에도 단백질 아미노산 서열 및 3차원 구조 데이터베이스, 데이터 마이닝(Data-mining)소프트웨어, 생물학 관련 문헌정보 데이터베이스, 인터넷을 통한 온라인 서비스 프로그램등을 함께 발전시켜 왔다.
국내 현황
국내 정부 차원에서의 바이오인포매틱스에 대한 투자는 인간유전체기능연구사업단이나 바이오그린 21 사업단 등의 구성으로 최근 본격화되고 있고 정부 차원 지놈 연구의 대표적인 사업인 21세기 프론티어 인간유전체기능연구사업단의 경우 1999년 말 만들어졌는데 선진국에서 집중하지 않는 틈새 기술에 집중한다는 전략하에 2010년까지 단계적인 연구개발 프로그램을 계획하고 있다.
이 기간동안 약 1,740억원이 투입되어 인간 지놈의 기능 분석 및 활용을 통하여 한국인에 많이 나타나는 위암, 간암 등 난치성 질환의 진단, 예방, 치료 기술을 개발하고 신약 후보 물질을 도출해내는 것을 목표로 하고 있다.
2001년에는 인간유전체기능연구사업의 한 결과로 한국인 헬리코박터 파일로리균의 지놈이 해독되었고 위암, 위궤양 등과 밀접한 관계를 지닌 것으로 알려진 이 균의 지놈 해석은 관련 질병의 치료와 예방에 대한 전망을 밝게 한 것으로 평가되고 있다.
해외 관련 기업현황
미국이 주도하며 영국, 독일 그리고 일본등이 참여하고 있다. IT 전문 시장 조사기관인 IDC에 따르면 바이오인포매틱스 시장은 2000년 약 22억 달러 규모로 추정되고 있으며 연평균 52 %의 고성장을 통해 2004년경에는 약 116억 달러에 이를 것으로 내다보고 있다.
데이터베이스 구축 산업이 초기시장에서 큰 비중을 차지하고 있으며 점차 분석용 기술관련 산업이 크게 성장하고 있다.
또 초기에는 유전자 발현 데이터베이스가 주종을 이루고 있었으나 점차 Proteomics DB 및 약리적 특성에 관한 DB구축이 증가되고 있다.
생명정보의 특성상, 방대한 양의 정보시스템 운영이 필수적이므로 대형컴퓨터 관련 회사들이 대거 참여하고 있다.
또, 신약개발관련 대형 제약회사들이 적극적으로 생명정보기술을 이용하고 있으며 기업마다 자체 데이터베이스를 구축하는 경향이 뚜렷하고 기업간 제휴를 통하여 신약개발 분야의 경쟁력을 강화하고 있다.
1990년 설립된 Informax는 바이오인포매틱스 소프트웨어를 제공하는 기업으로 유전자/단백질 서열분석 프로그램 및 통합 데이터베이스의 개발에 주력하고 있고, Accelrys는 데이터 모델링, 시뮬레이션, 분석 소프트웨어를 생산하고 있다.
생물정보 서비스 기업들을 ASP(Application Software Provider)라고도 하는데, DoubleTwist의 경우 유전자 관련 데이터베이스를 사용할 때마다 사용료를 받는 방식의 포털사이트를 개설하여 사업을 하고 있다.
Compugen도 바이오인포매틱스 포털사이트를 운영하며 유전자 발굴 소프트웨어 등을 인터넷을 이용하여 판매하고 있다.
현재 바이오인포매틱스 시장에서 가장 활발한 활동을 보이는 전통적 IT 기업들로서는 IBM 과 Motorola, Compaq Computer, Sun Microsystems와 같은 기업을 들 수 있다.
이들은 제약·생명공학 기업에 IT 인프라를 구축해 주는 서비스 수준에서 벗어나 독자적인 생명과학 사업본부를 두고 다양한 process 바이오인포매틱스 분야에서 본격적인 사업 확대를 꾀하고 있다.
이처럼 세계 유수의 IT기업들이 바이오인포매틱스 시장에 주력하고 있는 것은, 이들이 생명과학산업의 미래 성장성을 인식하고 자신들이 보유한 컴퓨터, 네트워크, 시스템 등 정보기술과 생명공학기술을 결합시킴으로써 바이오인포매틱스 분야에서 새로운 사업 기회를 찾을 수 있을 것으로 판단했기 때문이다.
가장 선두격인 IBM 의 경우를 보면 이미 생물학 전용 초고속 수퍼컴퓨터인 Blue Gene의 개발에 1억 달러, 유전자 코드의 조직화, 번역 기술 개발에 1억 달러를 투자하고 있다.
지노믹스기업인 Myriad Genetics, 소프트웨어 기업인 Oracle과 1억8천 5백만 달러 규모의 합작 벤처인 Myriad Proteomics를 설립하여 주목을 받은 Hitachi 또한 가장 활발한 움직임을 보이는 IT기업 중 하나이다.
Hitachi는 1999년에 Life Science 사업부를 설립하여 이를 통해 바이오인포매틱스 사업을 전개하고 있다. Hitachi가 주력하는 분야는 유전자, 단백질의 정보분석 서비스 뿐만 아니라, 데이터의 수집과 해석에 쓰이는 마이크로어레이 Spotter, 마이크로어레이 Reader 등에 이르기까지 생물정보 생산에 관련된 기기에도 관심을 기울이고 있다.
SGI는 최근 대표적인 바이오인포매틱스 기업인 Incyte Genomics와 일본의 Japan Genome Project의 Japanase Genomesites에 서버, 스토리지 등의 기반 기술 구축과 관련한 제휴를 맺기도 하였다.
국내 관련기업 현황
국내의 관련 연구수준은 미국을 100으로 보았을 때 약 40 정도의 수준으로 유럽의 80, 일본의 70에 비하여 현저히 뒤져 있는 것으로 나타나고 있으며 국내 관련 분야 시장 규모는 기술적 특성과 시작 단계인 국내의 상황으로 인해 추정하기가 어려우나 국내 바이오 산업의 규모와 성장 양상, 바이오산업에 대한 투자 규모, 국내 기술수준 등을 고려할 때 2000년 현재 약 500억원 규모로 추산되며, 바이오산업의 규모 및 기술수준 등을 고려할 때 향후 20% 이상의 높은 성장을 보일 것으로 전망되고 이에 따른 관련 기술 확보 노력이 이루어지고 향후 제품 혹은 서비스의 공급이 가시화되면서 관련 분야의 시장 규모 는 2005 년 약 1,800억원, 2010 년에는 약 4,700억원에 이를 것으로 보인다.
국내의 미비한 기술수준을 극복하기위해 주로 바이오 벤처회사를 중심으로 기술 개발에 힘쓰고 있다.
바이오인포매틱스 관련 기업의 활동도 두드러지고 있다.
마크로젠(Macrogen), 아이디알(IDR), 씨앤비알(C&BR), 바이오인포매틱스(Bioinfomatix), 스몰소프트(Smallsoft)등 기존의 전문기업뿐 아니라, 삼성SDS, 비트컴퓨터 등 IT기업들도 바이오인포매틱스의 체계적인 연구와 기술 개발에 열을 올리고 있다.
마크로젠은 Celera Geneomics의 중국 내 투자기업인 Shanghai Gene Core 와 제휴 SNP 발굴 공동 연구 진행, 한국인 유전자지도 초안을 위한 염기서열 분석 및 몽골리안 지놈프로젝트 추진, DNA 칩 개발 및 응용유전자 정보에 대한 정보서비스 사업을 실시하고 있으며 궁극적으로는 예측 의학과 관련한 기술개발을 목표로 삼고 있다.
세계시장 연 52% 성장
2004년 116억불 예상
국내 최초의 Bioinformatics 기업인 아이디알은 유전자로부터 단백질을 만들어내는 툴인 진프로(GenePro), 질병관련 단백질로부터 단백질의 활동을 억제하는 물질을 찾아주는 프로리드(ProLead), Direct-X에 기반을 둔 3차원 단백질 Viewer 툴인 DXMOL, 단백질의 활성부위를 찾아주는 툴인 Prosite X, 컴퓨터상에 가상세포와 조직을 만든 다음 각종 화학물질을 결합시켜 변화를 시뮬레이션할 수 있는 가상세포시스템(Virtual Cell System)툴인 파마셀(PharmaCell) 데이타베이스를 개발하였고, 새로운 유전자를 찾아서 질병관련 단백질을 만들고 그 단백질을 억제하는 물질을 찾고 억제물질을 가상세포에서의 활성까지를 예측할 수 있는 신약의 발굴을 신속하게 수행할 수 있도록 하는 첨단 생명정보 통합 활용시스템을 구축하고 있다.
현재 아이디알은 이 시스템을 이용하여 대기업, 제약회사, 벤처 및 연구소와 32개의 연구과제를 진행하고 있으며 이중 24개 질병관련 단백질에 관한 억제제를 찾아내는 성과를 올렸다.
씨앤비알(C&BR)은 미생물의 유용한 유전정보를 찿아주는 툴인 MGF (Microorganism gene Finder)와 단백질 구조간의 상동성을 찾아주는 툴인 ProStrA을 개발하였고, 협력기관인 분자설계연구센터(숭실대)는 물질의 흡수, 분포, 대사, 배설, 독성을 예측하는 툴인 프리에이디엠이(PreADME)을 각각 개발한 바 있다.
한편 Bioinfomatix는 단백질 분석 툴인 비프러스(BiProws), 의학정보검색시스템인 진넷(Gene Net)등을 출시하는 등의 성과를 올렸다.
제노마인은 식물 유전자 발굴 기술에 특화하고 있고, 제노텍은 고초균 (바실러스) 전체 염기서열 분석, 특정 단백질 대량 생산을 위한 형질 전환 연구을 하고 있으며 제노프라는 신규유전자 기능 규명, Lead 발굴, 암 유전자치료제 개발을 하고 있다.
또, 진매트릭스는 뇌졸중, 심혈관계 질환 진단 서비스와 관련 SNP 발굴을 하고 있고 팬제노믹스는 산업적으로 유용한 생명체의 유전자 정보 해석연구를 하고 있으며, 그린진바이오텍은 벼지놈해석프로젝트 (IRGSP)참여, 고영양 벼 생산 연구 계획을 하고 있다.
이외에도 바이오리더스는 희귀미생물 지놈 해석 및 유전자 치료 기술 개발을 하는 것으로 알려져 있다.
대기업군에, SK 케미칼은 질환 관련 유전자 및 단백질을 발굴하기 위한 연구를 하고 있고, SK(주)는 한방의약을 이용한 지놈 유래 의약을 개발하고 있으며, 제일제당은 Genrac 을 설립하여 대장암 및 류마티스관절염에 대한 유전자치료제를 개발하기로 하였다.
또 중외제약의 경우 미국 현지법인인 CW-USA 를 통하여 생물정보학을 통한 효과적인 신약개발을 추진하고 있고 LGCI 는 미생물 유전자 발굴 기술을 보유한 Elitra, 생물정보학 특화 기업인 Gene Logic 과의 제휴를 통하여 항생제 , 항암제 등의 분야에서 신약의 공동 연구개발을 추진하고 있으며 삼양제넥스는 유방암 유전자 발굴 및 유전자 치료 등의 연구를 수행하고 있고 유한양행은 암진단용 DNA 칩을 개발하고 있으며 종근당의 경우 외부벤처와의 제휴를 통한 구조바이오인포매틱스 및 프로티오믹스 분야 사업을 전개하고 있다.
향후전망
수많은 생명공학기업과 제약기업들이 바이오인포매틱스 역량 확보에 관심과 투자를 기울이는 이유는 바이오인포매틱스를 통해 신약개발 과정에 있어 후보물질의 발굴과 개발에 보다 체계적으로 접근할 수 있을 뿐만 아니라, 개발에 소요되는 시간을 대폭 줄일 수 있을 것으로 기대하고 있기 때문이다.
바이오인포매틱스는 생명과학 분야의 기반에 일대 변혁을 일으키고 있으며 생명과학 분야에서 사업을 영위하고 있는 기업들로서는 바이오인포매틱스 관련 역량이 미래 경쟁력을 좌우할 것이 확실시됨에 따라 이에 대한 효과적인 대응과 전략을 모색하여야 할 것이다.
바이오인포매틱스가 향후 BT의 기반 기술로 자리잡을 것이 확실시됨에 따라 국내에서도 바이오인포매틱스의 역량 확보를 서둘러야 할 것으로 판단된다.
이를 위해서는 바이오인포매틱스 관련 인프라 구축을 위해 흩어져 있는 국내의 연구결과를 통합하고, 바이오인포매틱스 관련 연구기관들 간의 협력과 유기적인 네트워크를 구축하며, 인력부족이 심각한 바이오인포매틱스 관련 인력을 양성하는 정부와 대학 및 연구기관의 노력이 무엇보다 중요할 것이다.
이와 함께 기업 입장에서도 국내 실정에 맞는 소프트웨어 개발, 독창적인 생물정보 데이터베이스 구축 등에 주력함으로써 경쟁역량을 확보해가는 노력이 필요할 것이고 기업들이 바이오인포매틱스를 활용하여 고부가가치를 창출하기 위하여는 자사의 강점을 활용한 효과적인 전략수립이 필요하며 현재의 기술 동향, 경쟁 정도, 향후 얻을 수 있는 부가가치 등 바이오 환경적인 면을 고려해 볼 때 진단시약, 치료제 및 치료법 개발, 바이오인포매틱스 응용 효소 ,미생물 혹은 동식물 개발, 정보 구축 및 제공 등의 활용분야 발굴에 많은 관심과 연구투자를 해야 할 것으로 예상된다.