신약 개발 새 키워드로 ‘기계 학습’이 뜬다
가상 스크리닝 및 새 선도 물질 발견에 유용
전세미 기자 jeonsm@yakup.com 뉴스 뷰 페이지 검색 버튼
입력 2019-03-12 06:00   수정 2019.03.12 09:48
신약 개발에 소요되는 막대한 시간과 비용을 줄이기 위한 방안 중 하나로 ‘기계 학습(machine learning)’의 도입이 주목받고 있다.

현재 의료계 전반은 환자 맞춤 의료(precision medicine)를 향해 나아가고 있다고 해도 과언이 아니다. 기계 학습은 이런 의료계의 미충족 수요를 해결함과 동시에 제약계에서는 신약 개발을 위한 효과적인 도구로도 작용할 수 있다는 것이다.

KAIST 류성옥·임재창·홍승환 연구원은 최근 발간된 대한화학회지 2월호를 통해 ‘기계 학습 기반 신약 개발 연구 동향’이라는 이름의 총설형 기고를 게재했다.

신약 후보물질 발굴 과정에서 기계 학습은 크게 △기계 학습 모델을 이용한 가상 스크리닝(virtual screening)과 △생성모델(generative model)을 이용한 새로운 선도 물질의 생성 및 최적화 과정에 활용된다.

신약 개발을 위한 가상 스크리닝 모델은 분자의 특정 단백질에 대한 결합능력(binding affinity) 데이터를 학습하는 과정을 거쳐 개발할 수 있다.

현재 많은 공용 데이터베이스에는 2만 가지 단백질의 구조정보와 1억 개의 분자 데이터가 축적돼 있다. 이 중 FDA 승인을 받거나 개발 중인 약물은 약 9600개, 약물의 표적이 되는 단백질은 약 2700개다.

기술적인 부분을 살펴보면, 분자는 원자들의 집합체이며 이 원자들은 다양한 종류의 화학결합으로 연결돼 있다. 이 데이터를 그래프 구조로 표현해 원자들의 특징을 효과적으로 학습할 수 있다. 학습된 원자들은 결과적으로 화학에서 말하는 작용기와 유사한 성질을 나타내며, 이러한 성질을 바탕으로 다양한 물성을 예측한다.

기계 학습은 결합능력 스크리닝 외에도 독성을 예측하는 데 활용될 수 있다. 예를 들어 12가지 독성에 대해 독성인 물질과 비독성인 물질들이 축적된 데이터를 이용해, 기계가 물질의 독성을 예측하도록 학습시킬 수 있다. 이는 신약 개발에 소요되는 많은 시간과 비용을 줄일 수 있다.

주어진 데이터를 학습해 새로운 데이터를 생성하는 ‘생성모델’ 개발을 통해 새 선도 물질을 발견할 수 있다는 점도 기계 학습의 장점이다.

아무리 빠른 가상 스크리닝 모델이라 하더라도, 수많은 신약 후보 물질들을 전부 스크리닝하기는 어렵다. 그렇기 때문에 기존에 약으로 알려진 물질과 화학적 성질이 유사한, 혹은 원하는 성질이 더 개선된 물질을 생성모델을 통해 개발하는 것이 효과적이다.

생성모델은 또 단순히 비슷한 물질을 생성해낼 수 있을 뿐 아니라, 약이 되기 위해 핵심적으로 존재해야 하는 구조(scaffold)를 유지한 채로 다른 작용기가 붙은 새로운 분자를 만들어낼 수 있다. 원하는 물성을 가지는, 혹은 더 개선된 물성을 가지는 분자를 만들어내는 모델을 개발할 수 있는 것이다.

홍 연구원은 “한편으로는 기계 학습 기반 신약개발의 효용성에 대한 회의론도 존재하지만, 그럼에도 불구하고 데이터의 양이 폭발적으로 증가하고 있다. 이런 기계 학습 기술의 잠재력을 적극 활용한다면 빠른 시일 내에 임상시험을 통과하는 신약이 개발될 수 있을 것”이라고 전망했다.
전체댓글 0개
    등록된 댓글이 없습니다.