아이젠사이언스,' 신약개발 가속화 프로젝트’ AI 솔루션 개발 주관연구기관 선정
연합학습 기술+의생명 특화 LLM ... 신약개발 데이터 부족 문제 해결- ADMET 예측 정확도 향상
이권구 기자 kwon9@yakup.com 뉴스 뷰 페이지 검색 버튼
입력 2024-07-29 07:51   수정 2024.07.29 07:58

 

AI 기반 신약개발 기업 아이젠사이언스가 국가 차원 대형 사업인 ‘연합학습 기반 신약개발 가속화 프로젝트’의 AI 솔루션 개발 주관연구기관으로 선정됐다.

이번 프로젝트는 보건복지부와 과학기술정보통신부가 공동으로 추진하는 대규모 국책 사업으로, 향후 5년 간 예산 총 348억 원이 투입될 예정이다. 해당 프로젝트는 연합학습 플랫폼 구축 및 개발, 신약개발 데이터 활용 및 품질관리, 연합학습 플랫폼 활용 AI 솔루션 개발 등 총 3개 과제로 구성됐다.

아이젠사이언스는 이번 프로젝트에서 신약 개발 과정 실험 데이터를 활용한 고도화된 AI 모델 개발을 담당한다. 이 AI 모델은 약물 흡수, 분포, 대사, 배설, 독성(ADMET) 특성을 정확히 예측해 효과적인 약물 후보 물질을 신속하게 발굴하는 데 기여할 예정이다. 아이젠사이언스 외 광주과학기술원, 목암생명과학연구소, 전북대산학협력단, 한국과학기술원 등 총 5개 기관이 이 연구를 주관한다.

신약개발 분야에서 AI 기술 적용의 가장 큰 난관은 양질 데이터가 부족하다는 점이다. 이를 해결하기 위해 이 프로젝트는 연합학습(Federated Learning) 기술을 활용한 ADMET 예측 모델 개발에 초점을 맞추고 있다.

연합학습은 각 참여 기관 민감한 데이터를 외부와 공유하지 않으면서도 다양한 기관의 풍부한 데이터를 AI 학습에 활용할 수 있게 하는 혁신 기술이다. 이 기술은  데이터를 중앙 서버에 모으지 않고, AI 모델이 각 참여 기관 로컬 환경에서 학습을 수행하는 것이 핵심 원리다. 학습 과정에서 각 기관에서 훈련된 모델은 중앙 서버로 전송돼 통합되고, 이후 다시 각 기관에 배포되는 방식으로 모델이 개선된다. 이를 통해 정보 유출 위험을 최소화하면서도 다양한 데이터로부터 학습이 가능해진다. 결과적으로 개별 기관이 보유한 제한적인 데이터만으로는 불가능했던 고성능 AI 모델 개발이 가능해질 것으로 회사는 전망하고 있다. 

아이젠사이언스는 여기서 한 걸음 더 나아가 최신 LLM (Large Language Model) 기술을 이용해 방대한 과학 문헌 데이터에서 ADMET 관련 정보를 자동으로 추출하는 방법을 통해 학습에 활용할 수 있는 데이터를 추가로 확보하는 방법도 제안했다. 또 LLM 기술을 이용해 예측 결과를 단순히 수치로 제시하는 것을 넘어 그 결과 해석과 근거를 설명하도록 개발할 계획이다. 예를 들어, ‘이 화합물은 CYP3A4 억제제일 가능성이 높으며, A 작용기와 연관이 있다’와 같은 설명을 제공할 수 있어 신약개발 연구자들 의사결정에 유용한 정보를 제공할 수 있다고 회사 측은 설명했다. 

아이젠사이언스 의생명 분야 특화 LLM 기술력은  세계 선도 수준으로 평가받고 있다. 최근 고려대학교, 영국 명문 임페리얼 칼리지 런던과 공동 개발한 ‘Meerkat’ LLM은 OpenAI의 GPT-4를 능가하는  성능으로 미국 의사면허시험(USMLE)에서 85.8점을 기록하며 AI 커뮤니티에 화제를 불러일으켰다. 이는 평균 합격선인 60점을 월등히  뛰어넘는 점수다. 작은 크기임에도  우수한 성능을 보여주고 있어 지식재산권 및 개인정보 보호가 중요한 제약·의료 분야에서 온프레미스 방식(외부 클라우드를 쓰지 않고 기관 내 설치)으로 운영 가능해 데이터 유출 우려 없이 활용할 수 있다는 장점이 있다. 이러한 최첨단 LLM 기술은 방대한 의학 및 생명과학 문헌으로부터 고품질 ADMET 관련 학습 데이터를 효율적으로 추출하는 데 핵심적인 역할을 할 것으로 기대된다.

강재우 아이젠사이언스 대표는 “아이젠사이언스가 보유한 세계 최고 수준 AI 기술력과 실제 신약개발 경험이 시너지를 일으켜 이 프로젝트 성공을 이끌어낼 것”이라며 “이번 프로젝트를 통해 한국의 AI 기반 신약개발 기술을 세계 최고 수준으로 끌어올리겠다”고 밝혔다.

아이젠사이언스 팀 연구책임자인 김선규 AI연구실장은 “약물 표현형 모델과 LLM 기술을 연합학습에 접목시켜 양질 데이터 부족 문제를 효과적으로 해결할 수 있다”며 “이를 통해 ADMET 예측 정확도를 크게 높임으로써 신약개발 임상 성공률 향상에 기여할 수 있을 것”이라고 말했다.

아이젠사이언스는 고려대학교 컴퓨터학과 강재우 교수 연구팀의 세계적 수준의AI 기술력을 바탕으로 2021년 설립된 바이오벤처 기업이다. 강재우 교수는 의생명 AI 분야 세계적 권위자로, 특히 신약개발과 정밀의료 분야에서 우수한  연구 성과를 거뒀다. 

회사는  기술력을 바탕으로 항암제 분야에서 주목받는 파이프라인을 구축하고 있다. 탈유비퀴틴화효소억제제(Deubiquitinase inhibitor), 합성치사(synthetic lethality), 항체약물접합체(ADC) 등 다양한 모달리티의 16개 약물 파이프라인을 개발하고 있다. 대표적으로 pan-KRAS 변이암 치료제인 SOS1 저해제와 PARP 저해제 내성 극복을 위한 USP1 저해제 개발에 주력하고 있다. 이들 파이프라인은 미충족 의료 수요를 해결할 수 있는 잠재력을 인정받고 있다.

전체댓글 0개
    등록된 댓글이 없습니다.