산업 / 제약·바이오
"3일에서 4시간으로" JW중외제약, AWS 헬스오믹스로 신약 성공에 '성큼'
"JW중외제약은 혁신 신약개발 기업으로 도약하기 위해 최첨단 IT 기술을 접목했다. AWS HealthOmics(헬스오믹스)를 기반으로 유전체 기반 AI 신약개발을 위한 생명정보학 분석 환경을 구축한 것이다. 이를 통해 기존 65시간이 소요되던 분석 시간을 4.5시간으로 단축했고, 비용도 57% 절감했다. 이 혁신을 바탕으로 JW중외제약은 데이터 기반 신약개발 시대를 선도하는 R&D 중심 기업으로 도약할 것이다."JW중외제약 데이터사이언스팀 변병진 팀장은 최근 서울 코엑스에서 열린 'AWS 서밋 서울 2025'의 '헬스케어 및 공공부문’ 세션에서 이같이 밝혔다. JW중외제약은 지난해부터 자체 구축한 AI 신약개발 플랫폼 '제이웨이브(JWave, JW AI-powered Versatile drug Exploration)'를 연구개발에 활용하고 있다.이번 행사는 AWS가 14일부터 양일간 '기술 중심에서 경험 중심으로'의 전환을 강조하며, 생성형 AI를 중심으로 한 새로운 디지털 경험과 혁신적인 비즈니스 가능성을 조명했다. 특히 올해는 '헬스케어 및 공공부문' 세션을 역대 최대 규모로 마련, 국내외 제약바이오 및 디지털헬스케어 기업 종사자를 비롯해 학계, 연구소, 병원 등 보건의료 기관 관계자들까지 대거 참석했다.AI 기반 신약개발이 본격화되면서 분석 자동화, 비용 최적화, 데이터 품질 관리는 연구개발의 핵심 과제로 부상하고 있다. 이러한 과제를 해결할 현실적 해법으로 클라우드 기반 분석 인프라가 주목받고 있다.대표적으로 JW중외제약의 AWS HealthOmics를 활용한 디지털 전환이 모범 사례로 꼽힌다. 기존 전통적인 기업 내 서버 및 인프라 온프레미스(On-premise) 기반 분석 환경의 한계를 극복하고, 대규모 유전체 데이터를 빠르고 효율적으로 처리함으로써 연구 생산성을 획기적으로 높였기 때문이다.JW중외제약은 RNA-seq(RNA 시퀀싱), WGS(전장 유전체 분석/WES(전 엑솜 시퀀싱), scRNA-seq(단일세포 RNA 시퀀싱) 등 다양한 시퀀싱 데이터를 활용해 AI 기반 신약개발을 추진해왔다. 그러나 온프레미스 환경에서는 데이터 전처리 단계에서 품질관리, 트리밍(Trimming), 얼라인먼트(Alignment), 유전자 발현 정량화, 베리언트 컬링(Variant Calling) 등 복잡한 연산 과정이 병목 현상을 유발했고, 샘플 수 증가에 따라 분석 시간과 오류 가능성도 함께 증가했다.변 팀장은 "기존 온프레미스 환경에서는 분석 시간과 오류 가능성의 부담이 컸고, 수작업이 많아 재현성 확보에도 한계가 있었다"면서 "특히 병렬 처리가 어려워 연구 효율이 떨어지는 것이 큰 과제였다"고 말했다.변 팀장은 분석 도구 설치와 버전 충돌, 자원 스케줄링의 어려움, 자동화 부재 등도 데이터사이언스팀의 주요 한계로 지적했다. 실제 온프레미스 환경에서 108개 샘플을 처리하는 데 약 65시간이 소요됐다. 이는 빠른 의사결정과 신속한 연구개발이 요구되는 현업에 큰 부담으로 작용했다.JW중외제약은 클라우드 전환을 위해 AWS HealthOmics를 도입하고, 사내에서 운영하던 생명정보학 분석용으로 검증된 표준화된 워크플로우 nf-core 기반 RNA-seq, scRNA-seq, 베리언트 컬링 파이프라인을 별도 커스터마이징 없이 그대로 이동(Migration) 했다. 마이그레이션 과정에서는 파이프라인 버전, 실행 파라미터, 샘플시트 포맷, 컴퓨팅 자원, IAM(Identity and Access Management) 및 S3(Simple Storage Service) 접근 권한 등을 사전 점검했다.변 팀장은 "nf-core 파이프라인을 그대로 클라우드로 이전하면서도 별도 커스터마이징 없이 안정적인 실행이 가능했던 점이 특히 만족스러웠다"며 "분석 환경을 클라우드에 재현하면서도 동시에 확장성과 자동화를 얻을 수 있었다"고 설명했다.AWS HealthOmics에서 제공하는 프라이빗 워크플로우(Private Workflow) 기능을 활용함으로써 기존 분석 로직은 그대로 유지하면서도, 단일 명령어 기반 실행, 실시간 모니터링, 파라미터 관리 등 자동화된 운영이 가능해졌다. 성능·비용 최적화 전략 적용…분석 시간 4.5시간으로 대폭 단축JW중외제약은 클라우드 환경에서 성능과 비용을 동시에 최적화하기 위해 3가지 전략을 적용했다. 먼저 런 애널리자이저(Run Analyzer)를 활용해 CPU, 메모리, 스토리지 사용량을 기반으로 자원 할당을 조정했다. 런 애널리자이저는 HealthOmics에서 리소스 사용량(CPU, 메모리 등)을 분석해 병목 구간을 진단하고 최적화하도록 지원하는 도구를 말한다. 또한 AWS 서비스 할당량을 증설하고 병렬 실행 구조로 파이프라인을 재구성했다. 여러 컴퓨터 자원(CPU/GPU)을 동시에 활용, 대규모 유전체 데이터 분석에서 처리 속도를 극적으로 개선한 것이다. 아울러 반복 수행되던 레퍼런스 인덱싱을 생략함으로써 실행 시간을 크게 줄였다.변 팀장에 따르면, 기존 65시간이 걸리던 분석 시간이 4.5시간으로 줄었고, 분석 비용은 915달러(약 128만원)에서 396달러(약 55만원)으로 57%나 절감됐다.변 팀장은 "분석 자동화뿐만 아니라, 일관된 환경에서 재현 가능한 결과를 얻을 수 있게 되면서 연구 신뢰도가 크게 높아졌다"며 "향후 글로벌 연구 표준에 맞춘 분석 환경 구축에도 긍정적인 영향을 줄 것으로 기대된다"고 강조했다.이번 프로젝트는 단순한 인프라 이전이 아닌, 분석 환경 전반을 표준화하고 신뢰성을 높인 사례로 평가된다. S3-EC2 기반의 유연한 파일 관리, 'Nextflow' 기반 nf-core 파이프라인의 자동 실행, 레퍼런스(Reference) 및 어노테이션(Annotation)의 표준화는 데이터 품질 확보에 기여했다.변 팀장은 "이번 전환은 단순히 시간과 비용 절감을 넘어서, 분석 자동화와 재현성 확보를 동시에 달성한 전략적 변화였다"면서 "앞으로도 클라우드 기반 연구 체계로 다양한 오믹스 데이터를 분석해 혁신 신약개발에 성공하겠다"라고 밝혔다.AWS 최지선 솔루션즈 아키텍트는 "HealthOmics는 클라우드 연산 플랫폼을 넘어, 생명정보 분석의 전체 흐름을 통합적으로 관리할 수 있는 도구"라며 "국내 제약바이오 기업들과 협력을 지속해서 확대해 혁신 신약개발 성공에 함께하겠다"라고 밝혔다.
권혁진
2025.05.16