노바티스가 AI를 암 진단 및 예측에 활용하는 방법
병리조직 통해 환자 반응 예측하는 ‘PathAI 시스템’ 개발
전세미 기자 jeonsm@yakup.com 뉴스 뷰 페이지 검색 버튼
입력 2019-08-29 06:00   수정 2019.08.29 06:55

4차산업혁명의 물결 속 인공지능(AI) 기술이 신약 개발에 적극 도입되고 있는 가운데, 노바티스가 인공지능 기술을 암 진단 및 치료 결과 예측에 활용하는 시스템을 개발해 주목된다.

노바티스 생명과학 연구소(Novartis Institutes for BioMedical Research, NIBR)의 과학 에디터인 엘리자베스 도허티(Elizabeth Dougherty)는 ‘제1호 노바티스 이노베이티브 뉴스레터(Novartis Innovative Newsletter)’를 통해 자사의 PathAI 시스템을 소개했다.

지난 150년 동안 병리학자들은 암 진단을 위해 환자의 조직 검체 슬라이드를 현미경을 통해 분석해왔다. 하지만 환자의 조직 슬라이드에 존재하는 수십만 개의 세포 중, 소수의 세포만이 종양일 수 있기 때문에 병리검사를 통한 암 진단은 쉽지 않았다. 알려진 바에 따르면 병리검사의 암 오진율은 3~9%에 이르는 것으로 알려져 있다.

이에 노바티스 소속 병리학자들은 인공지능 시스템에 주목했고, 병리조직 슬라이드에 환자의 치료 반응 여부를 예측할 수 있는 정보가 포함되어 있다는 가정 하에 인공지능이 질병 진단뿐 아니라 특정 치료제에 대한 환자 반응을 예측하는 데에도 도움이 된다고 생각했다.

이러한 아이디어는 노바티스의 병리학자, 데이터 과학자와 인공지능 스타트업 PathAI가 공동으로 추진하는 ‘PathAI 시스템’ 프로젝트를 통해 실행에 옮겨졌다.

노바티스는 PathAI가 개발한 인공지능 시스템이 질병 진단 시 병리학자들이 관찰하는 병변 구조(패턴)를 인식하도록 교육하고, 이를 토대로 병변이 가려져 있거나 구조가 너무 복잡해 육안으로 확인하기 힘든 경우에도 병변 패턴을 인식할 수 있도록 교육했다.

세포 유형을 구분하는 작업은 항암요법이 암세포뿐 아니라 면역세포도 목표하도록 진화함에 따라 더욱 중요해졌다. 컴퓨터가 슬라이드 전체를 한 번에 분석하고 세포의 유형과 위치를 데이터화 할 수 있다면, 특정 치료제에 대한 환자의 민감도를 예측할 수 있는 조직 병리 구조를 발견할 수도 있다는 점에서 유용하다.

이후 스위스 바젤 대학 병원의 병리학 연구소와의 협업으로 노바티스는 400개의 유방암/폐암 조직 슬라이드 이미지, 환자의 진단기록, 그리고 생존시간에 대한 익명의 데이터를 받았다. 그리고 PathAI 시스템을 통해 슬라이드 이미지를 분석하고, 세포 유형을 식별해 환자의 5년 생존율을 예측하고자 했다.

병리학자들은 병리 슬라이드를 분석하고, 분석 결과를 시스템에 제공해 인공지능 알고리즘이 더욱 풍부해지게 했다. 즉, 알고리즘이 세포 유형 구분하는 것을 학습할 때 PathAI가 대략 10,000개로 조각낸 트레이닝용 병리 슬라이드에 있는 모든 세포 유형을 라벨링했다. 이 단계가 인공지능 시스템의 성능을 결정짓는다고 본 것이다.

이렇게 훈련된 알고리즘은 ‘블랙박스(black box)’라고 불린다. 시스템이 훈련 데이터로부터 무엇을 배웠는지, 또는 시스템이 어떻게 의사 결정을 하는지 알기 어렵기 때문이다.

블랙박스 안에는 기계 학습 알고리즘 모델이 있는데, 특정 구조와 같은 특징을 인식하기 위한 연속적인 공식들로 이루어져 있으며, 이러한 특징들을 환자가 실제로 얼마나 더 오래 생존했는지와 같은 실제 데이터와 연관시킨다.

알고리즘이 점점 더 많은 이미지를 보게 됨에 따라, 알고리즘은 데이터에서 보이는 패턴에 대한 이해도를 조정한다. 궁극적으로 알고리즘은 병리 슬라이드에 있는 특정 패턴들이 ‘환자가 1년 생존한다’든지, ‘6개월도 채 넘기지 못할 것이다’라는 등의 건강 결과를 예측하는 방법을 학습하게 된다.

미국 에머리 대학의 생의학 정보학 및 생체 공학 조교수 리 쿠퍼(Lee Cooper)는 인공지능 시스템 알고리즘의 미래에 대해 다음과 같이 말했다.

“우리가 향해 가는 시대는 알고리즘보다 데이터에 더 밀접하게 연관되어 있습니다. 알고리즘은 계속해서 정교화 될 것이고, 우리는 최상의 알고리즘을 구축하기 위한 데이터를 어떻게 만들어낼 것인가에 대해 실질적으로 고민해야 합니다.”

전체댓글 0개
    등록된 댓글이 없습니다.