제약 ‘게임체인저’ AI 신약개발...K-멜로디로 활성화 앞당기나
입력 2023.05.22 15:05
수정 2023.05.22 15:06
복지부-과기부 주도 ‘K-멜로디’ 사업 추진
수십억 달하는 R&D 비용 80%까지 감소
EU 멜로디 벤치마킹...연합학습으로 ‘고도화’
22개 제약사 참여 의사 밝혀...KT·카카오도
ⓒ게티이미지뱅크
제약업계의 게임체인저로 급부상한 인공지능(AI) 신약개발, 산업계 디지털 트랜스포메이션이 한창인 요즘 그 어느 때 보다 관심도는 높지만 실제 활용도는 미미한 실정이다. AI에 대한 불확실성이 그 이유다. 정부는 AI 신약개발의 불확실성을 해소하고 빠른 시장 안착을 위해 범부처 과제 ‘K-멜로디(K-MELLODDY)’를 내년 시행하겠다는 입장이다.
22일 업계에 따르면 보건복지부는 과학기술정보통신부와 함께 내년 시행 예정인 ‘K-멜로디’ 사업을 추진 중이다. 박민수 보건복지부 제2차관은 지난 18일 소공동 롯데호텔에서 열린 ‘제약바이오 AI 혁신 포럼’에서 “AI 신약개발을 가속화하기 위해 한국형 멜로디 사업인 K-멜로디 사업을 내년 추진하고자 한다”며 “개별 기업이 AI 신약개발을 시도했을 때 발생하는 한계를 극복하고 성공적인 AI 신약개발 생태계를 마련하기 위해 노력하겠다”고 밝혔다.
AI 신약개발은 시간과 비용이 많이 소요되는 신약개발 사업에 있어 그 수고를 혁신적으로 줄이는 ‘게임체인저’다. 후보물질을 발굴하는데 대략 5~6년, 비용은 수십억원이 들어가는데 AI 신약개발을 사용한다면 정확도에 따라 80%까지 그 수고를 줄일 수 있다. 예를 들어 한 후보물질을 발굴하기 위해 1000번의 실험을 해야 한다면 정확도가 80%인 AI를 활용했을 때 그 만큼의 시간과 비용이 줄어드는 셈이다.
한태동 동아ST 상무는 “국내 제약사는 해외 빅파마에 비해 연구개발(R&D) 비용에 투입할 수 있는 자금 규모가 턱없이 부족하다”며 “이러한 비용을 줄일 수 있는 신약개발 AI의 도움이 절실하지만 개별 회사 단계에서 이에 대한 투자를 하고 활성화하기는 어려운 상황”이라고 지적했다.
K-멜로디 사업은 이러한 제약업계 애로를 해결할 수 있는 방책이다. 유럽연합(EU)의 멜로디 사업을 벤치마킹한 K-멜로디 사업은 신약개발에 필요한 공공 데이터 플랫폼을 만드는 프로젝트다.
EU는 지난 2019년 글로벌 신약개발 플랫폼인 멜로디(MELLODDY: Machine Learning Ledger Orchestration for Drug Discovery) 사업을 추진했다. 해당 사업에는 유럽 소재 글로벌 빅파마인 암젠, 바이엘, GSK, 얀센, 노바티스 등 세계 10대 제약회사와 유럽 주요 대학 및 바이오 스타트업이 참여했다. 멜로디는 머신러닝 기반 데이터 공유 플랫폼으로 각 회사가 가지고 있던 데이터들을 공동 데이터셋에서 AI에게 훈련시켜 신약개발을 위한 AI 기술을 공유하는 것을 목표로 했다.
2022년 EU의 멜로디 사업은 성공적으로 끝이 났다. 김우연 한국제약바이오협회 인공지능신약개발지원센터장은 “지난해 EU의 멜로디 사업이 끝난 이후 활용 사례가 여러 논문을 통해 드러나고 있다”며 “플랫폼을 만드는데 기여한 IT기업들은 기술 노하우를 바탕으로 플랫폼 사업화를 진행 중이며 제약사들은 사업을 통해 개발된 AI를 각자 신약개발 프로젝트에 적용하거나, 플랫폼 내 데이터를 파인튜닝하는 등 다양한 방식으로 멜로디를 활용 중이다”라고 설명했다.
K-멜로디 사업은 EU의 멜로디 사업보다 더 고도화된 방식으로 진행될 전망이다. 김 센터장은 “EU의 멜로디 사업은 머신러닝 기반, 즉 단순한 AI를 기반으로 데이터를 중앙화하는데 의의를 뒀다”며 “반면 K-멜로디 사업은 개별 데이터를 안전하게 중앙화시키는 것은 물론 산업계에서 실제로 신약개발에 활용할 수 있는 AI 모델까지 만들어 내는 것을 목표로 한다”고 강조했다.
신약개발에 필요한 ADME/T(흡수, 분포, 대사, 배설, 독성 등 약물동태 지표) 데이터는 병원, 제약사 등 기관마다 개별적으로 축적하고 있다. 해당 데이터는 건강데이터로 초민감 데이터이기 때문에 데이터 학습 시 보안성이 매우 중요하다. 정부는 보안성을 높이면서 다기관 데이터 활용과 협력이 가능하도록 ‘연합학습(Federated Learning)’ 방식을 도입한다.
ⓒ한국제약바이오협회
연합학습은 데이터를 물리적으로 반출하는 것이 아닌 AI모델을 개별 기관에 투입해 데이터를 학습시켜 중앙 플랫폼에 집적하는 기술이다. 데이터 안전성은 높이면서도 다기관 데이터 공유가 가능해 민감 데이터 활용의 효율적인 방법론으로 떠오르고 있다.
해외에서는 이미 연합학습을 도입한 신약개발 프로젝트들이 여럿 있다. Effiris가 대표적이다. Effiris는 Lhasa Limited라는 영국 소재 소프트웨어 회사가 주도하고 있으며 2차 약리학(hERG 채널 활성화 저해 예측)에 적용되는 협업 모델을 구축하기 위한 실제 플랫폼을 만드는 프로젝트다. 목표는 산업 수준의 제품화 단계다. 한국에서는 카카오헬스케어가 구글 클라우드와 함께 연합학습을 활용한 ‘의료 데이터 정제·분석 솔루션’을 개발 중이다.
김 센터장은 “K-멜로디 프로젝트는 제약사뿐만 아니라 클라우드 기업, AI 개발 기업 등 다양한 산업군의 기업들이 참여할 예정”이라며 “신약개발은 언어모델과 달리 고도화된 AI를 만들기 어렵기 때문에 참여 기업들이 양질의 데이터를 제공하고 고도화된 AI를 개발한다면 AI 신약개발 내 대표사례를 만들 수 있지않을까 기대한다”고 말했다.
한편 내년 추진 예정인 K-멜로디 프로젝트에는 벌써 22개 제약사가 참여 의사를 밝혔다. 공공 프로젝트이다 보니 클라우드, AI 관련 기업 역시 국내 소재 기업이 참여할 것으로 예상된다. 인공지능신약개발센터에 따르면 KT, 카카오 등의 클라우드 사업자가 K-멜로디에 관심을 보이고 있다. AI 기업 역시 국내 스타트업들이 대거 참여할 예정이다.
프로젝트 참여 혜택 역시 클 것으로 예상된다. 우선 정부의 연구비 지원은 물론 비참여 기업보다 먼저 연합학습 AI 모델을 확보할 수 있기 때문에 데이터 활용이 용이하다. AI 모델을 직접 파인튜닝하기 힘든 경우에는 예측 서비스까지 제공할 예정이기 때문에 참여 기업으로는 단시간에 AI 신약개발 기술을 고도화할 수 있는 기회다.
김 센터장은 “신약개발을 위한 데이터 플랫폼 사업에 대해서는 이미 몇 년 전부터 거론돼왔으나 상호 신뢰 부족으로 성사가 쉽지 않았다”며 “관심이 커진 지금 산·학·연·정이 합심해 프로젝트를 성공적으로 마친다면 AI 신약개발의 활성화를 성큼 앞당길 수 있을 것이라고 기대한다”고 말했다.
