구글·IBM도 쩔쩔매는 난제들을 10년 안에 풀겠다는 과기정통부 [궤도 이탈 K-문샷③]
입력 2026.06.17 11:40
수정 2026.06.17 11:40
구체적 청사진 없이 논문 늘리기만 급급
핵심 로드맵도 갈팡질팡…시작부터 '부실 성과' 우려
'상위 1% 논문 점유율 2배'가 연구 생산성 담보 못 해
전문가들 "실패 조기 확인 장치와 검증 기준선 선제 공개 필요”
미래기술 목표는 높게 세웠지만 출발점과 중간 성과, 중단 조건이 빠지면 계획 전체가 흔들릴 수 있다. ⓒ생성형AI를 활용해 제작함.
정부가 구글과 IBM 같은 세계 최고 기업들도 아직 풀지 못한 난제들을, 그것도 채점 기준 없이 10년 안에 해결하겠다고 선언했다. 제시한 과제들의 경우 ▲AI로 신약개발 속도를 10배 높여 블록버스터 혁신신약 10개 창출, 한국형 실증로에서 핵융합 전력을 생산 ▲오류정정 양자컴퓨터로 산업 난제 1000건을 해결 ▲뇌 임플란트로 시각장애와 치매까지 극복 등이다. 하나 같이 성공하면 세계적 과학 강국으로 발돋움할 수 있는 내용들이다.
그런데 정부는 성격도 난이도도 전혀 다른 이 기술들이 약속이나 한 듯 ‘2035년’이라는 단일 시한에 가능하다고 자신하고 있다. 과학기술정보통신부가 지난 5월 27일 출범시킨 ‘K-문샷’ 12대 미션 이야기다.
목표 자체에 대한 시선은 나쁘지 않다. 그러나 시작부터 ‘알맹이’가 비어 있다는 지적이 쏟아지는 상황이다. 이름부터 ‘K-문샷’이다. 문샷이라는 용어는 본래 실패를 감수하고 한계를 넘는 도전이다.
바꿔 이야기하면, 목표가 클수록 출발점과 중간 성과, 성공 판정선은 더 또렷해야 한다는 의미다. 실패 확률이 높기 때문에 다른 정책들보다 더 꼼꼼하게 기초를 다져놔야 성공적인 ‘궤도 진입’을 이룰 수 있다.
더구나 ▲후보물질을 찾는 AI 신약과 환자를 대상으로 한 임상시험 ▲핵융합 플라스마와 실제 전력 생산 ▲물리 큐비트와 오류정정 논리 큐비트와 같은 전혀 다른 기술들을 10년 안에 궤도에 올려놓겠다는 발상은 ‘도전’과 동시에 ‘무리수’라는 시선을 피하기 힘들다.
존 홀드런 하버드 벨퍼센터 STPP 공동소장(전 백악관 과학기술정책실장)은 “상업용 핵융합의 조기 성공 기대는 도를 한참 넘어섰다(far over the top)”며, “조기 상업화를 기대한 대규모 선행 투자가 오히려 최종 성공의 일정을 늦출 수 있다는 점에서 위험하다”고 경고했다.
AI가 후보물질 탐색을 앞당기더라도 전임상과 임상시험, 허가 심사까지 같은 속도로 단축되는 것은 아니다. ⓒ생성형AI를 활용해 제작함.
개발만 빠르면 뭐하나…임상시험만 ‘하세월’
신약 미션은 2030년까지 AI 기반 신약 제안·설계·최적화 기술을 개발하고, 2035년까지 AI 주도 혁신신약 10개를 창출하는 내용이다. 관건은 ‘속도 10배’가 어느 구간을 의미하는지 모호하다는 것이다.
미국 식품의약국(FDA)은 신약개발을 발견·개발, 전임상, 임상, 허가 심사, 시판 후 안전관리의 5단계로 나눈다. AI가 표적 탐색과 후보물질 설계 시간을 크게 줄이더라도, 사람에게 투여하는 임상과 허가 심사까지 같은 비율로 단축된다는 의미로 볼 수 없다는 얘기다.
초기 연구도 속도와 성공률을 구분해야 한다는 점을 보여준다. 2024년 ‘드러그 디스커버리 투데이’에 실린 분석에서 AI가 발굴한 물질의 임상 1상 성공률은 80~90%로 집계됐다. 그러나 2상 성공률은 약 40%로 기존 산업 평균과 비슷했다. 표본도 제한적이었다.
임상 후반부는 더 많은 환자와 시간을 요구한다. FDA 자료에 따르면 임상 3상은 통상 환자 300~3000명을 대상으로 1~4년간 진행한다. 참여자가 적은 초기 시험에서 놓친 장기·희귀 부작용의 확인이 필요하기 때문이다.
선두 기업들도 이 부분에서 여전히 난제를 풀지 못하고 있다. 로이터에 따르면 구글 딥마인드에서 분사한 아이소모픽랩스는 AI 설계 신약의 첫 임상시험 목표를 2025년 말에서 2026년 말로 미뤘다.
AI가 연구개발을 빠르게 만들 수 있다는 기대와 별개로 전임상 검증과 제조, 임상계획 승인 같은 현실의 절차가 그대로 남아 있다는 뜻이다.
데릭 로 노바티스 화학생물학·치료제 디렉터는 “신약 프로그램 대부분을 죽이는 두 가지, 더 나은 타깃 선정과 인체 독성 예측은 아직 AI의 손이 닿는 범위가 아니다”라며 “임상에서의 85% 실패는 야망 부족이 아니라 예측적 통찰의 부족 때문”이라고 지적했다.
뇌 임플란트도 같은 벽을 실감하고 있다. 미국 국립보건원(NIH)이 소개한 2024년 연구는 근위축성측삭경화증 환자 1명에게 전극을 이식해 50개 단어 어휘에서 해독 정확도 99% 이상을 기록했는데, 단 한 명의 성과로 대규모 임상과 장기 안전성을 대신할 수는 없다는 분석을 냈다.
핵융합과 양자컴퓨터, 뇌 임플란트는 기술적 난도와 더불어 실증과 안전성 검증에 필요한 시간도 서로 다르다. ⓒ생성형AI를 활용해 제작함.
글로벌 거인들도 쩔쩔매는데…'2035년 단일 시한'의 무리수
핵융합 미션은 2030년 실증로 설계 확정, 2035년 전력 생산 실증을 목표로 한다. 2023년 국가핵융합위원회가 2050년대 실현을 제시했던 것과 비교하면 전력 실증을 20년 가까이 앞당긴 셈이다.
그러나 국제핵융합실험로(ITER)조차 2039년 중수소·삼중수소 운전으로 500㎿ 출력을 목표하되 전기로 바꾸지는 않는다. 세계가 협력하는 거대 실험로의 일정이 이런데, 국내 ‘전력 생산 실증’이 첫 전기 발생인지 순전력·연속 운전까지 뜻하는지부터 정리해야 2035년 목표를 검증할 수 있다.
피에트로 바라바스키 ITER 사무총장은 취임 후 “현실적인(realistic)' 일정으로 재조정했다”며 “새 기준선상 중수소-삼중수소 운전은 2039년으로, 종전 계획보다 약 10년 지연되고 비용은 50억 유로 늘었다. ITER조차 전기 생산은 목표하지 않는다”고 말했다.
양자 분야 격차는 더 분명하다. 양자 미션은 2035년 산업 난제 1000건 해결을 내걸고 한국표준과학연구원에 1000큐비트급 장비 개발을 맡겼다. 주목할 점은 물리 큐비트 1000개가 오류를 견디는 논리 큐비트 1000개를 뜻하지는 않는다는 것이다.
세계 최전선인 구글 퀀텀AI는 101개 물리 큐비트로 오류정정 주기당 논리 오류율 0.143%를 구현하는 단계이고, IBM은 2029년 목표를 논리 큐비트 200개로 잡았다.
글로벌 거인들이 수백 큐비트를 놓고 씨름하는 지점에서 국내 목표는 ‘1000건 해결’이라는 결과부터 제시한 셈이다. 물리·논리 큐비트 구분과 오류율, 실행 가능한 게이트 수가 빠지면 목표는 검증 불가능한 구호로 남는다.
여기에 뇌 임플란트는 의료기기 규제와 생명윤리의 시간까지 더해진다. 유네스코는 2025년 첫 국제 신경기술 윤리 기준에서 정신적 사생활과 명시적 동의를 강조했다. 기술 난도가 다른 미션들을 하나의 시한에 묶을수록, 가장 어려운 검증 단계가 통째로 가려질 위험이 커진다.
인용도 높은 논문이 늘었다고 해서 신약 허가와 핵융합 전력, 양자 오류정정 같은 최종 성과가 자동으로 따라온다는 것은 위험한 발상이다. ⓒ생성형AI를 활용해 제작함.
샌프란시스코 선언의 경고…논문 인용도가 미션 성공을 보장 못 한다
K-문샷은 2030년 연구 생산성 2배의 대표 지표로 피인용 상위 1% 논문 점유율을 2023년 4.1%에서 8.2%로 높이겠다고 제시했다.
논문 영향력 2배를 생산성 2배로 보는 계산에는 설명이 부족하다. 생산성은 예산·인력·시간 대비 산출물의 관계인데, 현재 지표에는 투입 기준이 빠져 있다.
인용도는 국제 학계의 주목도를 보여줄 뿐, 질환 치료제 허가나 핵융합 전력, 오류정정 성능, 의료기기 안전성 같은 최종 성과를 직접 증명하지 않는다. 같은 상위 1% 논문이라도 기초연구와 사업화 사이의 거리가 다르고 분야별 인용 관행도 제각각이다.
샌프란시스코 연구평가 선언(DORA)은 연구 산출물이 논문뿐 아니라 데이터·소프트웨어·지식재산·인력으로 다양하며, 출판 지표 외에 정책과 현장에 미친 영향도 평가하라고 권고한다. 레이던 선언 역시 정량지표는 전문가 판단을 뒷받침하는 보조여야 하고 평가는 연구 임무에 맞춰야 한다고 본다.
두 선언의 경고를 K-문샷에 대입하면, 채우기 쉬운 논문·특허·시제품 숫자로 성과를 메우는 방식으로는 국가 난제를 풀었다고 보기 어렵다는게 전문가들 시각이다.
정부는 미션별 총괄관리자(PD)가 마일스톤을 점검하고 다음 단계 진입 여부까지 결정하도록 설계했다. 이 체계가 실패를 조기에 확인하는 장치로 작동하려면 미션별 기준선과 중단 조건, 외부 검증 결과를 먼저 공개해야 한다.
레이던 선언 주 저자인 다이애나 힉스 조지아공대 교수는 “정량지표는 동료평가의 편향을 견제할 수 있다. 그러나 평가자가 판단을 숫자에 넘겨서는 안 된다”며 “지표는 정보에 입각한 판단을 대체할 수 없다. 선언 제1원칙은 정량 평가는 질적·전문가 평가를 뒷받침해야 한다는 것”이라고 조언했다.
