인공지능(AI)이 신약 개발의 핵심 도구로 자리 잡고 있다. AI 머신러닝(기계학습)의 토대를 놓은 연구자들이 노벨 물리학상을 받은 데 이어 단백질 구조를 예측·설계해 신약 개발에 혁신적인 변화를 가져온 AI 개발자들이 화학상까지 거머쥐었다. 신현진 목암생명과학연구소장은 “AI는 신약 개발의 필수 도구로 자리 잡고 있으며 신약 개발에 드는 비용을 절감하는 데 큰 기여를 할 것”이라고 강조했다. 그는 이어 AI 신약 개발을 자율주행 자동차에 빗대며 “아직은 갈 길이 멀다”고 말했다. 그러면서도 “시간이 늦어질 뿐이지 언젠가는 분명히 실현될 일”이라며 “AI 기반 신약 개발도 똑같이 앞으로 이뤄질 미래라고 확신한다”고 강조했다.
신 소장은 12일 서울 중구 더플라자호텔에서 열린 ‘서경 바이오메디컬포럼 2024’에서 ‘AI, 신약 개발 가속화를 위한 담대한 여정’이라는 주제의 강연자로 나서 현재 신약 개발이 10년 이상이 걸리고 평균 26억 달러(약 3조 원)가 드는 지난한 과정이라고 지적했다. 그는 “신약 개발의 실패 원인으로는 효능 부족과 안정성 결여가 꼽힌다” 면서 “임상에 들어가기 전 가능한 한 효능이 있고 안전한 후보 물질을 선별하는 것이 중요하다”고 설명했다. 그는 이어 “임상 개발 과정에서 가능성 있는 후보 물질은 잘 살리고 그렇지 않은 후보 물질은 신속히 배제하는 의사결정이 필요하다”며 “AI가 이런 판단을 돕는 강력한 도구가 될 수 있다”고 밝혔다.
AI는 신약 개발 초기 단계에서 점점 더 활발하게 사용되고 있다. 네이처 리뷰 드럭 디스커버리에 따르면 2011년 2건에 불과했던 AI 기반 임상 및 비임상 연구는 2017년 28건, 2019년 121건, 2021년에는 158건까지 급증했다. 신 소장은 “AI로 개발된 약물들이 임상 단계로 진입하는 사례가 증가하고 있으나 기술의 역사가 짧아 아직 성공적으로 입증된 사례는 적다”며 “AI를 통해 신뢰할 수 있는 결과를 내기 위해서는 충분한 데이터와 AI 파운데이션 모델(기반 모델)의 정확성이 중요하다”고 강조했다.
신 소장은 좋은 AI 기반 모델을 만들기 위한 세 가지 요소를 △모델 일반화 △충분한 데이터 △이해 가능한 모델로 꼽았다. 그는 “우리는 사용 가능한 데이터가 너무 적고 각 데이터 소유자는 자신의 데이터를 공개하지 않는다”며 “지적재산권과 회사의 이익 때문”이라고 지적했다. 그는 이어 “데이터가 흩어져 있는 상태에서 통합 데이터 처리 프로토콜을 통해서 AI 기반 모델을 훈련할 수 있는 방법을 탐색하고 있다”며 “여러 가지 확률적인 기법을 통해 AI 모델이 일반적인 대답을 내놓을 수 있을지 훈련시키는 방법이 개발되고 실험 단계에 있다”고 덧붙였다.
AI 신약 개발의 효용성을 높이기 위해서는 AI의 생각을 읽을 수 있어야 한다는 의견도 내놓았다. 신 소장은 “AI가 어떤 답을 내놓았을 때 답이 어떻게 나왔는지 이해하고 잘못된 부분을 고쳐나갈 수 있어야 모델의 검증이나 신약 개발의 규제에 활용될 수 있다”며 “AI의 결론에 대한 추론 과정을 연구하는 쪽도 앞으로 중요한 연구 분야”라고 지적했다. 신 소장이 이끄는 목암생명과학연구소에서는 AI에 약 1억 개 이상의 다양한 화합물 데이터를 활용해 화합물을 언어처럼 변환해 학습시키는 언어 모델을 훈련하고 있다. 이를 통해 약물의 여러 성질을 예측할 수 있는 모델로 발전시키는 연구를 진행 중이다.