경제·금융 경제·금융일반

빅데이터가 과연 암을 치료할 수 있을까?

BIG DATA CAN CURE CANCER?

2명의 컴퓨터 천재, 구글의 막대한 투자, 그리고 오랫동안 풀리지 않은 난제에 관한 이야기.
BY MIGUEL HELFT


한번쯤 이런 이야기를 들어 본 적이 있을 것이다. 재능이 뛰어난 청년 몇몇이 명문대에서 만나 컴퓨터에 대한 열정으로 함께 뭉치고, 밤을 새워가며 컴퓨터와 씨름한 결과 웹사이트나 앱을 만들어낸다. 알게 모르게 이들의 취미용 프로젝트가 신생기업이 되고, 앳된 얼굴의 청년들이 투자자로부터 막대한 자금을 유치해 소마 SoMa나 소호 SoHo 같은 곳에 회사를 세운다. 이 회사는 하루아침에 (최소한 이론상으로는) 수백만 달러를 벌어들인다.

냇 터너 Nat Turner와 잭 와인버그Zach Weinberg는 누가 봐도 딱 이런 이야기의 주인공이다. 둘은 펜실베이니아 대학교 신입생으로 만나 곧 친한 친구 사이가 됐다. 이제 28세가 된 두 청년은 뉴욕에서 작은 벤처업체를 운영하고 있지만 사업가로서 그들의 꿈은 상당히 원대하다. 아직 걸음마 단계인 이들의 IT업체는 전형적인 소셜 네트워크나 사진 공유앱, 데이트 주선 사이트와는 차이가 있다. 둘이 함께 만들고 있는 것은 10대 청소년이나 20대 젊은이들이 휴대폰으로 채팅을 즐기거나, 야식을 주문할 때 쓰는 것과는 차원이 다르다.

2년 전 이들이 설립한 플랫아이언 헬스 Flatiron Health는 ‘보건 체계의 혁신’이라는 야심 찬 목표를 세워놓고 있다. 하지만 보건 체계 전체를 대상으로 하진 않는다. 두 사람은 막대한 임상 데이터를 수집하고 분석하는, 의학계에서 가장 복잡하고 까다로우며 연구가 매우 중요한 분야를 혁신 대상으로 삼고 있다. 바로 암 치료다. 와튼 스쿨 Wharton School에서 기업가 정신과 경제학을 공부한 이 두 청년이 생물학 수업을 듣지는 않았지만 그게 큰 문제는 되지 않는다.

그러나 이들을 비웃기 전에, 둘의 이력을 살펴볼 필요가 있다. 플랫아이언은 이들이 설립한 첫 회사가 아니다. 사실 3번째 회사다. 과거에 대학생을 대상으로 한 온라인 음식 주문 서비스를 시도하다가 실패했다. 2번째 벤처업체 인바이트 미디어 Invite Media-펜실베이니아 대학교 3학년 때 설립했다-는 디지털 마케팅의 효율성 증대를 위해 빅데이터를 활용했다. 이 사업이 큰 성공을 거두자, 빅데이터 컴퓨팅의 대부이자 세계 최대 디지털 광고업체인 구글이 2010년 8,000만 달러 이상을 주고 인바이트를 인수했다.

구글은 최근 자사의 벤처투자회사 구글 벤처스를 통해 1억 달러 이상을 플랫아이언에 투자하며 터너와 와인버그를 위해 한 번 더 지갑을 열었다(플랫아이언은 총 1억 3,800만 달러의 자금을 받았다). 하지만 광고관련 기술에 재능이 있는 이 두 청년에 주목하는 건 구글만이 아니다. 듀크대학교 의대 교수이자 저명한 종양학자 에이미 애버네시Amy Abernethy는 플랫아이언의 목표가 달성하기 너무 어렵다는 점을 알고 있다. 하지만 이 업체의 임상 데이터 수집 및 분석 방식이 매우 철저하고 체계적이란 점에 끌려 지난 7월 의학 최고 책임자(Chief Medical Officer)로 플랫아이언에 합류하기로 했다. 애버네시는 “플랫아이언으로 배를 갈아타면서 내 명성을 걸었다”고 말했다. 그녀는 최근까지 듀크 암 치료 연구 프로그램(Duke Cancer Care Research Program)을 이끌었으며, 암 치료 개선에 대량의 임상 데이터를 활용하는 ‘이상적인(starry-eyed)’ 초기 시도에도 참여해왔다.

이런 지지자와 막대한 구글 투자금을 제외하고 보더라도 두 청년의 목표는 정말 인상적이다. 아직 앳된 얼굴이지만 지금까지 수많은 연구자와 능숙한 의사가 성취한 것을 뛰어넘을 생각을 하고 있다. 플랫아이언의 CEO 터너는 겸손하면서도 당찬 인물이다. 그는 “우리는 암의 세계에 뛰어들 IT업체를 키우고 있다”고 말했다(그는 ‘세계(space)’라는 말을 자주 사용한다). 플랫아이언에서 세우고 있는 가설은 다음과 같다. 현재 암환자 치료 데이터 중 체계적으로 수집되는 것은 소량에 불과하다.

수집 활동 대부분이 무작위 임상시험에서 이뤄지고, (추정치는 다양하지만) 성인 암환자의 약 4%만을 대상으로 한다. 나머지 96%가량에 대한 정보의 체계화와 표준화를 이뤄 의사들에게 제공한다면 더 나은 치료법을 찾아내는 데 도움이 될 것이다.

그렇게 되면 이론상으로 의사가 유사한 상황의 환자 대부분에게 가장 적합한 치료법을 사용하도록 할 수 있다. 예컨대 유방암을 치료하는 의사가 전국에 있는 다른 전문가의 치료방법을 비교하고, 부족한 부분을 곧바로 보완할 수 있다. 데이터를 통해 합리적인 비용이 드는 치료방법을 찾아낼 수도 있고, 반대로 비용 낭비가 심한 방법을 발견할 수도 있다. 좀 더 많은 환자가 자신에게 적합한 임상시험에 참여할 수 있고, 어쩌면 신약의 개발과 승인이 가속화될 수도 있다. 터너와 와인버그는 데이터가 암과의 싸움에 종지부를 찍을 것이라고 허황된 주장을 하는 것이 아니라, 그들의 노력이 의미 있는 결과를 얻을 수 있을 것이라고 희망을 걸고 있는 것이다. 터너는 “우리가 다른 산업으로부터 데이터를 빌려오면, 그 안에 가치가 있는 것이 분명 존재할 것이라는 말이다”라며 “얼마나 필요한지는 우리도 아직 모른다”고 말했다. 그 결과가 대단치 않아도 수백만 명의 사람들이 혜택을 볼 수도 있다. 터너는 “전체 암 종류의 5% 정도에만 영향을 미칠 수 있다면…”이라며 말끝을 흐렸다. 올해 새롭게 암 진단을 받은 미국인의 수는 170만 명이다. 환자 생존율을 5%만 높일 수 있다면, 올 한 해에만 수만 명의 목숨을 구하게 된다(그래프 참조).

석유를 탐사하는 지구 물리학자 아버지를 둔 터너는 텍사스, 루이지애나, 네덜란드, 스코틀랜드 등을 돌아다니며 자랐다. 동료들은 터너를 보고 편한 미소를 지닌 ‘애늙은이(an old soul)’라고 부른다. 머리카락이 밝은 갈색인 터너는 벌써 이마가 넓어지고 있다. 하지만 얼굴은 아직 대학원에 다닌다고 해도 믿을 만큼 어려 보인다. 얼마 전 아침, 폴로 셔츠를 입은 그는 한쪽 어깨에 백팩을 메고 (다양한 모금을 위해 판매되는) 고무 팔찌 하나를 차고 있었다. 트라이베카 Tribeca에 있는 한 칸짜리 예전 플랫아이언 ‘본사’-지금은 소호의 좀 더 넓은 곳으로 옮겼다-건너편 커피숍에 앉아 있던 터너는 사실을 나열하듯 플랫아이언의 계획을 설명해 나갔다. 그에게선 성공한 기업가의 으스대는 모습도, 세상을 바꿀 수 있다고 믿는 혁신가의 오만한 모습도 보이지 않았다. 하지만 터너에겐 맨해튼의 신흥 부촌 어퍼 웨스트 사이드 Upper West Side에서 자란 와인버그와 공유하는 바가 있다. 바로 기술을 통해 암 환자의 삶에 변화를 줄 수 있다는 믿음이다. 와인버그는 “건강보건의 세계와 종양학을 배울수록, 겸손하고 적절하게 질문을 던질 수만 있다면 해결할 수 있는 부분도 있다는 걸 깨닫게 된다”고 말했다.

터너가 암에 관심을 가진 건 2009년으로 거슬러 올라간다. 노스캐롤라이나에서 가족 휴가를 즐기던 중, 일곱 살이던 조카 브레넌 심킨스 Brennan Simkins의 몸에 이상이 생겼다. 여러 번의 검사 끝에 급성 골수성백혈병 진단을 받았다. 그 후 몇 년에 걸친 고통의 시간이 시작됐다. 골수이식, 회복, 또 한 번의 골수이식, 그리고 백혈병 재발이 이어졌다. 심킨스는 총 4번의 끔찍한 골수이식수술을 거쳤고, 오진으로 고통 받기도 했다. 이제 12세가 된 심킨스는 2011년 이후 차도를 보이고 있다.

이 가슴 아픈 이야기 때문에 터너와 와인버그는 고민하기 시작했다. 비슷한 상황에 처한 다른 사람들을 도우려는 것이었다. 그들은 새로운 사업에 대한 아이디어를 구상하던 중 다른 의사의 의견을 인터넷에서 제공하는 방식을 떠올렸다. 심킨스의 이름이 새겨진 고무 팔찌를 한 터너는 6개월 동안 “암에 모든 것을 쏟아부었다”고 말했다. 둘은 60여 곳의 암 센터를 방문해 전문가와 이야기를 나누고, 의사와 회진을 함께 돌며 가능성 있는 사업 아이디어를 의논했다(의사이면서 구글 벤처스의 생명과학분야 투자 전문 파트너인 크리슈나 예션트 Krishna Yeshwant를 종종 대동했다).

수많은 대화가 오간 후, 둘은 새로운 아이디어 하나를 융합해냈다. 전국 종양 치료 센터의 다양한 기록 체계에 흩어져 있는 임상 데이터를 체계화하는 것이었다. 디지털 데이터는 물론 다른 형태의 데이터도 수집하고 이를 정리해 의사에게 제공하면 의사가 환자 치료방법에 대해 더 나은 결정을 내릴 수 있게 되는 방식이었다.

터너와 와인버그 같은 데이터 전문가에게 임상 종양학 데이터의 문제는 분명할 뿐만 아니라 익숙한 분야였다. 의사와 병원들이 전자의무기록(EMR)을 채택하도록 수년간 설득하는 등 다양한 의학계의 노력에도 불구하고 종양학 데이터는 여전히 접근과 사용에 어려움이 있었다. 터너는 “EMR은 엉망이다”라고 지적했다. 한 명의 환자에 대한 데이터는 내과의, 암전문의, 방사능전문의, 외과의, 실험실, 병리학 보고서 등 10개가 넘는 출처에서 나올 수 있다. 디지털 데이터라도 (기술자의 표현을 빌리자면) ‘제대로 구조를 갖추지 못한 형식(unstructured format)’인 경우가 많다. 데이터베이스에 체계적으로 정리되어 있지 않고, 실험보고서와 기록마다 각각 다르게 나타나는 경우도 많다는 것이다. 그 뿐만이 아니다. 손으로 쓰거나 스캔을 한 경우, 아무도 듣지 않는 음성 녹음을 한 경우, 팩스를 거치면서 해상도가 낮아진 PDF파일인 경우 등에도 내용을 확인할 수 없는 데이터가 많다. 그 외에도 호환이 불가능한 다양한 시스템과 개인의료기록을 관리하는 엄격한 개인정보 보호제도가 많은 종양학 전문의들이 암 치료를 위해 데이터를 공유하는 데 장애물이 되고 있다.

솔직하게 말해 산 넘어 산이다. 전자의무기록은 이론상 데이터 취합 및 통합을 용이하게 해줘야 했다. 하지만 그렇게 간단하지 않았다. 예컨대 한곳의 암 치료센터에서 단 한 가지 EMR 방식을 쓰는데도 한 가지 단백질-보통 암 환자 검사에 쓰이는 알부민 albumin-의 검사결과가 30가지 이상의 형태로 기록되고 있다(그래프를 확인하라). 하지만 그게 끝이 아니다. 암 치료를 위해선 100종 이상의 단백질 검사가 필요하고, 거기에 유전자 검사와 생체 검사 및 다른 진단법이 더해진다. 여기에 다양한 EMR 체계와 암 치료센터까지 추가되면, 이 문제가 얼마나 복잡한지 단박에 알 수 있다.

터너와 와인버그는 2년간 공을 들여 이 문제를 해결하기 위한 일종의 데이터 모델을 만들어냈다. 광대한 임상 데이터를 깔끔하게 분류하는 방법을 고안한 것이었다. 둘은 모든 종류의 암을 대상으로 이를 실현하는 것이 너무 복잡하다는 점을 깨달았다. 그래서 의학 전문가의 조언을 얻어 결장암에 집중하기로 했다. 공개된 임상시험 결과를 활용해 인구 분포와 발병 지역에서부터 암 진행단계, 병의 생물학적 표지와 치료법에 대한 반응을 아우르는 350개 이상의 데이터 범주를 추출했다. 그리고 같은 과정을 다른 암에도 적용했다.

EMR 데이터 추출 업무에 일손이 많이 들기 때문에, 플랫아이언은 다양한 컴퓨터 기술을 활용해 이를 자동화했다. 실험실 보고서에서 정확한 값을 찾아내려는 목적으로 ‘매칭 알고리즘 matching algorithms’도 활용했다. 또 컴퓨터가 문서를 ‘읽어’ 데이터를 추출할 수 있는 ‘자연어 처리(natural-language processing)’ 기술을 미세하게 조정하기도 했다. 이런 시스템은 오류에 취약하기로 악명이 높다. 때문에 플랫아이언은 오류를 보완하기 위해 인간과 기계를 함께 동원하는 ‘하이브리드 학습 시스템’을 만들었다. 알기 쉽게 설명하자면 다음과 같다. 50명의 간호사를 고용, 500명의 환자에 대한 데이터를 수기로 적게 했다. 이를 통해 터너가 ‘훈련 세트(training set)’라고 부르는 자료를 만들어 자동 수집 데이터의 오류 감지에 이용할 수 있다. 일치하지 않는 부분은 시스템에 보고해 자동 수집 과정을 보완하는 데 활용했다. 진행 과정에서 정확성을 높이려는 가변적 시스템(dynamic system)인 셈이었다(물론 아직 이론에 불과하다).

플랫아이언이 이러한 도전을 시도한 최초의 곳은 아니었다. 비영리 전문가 집단인 미국 임상 종양 협(American Society of Clinical Oncology)에서도 지난해 캔서린큐 CancerLinQ라는 프로젝트를 발표했다. 임상 데이터베이스를 활용해 암 치료 효과를 높이고, 신약 개발 가속화 시스템을 개발하는 것을 목표로 한 프로젝트였디. 베테랑 컴퓨터 과학자 마티 테넌바움 Marty Tenenbaum도 캔서 코먼스 Cancer Commons라는 비영리 프로젝트를 통해 종양학 임상 데이터의 표준화는 물론 무료 제공을 목표로 하고 있다. IBM 경우에도 메모리얼 슬론 케터링 Memorial Sloan Kettering 같은 암 센터와 이미 협력을 시작했다. 자사의 인공지능 시스템 왓슨 Watson을 통해 수백만 건에 이르는 임상 데이터 기록, 언론 기사 내용, 임상시험 보고서 등을 분석하고 환자에 맞는 치료법을 의료진에게 자동으로 제시하려 하고 있다.

이보다 앞서 시작한 프로젝트들은 안타깝게도 실패하거나 아직까지 긍정적인 결과를 거두지 못하고 있다(이 중에는 5억 달러라는 막대한 자금을 투입한 미국 국립 암 연구소(National Cancer Institute)의 생물정보학 프로그램 카빅 caBIG도 있다). 그러나 캔서린큐의 자문위원장을 맡고 있는 애버네시-다른 임상 종양학 데이터 디지털화 프로젝트에도 참여하고 있다-는 플랫아이언이 데이터의 복잡성 자체에 주목한 점이 인상적이었다고 평가했다. 그녀는 “터너와 와인버그가 ‘기술만으로 이 문제를 풀려고 하면 결코 성공할 수 없다’는 사실을 분명히 이해하고 있었다”며 “바로 그 때문에 내가 플랫아이언에 협조하기로 한 것이다”라고 말했다.

구글 벤처스의 투자로 플랫아이언은 신뢰뿐만 아니라, 종양 치료 목적 EMR 서비스 개발업체 알토스 솔루션스 Altos Solutions도 손에 넣을 수 있었다. 플랫아이언은 알토스 솔루션스-구글에서 그리 멀지 않은 캘리포니아 마운틴 뷰 Mountain View에 본사가 있다-를 인수하면서 좀 더 탄탄한 기반을 갖추게 되었다. 아울러 의사들과도 좀 더 밀접하게 공조할 수 있게 되었다. 그 결과 이젠 매년 총 30만 명의 환자를 치료하는 210개의 암 센터가 플랫아이언의 시스템을 사용하고 있다. 대부분은 지역 종양 클리닉이지만, 거기에는 예일 뉴 헤이븐 Yale-New Haven의 스밀로우 암 병원(Smilow Cancer Hospital)이나 펜실베이니아 대학교 에이브럼슨 암 센터(Abramson Cancer Center) 같은 대규모 연구 기관도 있다. 구글이 플랫아이언에 투자한 이유 중 한 가지는 전망이 밝은 분야에서 한시라도 빨리 결과를 내기 위해서였다. 구글 벤처스의 대표 빌 마리스 Bill Maris는 “디지털 의무기록을 폭넓게 활용하기 위해 한 세대를 더 기다려야 하는 상황을 극복하려 한다”면서 “수많은 사람의 골칫거리와 고통을 덜어주고 싶다”고 강조했다.

캘리포니아 반대편 미국 동부로 가면, 숲이 무성한 롱 아일랜드 교외에 포트 제퍼슨 Port Jefferson이라는 곳이 있다. 이곳의 평범한 저층 건물에 사무실을 둔 제프리 바치카 Jeffrey Vacirca 박사도 플랫아이언의 목표에 매료됐다. 그는 수년 동안 알토스의 EMR 시스템을 사용하면서 환자 치료에 이미 도움을 받았지만, 그 잠재력은 아직 다 드러나지 않았다고 주장했다. 바치카는 “방대한 데이터가 존재하지만 이를 정리할 사람도, 데이터의 의미를 아는 사람도 없다”며 “그렇기 때문에 플랫아이언의 역할이 중요하다. 평가 및 분류 대상이 될 수백만의 환자들로부터 흩어져 있는 데이터와 치료 결과를 추출하면 실제로 효과적인 치료방법을 찾을 수 있다”고 말했다. 바치카 박사는 이어 플랫아이언의 시스템을 “암 치료를 위한 인프라”라고 평가했다. 그는 플랫아이언의 시스템을 이용, 특정 암에 대한 자신의 치료방법이 지체되는 부분을 찾아내고 이를 수정할 것이라고 말했다. 그는 임상 시험에 적절한 환자를 더 많이 찾아낼 수도 있을 것이다.

그는 “환자 데이터를 5배 더 빠르게 축적할 수 있다면 얼마나 많은 치료제가 승인 절차를 통과할 수 있겠는가”라고 반문하기도 했다. 하지만 이 분야의 선구자 몇몇은 빅데이터의 장밋빛 전망이 기나긴 암과의 싸움을 돌아봤을 때 긍정적이지 않다고 생각한다. 초창기부터 연구에 몸담았던 로버트 와인버그 Robert Weinberg(잭 와인버그와는 관계가 없다)는 최근 과학잡지 셀 Cell에 기고한 글에서 빅데이터와 암 사이에 순탄치 않았던 관계에 대해 지적한 바 있다. MIT의 화이트헤드 생체의학연구소(Whitehead Institute for Biomedical Research)의 창립회원인 그는 “단백질 간 상호작용부터 종양의 유전적 변이에 이르는 데이터가 폭발적으로 증가하면서 연구자의 해석능력을 넘어서게 되었다”고 말했다. 후에 그는 포춘과의 인터뷰에서 “생물정보학에 사로잡힌 사람들이 있다”며 “데이터를 축적한 후 그 데이터만을 이용해 과거에 불가능했던 높은 수준의 통찰력을 얻을 수 있다고 확신하는 사람은 나에게 설득력이 없어 보인다”고 지적하기도 했다.

와인버그는 설사 데이터를 통해 몇몇 치료방식에서 개선점을 찾아낼 수 있더라도, 의사가 치료방법을 바꿀 정도로 그 영향력이 크진 않을 것이라 덧붙였다. 그는 “그동안 담대한 시도도 많았고 장밋빛 전망도 넘쳐났지만, 투입한 노력에 비하면 얻은 것이 별로 없다”고 주장하기도 했다. 스탠퍼드에서 의료 및 보건 연구와 정책을 가르치는 존 이오아니디스 John Ioannidis는 와인버그에 비해선 관대한 평가를 내리지만, 그렇다고 긍정적이지는 않다. 그는 “집중형 시스템을 통해 환자가 어떤 치료를 받았는지 정리할 수 있다면 병원에서 이뤄지는 암 치료방법의 불일치성을 줄일 수도 있다”고 주장했다. 하지만 이오아니디스는 철저한 통제가 이뤄지는 임상시험에 의한 데이터 수집이 아니라면 큰 진전을 이루기가 쉽지 않을 것이라고 생각하고 있다. 그는 “임상시험 설계절차 없이 수집된 막대한 데이터를 통해 얼마나 많은 것을 얻을 수 있을지 불분명하다”고 지적했다.

터너와 잭 와인버그는 반대자들을 하루아침에 설득할 수 있으리라고 생각하지 않는다. 하지만 꾸준히 늘고 있는 플랫아이언 고객들과 두 청년은 ‘스마트 데이터’ 방식이 암환자에게 더 나은 치료법을 제시해 줄 것이라고 믿고 있다. 애버네시는 무엇보다 우수한 대학병원과 지역병원의 격차를 줄이는 데 도움이 될 것이라고 말했다(보통 우수한 대학병원의 치료법이 지역병원보다 더 좋은 결과를 내는 경우가 많다).

한편 공동설립자 와인버그는 플랫아이언이 암과의 길고 힘든 싸움을 하는 중이라고 말하면서 “플랫아이언은 원대하고 대범한 목표를 내세워 설립한 지 2년 된 회사다. 첫 단추는 상당히 잘 끼웠지만, 이 문제는 결국 수십 년에 걸쳐 해결해야 한다”고 말했다.



관련기사



FORTUNE
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기