흉부X선 영상판독, AI가 의사보다 한 수 위

박창민 교수팀·루닛 공동개발 SW
응급실 실전 테스트서 실력 입증
폐렴·폐부종 판독 민감도 82~89%
영상의학과 레지던트 66%보다 월등

흉부 X레이 영상으로 폐 등에 이상이 있는지를 수 초 만에 알려주는 국산 인공지능 소프트웨어(AI SW)가 응급실 환자를 대상으로 한 성능검증 시험에서 영상의학과 레지던트보다 한 수 위의 폐질환자 선별능력을 입증했다.

이 AI SW는 박창민 서울대병원 영상의학과 교수팀과 루닛이 공동개발해 최근 식품의약품안전처로부터 품목승인을 받은 ‘루닛 인사이트-흉부방사선용’.

흉부 X레이 사진(왼쪽)에서는 폐렴 병소가 잘 보이지 않아 의사들이 놓치기 쉽다. 반면 인공지능 소프트웨어(AI SW)는 폐렴 병소(오른쪽 노란 화살촉 부분)를 특정해 보여준다. /사진제공=서울대병원

박창민·황의진 교수팀은 2017년 1~3월 응급실을 찾았다가 폐렴 등 호흡기질환이 의심돼 흉부 X레이 촬영을 한 환자 가운데 1,135명을 대상으로 AI SW와 당직 영상의학과 레지던트(전문의가 되기 위해 수련 중인 의사)의 판독 정확도 등을 비교분석했다.

그 결과 AI SW가 폐렴 등 흉부 병변을 병변으로 감별해내는 민감도가 82~89%로 레지던트(66%)보다 월등히 높았다. 레지던트가 AI SW의 판독 결과를 참고해 재판독했더니 민감도가 73%로 높아졌다.

폐암·폐결핵·폐렴·기흉 등 4대 흉부질환 스크리닝(진단보조)용으로 개발된 이 AI SW의 민감도는 4대 흉부질환 88~95%(레지던트 72%), 폐부종 등 기타 흉부질환 74~83%(레지던트 58%)로 집계돼 병변이 있는지 찾아내는 능력이 영상의학과 레지던트보다 한 수 위였다.


판독 민감도는 국소 폐이상 82~90%(레지던트 48%), 확산 폐이상 89~97%(레지던트 77%)은 꽤 차이가 났지만 흉막이상, 종격동이상은 별 차이가 없었다. 연령·성별 차이도 없었다.

흉부 X선 사진(왼쪽)에서는 폐암 병소가 잘 안 보여 의사들이 첫 판독에서 찾아내지 못하는 경우가 많다. 반면 인공지능 소프트웨어(AI SW)는 폐암 병소(오른쪽 노란 화살촉 부분)를 특정해 보여준다. /사진제공=서울대병원

다만 폐렴 등 병변이 아닌 것을 병변이 아니라고 판독하는 특이도는 AI SW(70~90%)보다 영상의학과 레지던트(98%)가 한 수 위였다. 레지던트들이 AI SW의 판독 결과를 참고해 재진단했더니 특이도는 오히려 94%로 소폭 낮아졌다.

박 교수는 “응급실 환자를 대상으로 AI SW와 레지던트의 영상 판독 정확도를 비교분석한 이번 연구는 선별된 환자가 아니라, 응급실을 찾게 된 원인이 무엇인지 모르는 환자들이 많은 임상 현장에서의 첫 비교검증에서 AI SW가 합격점을 받았다는 데 의미가 있다”며 “야간에 영상의학과 전문의 대신 레지던트가 당직을 서는 응급실이 많은데 AI SW가 보다 더 신속하고 정확한 흉부 X레이 영상 판독에 큰 도움을 줄 것”이라고 말했다.

그는 “초기 폐암에 비해 병변이 큰 폐렴·폐결핵과 기흉 병변은 폐암 결절에 비해 AI SW가 잘 찾아내는 편”이라며 “독감 증상이 있는 환자의 경우 독감 때문인지, 항생제를 써야 하는 폐렴 때문인지 구분하는 것이 중요한데 AI SW는 폐 흉곽에 생긴 이상 등을 토대로 폐렴으로 인한 독감 증상을 구별하는 데도 도움을 준다”고 덧붙였다.

흉부X레이는 국민건강검진 때도 기본적으로 찍기 때문에 저선량 컴퓨터단층촬영(CT)을 하지 않고도 폐암을 조기 진단할 수 있는 가능성도 높여 향후 파급 효과가 상당할 것으로 보인다.

이번 연구 결과는 의료영상 분야 국제학술지 ‘방사선학(Radiology)’에 발표됐다.
/임웅재기자 jaelim@sedaily.com


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>