카카오(035720)의 인공지능(AI) 자회사 카카오브레인은 흉부 엑스레이 판독문에서 특정 병명을 추출하는 소스코드(해설서)를 개발자들의 온라인 오픈소스 플랫폼인 깃허브(Github)에 공개했다고 19일 밝혔다.
이 코드는 자연어로 작성된 판독문을 입력하면 골절 및 기흉 등 13개 병명에 대한 양성·음성 여부를 알려준다. 카카오브레인에 따르면 이 코드는 타사 모델(약 76%) 대비 현격히 높은 정확도인 90.39%를 기록했다.
이번 코드 공개는 글머리 기호 형식 등 정리되지 않은 자연어로 작성된 판독문에서 특정 병명을 추출하는 연구 개발 프로젝트 ‘레이블러 프로젝트’의 일환이다. 이번 프로젝트는 의료 진단 업무 개선에 기여하고자 기획됐다.
김일두 카카오브레인 각자 대표는 “많은 연구자들이 카카오브레인의 레이블러 프로젝트를 테스트 벤치마크로 활용할 수 있도록 직접 제작한 테스트 셋을 공개할 예정”이라며 “자사의 언어 모델을 활용하고, 흉부 엑스레이 데이터를 추가로 학습 시키는 등 레이블러 프로젝트의 성능을 더욱 향상시킬 계획”이라고 전했다.