산업 IT

글로벌 코로나 연구? AI 의학 전문 번역만 있으면 '이상 無'

생물의학 정보에 특화된 번역 모델 개발




백신 개발 등 신종 코로나바이러스 감염증(코로나19)과 관련된 다양한 의학적 연구들이 시작된 가운데 이들의 연구를 도와줄 번역 모델이 등장했다. 코로나19가 한국, 독일, 이탈리아, 미국 등 전 세계로 확산한 만큼 연구에 필요한 정보도 여러 언어로 작성돼 이를 통합하는 것조차 어려웠는데 해당 번역 모델이 연구의 효율성을 높여줄지 관심이 집중된다.

10일 정보기술(IT) 업계에 따르면 네이버랩스유럽(NLE)과 네이버 AI 통번역 서비스 ‘파파고’가 코로나19 관련 정보를 더 정확하게 파악해 연구할 수 있는 ‘다국어 및 다중 도메인 번역 모델’을 개발했다. 이는 인공지능(AI)이 스스로 빅데이터를 학습해 번역하는 최신 통·번역 모델로, 한국어·프랑스어·독일어·이탈리아어·스페인어 등 5개 언어로 된 생물 의학 정보를 영어로 번역해준다.

‘Medical’ 태그 하나로 번역 정확도 UP
해당 AI 번역 모델의 가장 큰 특징은 생물 의학 정보를 더욱 정확하게 번역하도록 생물 의학 관련 문장에 ‘Medical(의학)’ 태그를 적용해 학습했다는 점이다. 일반적으로 사용되는 번역 모델은 특정 분야에 전문화되어 있지 않기 때문에 생물의학 용어들을 정확하게 번역하는 데 한계가 있다. 예를 들어 ‘high temperature(고온)’이란 영단어를 독일어로 번역할 때 이것이 기상학 단어인지 의학 단어인지에 따라 각각 ‘hohe Temperatur(고온)’나 ‘Fieber(열)’로 다르게 번역될 수 있다. 하지만 특정 단어나 문장이 생물 의학과 관련된 것인지 여부를 번역 모델 자체에 적용하면 이런 문제가 없다. NLE 연구 결과에 따르면 ‘항암제’가 포함된 문장을 번역하고자 할 때 일반 번역 모델에서는 항암제가 ‘drugs(약)’로 번역되지만 ‘Medical’ 태그가 적용되면 ‘다국어 및 다중 도메인 번역 모델’에서는 이를 ‘anti-cancer drugs’로 번역한다.

일반 번역 모델과 네이버의 ‘다국어 및 다중 도메인 번역 모델’로 한국어 문장을 번역한 결과 차이. 왼쪽부터 한국어 문장, 일반 번역 결과, ‘medical’ 태그가 붙은 번역 결과./네이버랩스유럽블로그캡처일반 번역 모델과 네이버의 ‘다국어 및 다중 도메인 번역 모델’로 한국어 문장을 번역한 결과 차이. 왼쪽부터 한국어 문장, 일반 번역 결과, ‘medical’ 태그가 붙은 번역 결과./네이버랩스유럽블로그캡처


사용자 입장에서는 생물의학 태그 선택 여부에 따라 같은 문장에 대해 다른 번역 결과를 얻을 수 있다. 생물의학 태그를 선택하면 이에 최적화된 번역 결과를, 선택하지 않으면 일반 번역 모델의 결과를 얻는 것이다. 해당 번역 모델을 개발한 연구진은 “현재 축적되고 있는 코로나19에 대한 방대한 양의 디지털 정보가 수백 개 연구 프로그램의 기초가 될 것”이라며 “누구나 해당 번역 모델을 다운로드 해 이용할 수 있다”고 밝혔다.


한 모델로 5개 언어를 번역
아울러 일반적으로 각 언어별로 번역 모델이 필요한 것과 달리 ‘다국어 및 다중 도메인 번역 모델’은 하나의 모델로 5개 언어를 영어로 번역할 수 있어 데이터 저장 용이성과 안정성, 효율성을 높였다. 연구진은 “현재 가장 성능이 좋은 이중 언어 모델(bilingual model)과 번역 품질도 비슷하다”며 “한국어와 이탈리아어처럼 상대적으로 학습 데이터가 적은 언어 번역에 유용하다”고 설명했다.

관련기사



신중휘 네이버 파파고 리더는 “파파고만이 가진 강점을 활용해 언어적 차이를 넘어 전 세계 사람들이 원활히 소통할 수 있도록 해당 모델을 개발했다”면서 “차별화된 기술을 바탕으로 하는 우리의 노력이 향후 경제, 위기관리, 공중보건 등 다양한 분야의 연구 활동에 활용되는 데에 보탬이 되고자 한다”고 말했다.

이밖에 네이버는 코로나19로 변화한 근무환경에 맞춰 실시간 화상회의 시 활용할 수 있는 통번역 서비스도 개발 중이다. 우선 한국어와 일본어에 대해서만 개발을 진행했고, ‘파파고 밋(가칭)’이라는 이름으로 최근 사내에 공개됐다. 참석자들이 모바일 앱에서 한국어나 일본어로 말하면 실시간으로 상대방의 언어로 번역된 내용이 화면에 나오는 방식이다.


백주원 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기