사회 사회이슈

투블럭에이아이, 한국어 심층언어이해와 생성모델 HanBART 공개해

한국어의 특성을 딥러닝에 접목…비상업적 연구시 누구나 사용 가능











자연어 처리 전문 AI 벤처 기업인 (주)투블럭에이아이는 페이스북의 BART 모델에 대응하는 한국어 버전인 HanBART를 공개한다고 밝혔다. 지난해에는 구글 BERT 모델의 한국어 버전인 HanBERT를 공개한 바 있다.

이번 공개로 비상업적인 연구나 교육, 그리고 경진대회에서 사용할때는 누구나 오픈소스 공개 사이트나 회사 홈페이지를 통해 HanBART를 무료로 다운로드 받아 기계번역, 자동요약, 문제생성, 챗봇대화 등의 개발에 사용할 수 있다.

이번에 공개된 HanBART는 한국어의 특성을 딥러닝에 접목시켰고, 이미 공개한 HanBERT의 학습 결과를 재활용하는 기술을 적용하였으며 관련 특허 출원도 진행하였다고 회사 관계자는 말했다.


사람이 언어를 사용할 때에는 다른 사람의 말이나 글을 이해하는 부분과 자신의 생각을 말이나 글로 다시 생성하는 부분이 필요한데, 기존 BERT 모델이 언어 이해 위주였다면 문장 생성 기능이 추가된 모델이 BART 모델이다.

관련기사



즉 BART모델은 구글에서 발표한 트랜스포머 모델을 페이스북이 발전시켜 언어이해와 생성이 동시에 가능하도록 개선한 모델이다. 주요 활용처는 기계번역, 자동요약, 문제생성, 챗봇대화 등으로 그 동안 언어이해만 가능했던 BERT모델과 언어생성까지 가능한 GPT 모델이 연결된 형태이다.

투블럭에이아이는, 과학기술정보통신부 주최의 인공지능 온라인 경진대회에서 3년 연속 우수기업으로 선정이 되어 사업화 지원을 받았다.

투블럭에이아이 조영환 대표는 “정부의 AI 사업화 지원을 받은 결과물을 AI 연구자들에게 공유하는 것이 당연하다” 고 말했다.

KAIST 박사 출신의 조영환 대표가 설립한 투블럭에이아이는 AI 영역 중 자연어처리에 집중하는 회사이다. 지난해 HanBERT와GPT-2를 개발하여 보유하고 있고 이를 필요로 하는 기업들에 자연어 처리 솔루션 제공 및 컨설팅을 하고 있다.

회사 관계자는 “기존에 보유하던 HanBERT에 기반한 자연어 이해 능력 솔루션에 더해 이번에 공개한 HanBART를 통해 자연어 생성 솔루션을 한층 더 강화하게 되었다”며 “ 앞으로도 자연어 처리 분야에서 독보적인 기술력으로 시장에 새로운 솔루션을 계속 공개할 계획”이라고 전했다.




김동호 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기