특허청은 21일부터 미국 특허공보에 대한 한글번역문데이터를 국내·외 특허데이터 개방 플랫폼인 키프리스플러스(KIPRISPlus)를 통해 민간에 무료로 개방한다고 20일 밝혔다.
이번에 개방하는 데이터는 미국특허청이 1974년부터 2022년 10월까지 발간한 미국 특허공개공보와 등록공보에 대한 한글번역문 총 1480만 건이다. 개방된 데이터를 활용하면 우리 국민과 기업들은 영어로 된 방대한 미국 특허공보를 한글로 쉽게 검색해 볼 수 있고, 가치평가 등 특허분석에도 활용할 수 있다. 또 지식재산 관련 기업들은 미국 특허데이터를 활용한 서비스를 개발함으로써 새로운 부가가치를 창출할 수 있을 것으로 기대된다.
이번 데이터는 특허청이 2021년 자체 개발한 인공지능(AI) 영한 번역시스템을 활용해 구축한 것이다.
특허청은 AI가 특허 분야의 어려운 전문용어와 문장구조를 잘 이해해 번역할 수 있도록 특허공보와 심사·심판 문서 등에서 데이터를 구축·학습시켜 번역품질을 지속적으로 개선해 왔다.
이번 데이터 개방은 지난해 12월 유럽 특허공보 한글번역문 데이터(500만 건) 개방에 이은 두 번째다. 내년에는 중한 AI 번역시스템을 활용해 중국 특허문헌에 대한 한글번역문 약 3800만 건도 구축해 개방할 예정이다.
또 순차적으로 일한 AI 번역시스템도 개발해 약 2600만 건에 달하는 일본 특허문헌에 대한 한글번역문도 구축해 개방해 나갈 계획이다.
김기범 특허청 산업재산정보국장은 “특허청은 누구나 전 세계 특허정보를 언어장벽 없이 한글로 쉽고 편리하게 검색해 활용할 수 있도록 노력할 것이며, 앞으로 AI 번역시스템을 더욱 발전시켜 개방하는 데이터의 범위와 품질도 지속적으로 높여 나갈 것”이라고 말다.