사회 사회이슈

액션파워, 기록관리 AI 서비스 ‘다글로’ 성능 개선 모델 출시

액션파워(공동대표 조홍식, 이지화)가 성능을 크게 개선한 기록관리 AI 서비스 ‘다글로’의 새로운 모델을 출시하여 주목받고 있다.

‘음성기록 관리의 혁명’이라는 평가는 ‘다글로’는 현재까지 30만 이상의 회원에게 회의, 통화, 강의 영상을 텍스트로 변환하고 정리해주는 서비스를 제공해왔으며, 이번 모델 업그레이드는 업계 최고 수준의 성능을 자랑하며 다시 한번 음성기록 서비스의 한계를 뛰어넘는 면모를 보여주고 있다.

이번 성능 개선의 핵심은 크게 세 가지로 나뉜다. 첫 번째, STT(Speech-to-Text) 모델 자체의 크기를 확대해서 음성인식 정확도 자체를 100%에 가깝게 개선했다. 두 번째, VAD(음성 감지) 기능을 크게 높여서 여러 사람의 대화에서도 목소리를 정확하게 분리해 낸다. 마지막 세 번째로는 숫자와 영어 발음까지 명확하게 표시하도록 함으로써 ‘거의 완벽한’ 텍스트 변환에 가독성까지 높인 결과를 도출한다.


다글로는 한국어와 영어 음성변환에서 최고 수준인 동시에, 정교한 화자 분리까지 지원한다는 점에서 OpenAI의 Whisper와 격차를 더욱 크게 벌릴 수 있을 것으로 보인다.

관련기사



다글로 텍스트 변환 결과다글로 텍스트 변환 결과



액션파워는 ‘사람이 손대지 않아도 대화와 영상, 음성 기록이 알아서 정리되는’ 궁극적인 목표를 이루기 위해 지속적으로 다양한 기술을 적용하면서 사용성을 높이고 있다. 특히, 타 음성변환 서비스와의 가장 큰 차별점으로는 멀티모달(Multi-modal) 지원을 꼽을 수 있다. 대표적인 기능으로는 영상 파일을 업로드하거나 유튜브 링크를 붙여 넣으면, 바로 영상의 음성을 원고로 생성한다. 사용자의 편의성을 높이기 위해 크롬 확장 프로그램으로 다글로를 설치할 수 있으며, 이를 통해 유튜브 영상을 시청하면서 바로 다글로로 텍스트 변환을 할 수 있다. 특히, 긴 영상에서 빠르게 중요한 부분만 파악하고 싶거나 강의 영상을 원고로 함께 보기 원하는 사용자들이 많이 사용하고 있으며, 변환 결과는 일반 문서 파일뿐 아니라 자막 파일로도 바로 다운로드할 수 있다.

다글로 측은 상반기 마지막 업데이트 예정인 기능은 통화 내용을 바로 텍스트로 변환하고 보여주는 기능이라고 설명했다.

이에 이지화 공동대표(CTO)는 “이 많은 기능들은 AI의 가치에 대한 명확한 철학과 강력한 기술역량으로부터 나온다. AI는 인간의 시간과 노력을 아껴준다는 점에서 가치가 있다. 신기하고 재미있는 유행이 아니라, 진짜로 사람에게 도움이 되는 기술에만 집중하고 있다. 감당할 수 없이 많은 정보와 대화들이 오가는 이 세상에서 다글로가 제공하는 ‘정리’라는 가치는 그래서 중요하다”는 신념을 밝혔다.

다글로 지하철 광고 이미지다글로 지하철 광고 이미지


한편, 다글로 관계자는 “이제 액션파워의 목표는 개발 막바지 단계인 자체 LLM 상용화에 맞춰져 있다. 지금 다글로는 원고를 생성하고 키워드를 뽑아주고 요약을 해준다. 그리고 앞으로는 회의 후 실행할 일들과 다음 일정까지 정리해서 알려주고, 영상에서는 가장 많이 시청된 부분만 따로 뽑아서 요약해 줄 것이다. 다글로는 우리 모두의 일상을 위한 진짜 ‘AI assistant(조수)’로 성장하고 있다”고 전했다.




김동호 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기