지난 2015년 개봉한 영화 ‘엑스 마키나’에서 유능한 프로그래머인 칼렙은 치열한 경쟁 끝에 인공지능(AI) 개발자 네이든의 새 프로젝트에 참여한다. 비밀 연구소로 초대받은 칼렙은 네이든이 창조한 매혹적인 AI로봇 에이바를 만나고 로봇의 인격과 감정이 진짜인지 아니면 프로그래밍된 것인지 밝히는 테스트를 진행한다. 하지만 점점 에이바도, 네이든도, 심지어 자신의 존재조차 믿을 수 없을 정도로 모든 것을 의심하게 되는데….
‘엑스 마키나’ 외에 AI를 소재로 한 영화나 드라마는 많다. ‘마이너리티 리포트’와 ‘퍼슨 오브 인터레스트(미드)’는 AI 기반으로 빅데이터를 분석해 범죄를 예측하는 내용이다. ‘허(Her)’에서는 사람처럼 대화할 수 있는 AI와 사랑에 빠지고 ‘아이언맨’에는 자비스로 불리는 AI 비서가 등장한다. 국내에서도 인간과 대화가 가능한 AI로봇을 소재로 한 ‘너도 인간이니(KBS 드라마)’가 방영된 적이 있다.
영화나 드라마의 AI비서나 인간형로봇처럼 하려면 음성인식, 자연어 이해(NLU), 음성 합성의 세 가지 기술이 필요하다. 이때 미디어(텍스트·음성·동영상), 시계열(각종 센서 측정값), 염기서열(DNA) 등 관측값 사이에 시공간 순서가 있는 서열형(sequential) 빅데이터가 쏟아지는데 이를 잘 처리하는 것이 관건이다. 교통 흐름이나 사람의 맥박, 음파를 주고받는 음성, 경제지표, 주식이나 비트코인 가격 등 시간에 따라 계속 생기는 빅데이터는 매우 많다. 특히 관측값 사이의 ‘의존성’을 고려해야 하는데 일반 빅데이터의 고속처리를 위해 사용되는 병렬처리 기술이 직접 적용이 어렵다는 문제가 있다.
스스로 학습해 일정한 규칙 제시
세계 첫 유전자가위 효율 예측
스마트폰·자율차서 동작하는
‘온디바이스AI’ 개발에도 가속
과학기술정보통신부가 주최하고 한국연구재단·서울경제신문이 공동 주관하는 ‘이달의 과학기술인상’ 8월 수상자인 윤성로 서울대 전기정보공학부 교수가 연구하는 분야가 바로 서열형 빅데이터를 정밀분석하는 AI 기술이다. 서열형 빅데이터는 과학기술, 사물인터넷(IoT), 헬스케어, 스마트팩토리, 핀테크 등 다양한 분야에서 생성되나 방대한 데이터에 존재하는 잡음 때문에 효과적으로 정보를 추출하는 데 애로가 컸다. 윤 교수는 “최근 발표된 구글 듀플렉스 사례처럼 음성인식과 음성합성 등 일부 AI 기술은 상당 부분 진전된 상태이나 자연어 이해 등 고차원적 지능이 필요한 부분은 현재 AI 수준이 사람에게 크게 못 미쳐 지속적인 연구개발이 절실하다”고 지적했다.
윤 교수는 딥러닝과 머신러닝에 기반한 서열형 빅데이터의 표현형 학습, 상호작용 학습, 서열형 동적 그래프 전이 학습 등 빅데이터를 스스로 학습하고 일정한 규칙을 찾아 제시할 수 있는 새로운 AI 기술을 제시했다. 이를 바탕으로 삼성전자·SK하이닉스·현대자동차 등 글로벌 반도체, 정보기술(IT), 자동차 기업들과 함께 스마트폰이나 자동차에서 동작하는 AI를 구현하기 위한 ‘온디바이스 AI(on-device AI)’ 기술에 박차를 가하고 있다. 그는 “대용량 서버 같은 대규모 시스템뿐 아니라 스마트폰·자율주행차 등 모바일기기에서 동작하는 AI를 구현하기 위한 연구를 진행하고 있다”며 “일상생활에서 생성되는 서열형 빅데이터의 효율적 처리를 위해서는 모바일기기에서 동작하는 AI를 만드는 것이 매우 중요하다”고 말했다.
최근에는 AI 기술을 바탕으로 유전자가위의 효율을 예측할 수 있는 기술을 세계 최초로 개발해 정확도를 획기적으로 향상시켰다. 그는 “유전자·의료영상이나 의무기록 등도 서열형 빅데이터의 사례로 바이오·헬스케어에서 AI의 역할이 커지고 있다”고 소개했다.
IBM의 AI 서비스 ‘왓슨’의 성능을 개선하기 위해 질의응답 생성 시스템과 사용자 음성을 제3자 음성으로 변환하는 음성 합성·변환 기술을 개발하고 후속 연구도 진행하고 있다. 왓슨을 학습시키기 위해 끊임없이 문답이 가능하게 만든 것이다. 윤 교수는 보이스피싱 등을 탐지할 수 있는 ‘안티스푸핑(anti-spoofing)’ 기술도 마이크로소프트(MS)와 공동 개발하고 있다. 이 기술이 완성되면 보이스피싱인지 아닌지를 AI가 판단해준다.
과학·금융·생명 등에서 축적 기술
학문·산업 발전에 크게 기여할 것
현재 구글의 듀플렉스 AI 기술은 미용실이나 음식점에서 사람이 아닌 AI가 예약전화를 무난히 소화할 수 있을 정도로 진화했다. 상대방이 사람인지 기계인지 거의 구분하지 못할 만큼 발전하고 있다. 음성이나 텍스트 등 자연어를 처리하고 음성합성 기술을 활용해 AI가 사람처럼 말하게 된다.
윤 교수는 “서열형 빅데이터가 과학, 공학, 의·생명, 금융, 경제 등 다양한 분야에서 지속적으로 생성되고 있어 새로운 AI 기술이 학문과 산업 발전에 크게 기여할 것”이라라며 “국내 연구기관과 기업의 경쟁력을 높이고 새로운 기술과 서비스 창출에 기여할 것”이라고 밝혔다. /고광본 선임기자 kbgo@sedaily.com