홈 산업 IT

튜링테스트의 허와 실

입력2014.10.21 14:22:21 수정 2014.10.21 14:22:21

facebook twitter kakao email 복사

뉴스듣기 가 저장

Subjective Measures<br>“우리는 온라인에서 대화를 나누고 있는 상대방이 실제 인간이라는 전제를 깔고 대화하는 경향이 있습니다.”

지난 6월 로봇공학계가 발칵 뒤집히는 사건이 있었다. 러시아의 프로그래머 블라디미르 베셀로프와 우크라이나 출신의 유진 뎀첸코가 공동 개발한 채팅로봇 ‘유진 구스트만(Eugene Goostman)’이 영국 왕립학회에서 열린 튜링테스트를 통과한 것이다. 튜링테스트는 천재수학자로 불리는 앨런 튜링이 1950년 제안한 인공지능(AI) 컴퓨터 판별 테스트다. 5분간 온라인 채팅을 한 뒤 심사위원의 30%가 인간인지, AI인지를 구분하지 못하면 합격 판정을 받는다.

당시 유진은 자신을 우크라이나에 사는 13세 소년이라 소개하고 채팅을 나눴는데, 33%의 심사위원이 진짜 인간으로 판단해 64년 만에 처음으로 튜링테스트를 통과하는 기염을 토했다. 며칠 뒤 AI 연구자들이 유진은 인간의 대화를 저장해놓은 데이터베이스에서 적당한 문장을 찾아 시뮬레이션 한 것에 불과하다면서 인지능력을 갖춘 AI로 볼 수 없다고 비판하기는 했지만 말이다.

이와 관련 뉴욕대학의 컴퓨터 공학자 어니 데이비스 박사는 이런 평가를 내놓았다.
“사람들은 생각보다 쉽게 속아요. 대화 상대방이 실제 인간이라는 전제를 깔고 대화를 나누는 경향이 있기 때문입니다.”

게다가 채팅로봇은 사고능력의 결여를 산만함으로 위장하곤 한다. 예컨대 세계적인 미래학자 레이 커즈와일은 유진에게 이런 질문을 던졌다.
“구슬 2개가 담긴 접시에 구슬 2개를 더 넣으면 접시에는 총 몇 개의 구슬이 있을까?”

관련기사

유진의 대답은 이랬다. “너무 많지는 않네. 정확한 수는 말하기 어려워. 잊어버렸거든. 그리고 너는 지금 사는 곳이 어디인지 아직 내게 말해주지 않았어.”

이를 감안할 때 튜링테스트는 인간의 멍청함을 드러낼 뿐 기계가 인간과 동일한 수준의 지능을 갖췄음을 입증하는 수단으로는 부적합해 보이는 게 사실이다. 그 때문인지 일부 전문가들은 이제 더 이상 튜링테스트 같은 AI 판별 도구가 필요 없다고 주장한다. 학계에 나름의 기준이 있는 만큼 그에 맞춰 발전하도록 놔두면 된다는 것이다.

하지만 필자의 생각은 조금 다르다. 튜링테스트는 그동안 대중들의 상상력과 창의력을 자극해 기술혁신을 이루는데 일조했다. 튜링테스트에 문제가 있다면 제대로 된 새로운 AI 판별 도구를 만들어서 긍정적 효과를 이어가는 것이 바람직하다고 본다. 앞으로도 AI 컴퓨터들은 유연한 임기응변적 사고를 요하는 다양한 과제들을 풀어내야 하는 시험에 직면하게 될 것이다.

과연 언제쯤 컴퓨터가 처음 본 영화의 내용을 정확히 전달할 수 있을까. 혹은 인간의 단도직입적 질문에 단도직입적으로 대답하거나 인간 언어의 미묘한 뉘앙스를 이해할 수 있을까. 그런 컴퓨터가 나타나면 유진 구스트만과 같은 단순한 잔재주를 뛰어넘어 진정한 ‘생각하는 기계’로서 인정받을 수 있을 것이다.

8.5%
활발히 활동하는 트위터 계정 가운데 로봇이 글을 올린다고 추정되는 계정의 비율.
출처: 미국증권거래위원회

파퓰러사이언스

네이버메인에서 서울경제 구독