산업 IT

'딥러닝' 기술로 진화한 인공지능… 빅데이터 만나 인간 두뇌 넘본다

딥러닝 관련 일반 이미지
DeepFace3
페이스북이 딥러닝 기술을 적용해 만든 얼굴인식 알고리즘 '딥페이스'가 미국 헐리우드 영화배우 실베스타 스텔론의 얼굴을 인식하는 모습. 사진 속에서 얼굴을 인식한 뒤 눈, 코, 입, 눈썹 등 특징을 형상화해 데이터로 기억했다가, 동일한 인물의 사진이 입력되면 이를 활용해 '실베스타 스텔론'임을 알아 맞춘다. /출처=페이스북
이미지를 문장으로
컴퓨터가 딥러닝 기술로 사진 속 상황을 문장으로 풀어낸 것. 심층 나선형 신경망(Deep CNN)이 이미지 속 요소를 파악해 이를 순환형 신경망(RNN)을 통해 언어로 변환, '사람들이 시장에서 물건을 고르고 있다', '채소들이 좌판에 많이 있다' 등의 문장으로 풀어낸다. /출처=구글

기존 인공신경망 기술서

'비지도학습' 방식 통해 스스로 정보 분석·판단

딥러닝 기술로 탈바꿈

방대한 데이터 활용하고 그래픽·음성인식 더해져

인간 판단능력 버금가


인간을 흉내 내는 것인가, 아니면 인간을 뛰어넘는 중인가. 구글이 개발한 인공지능(AI) 프로그램 '알파고'와 이세돌 9단과의 대국을 계기로 인공지능의 정체가 무엇인지, 그 진화 과정은 어떠한지에 대한 관심이 높아지고 있다. 사실 인공지능은 1950년대에 처음 고안될 정도로 역사가 오래된 기술이다. 하지만 사물의 특징을 컴퓨터가 스스로 파악하는 수준까지 알고리즘이 진화하고 컴퓨터 판단의 근간인 방대한 양의 데이터(빅데이터)가 접목되면서 인공지능은 최근 20~30년 동안 인간의 판단능력에 버금가는 수준으로 거듭났다. 김진형 소프트웨어정책연구소장은 "컴퓨터가 참고할 수 있는 데이터의 양이 어마어마해지면서 인공지능의 '파워' 역시 커졌다"고 말했다.

알파고처럼 컴퓨터가 알고리즘을 기반으로 데이터를 분석해 특정 결과를 내놓는 인공지능 기술이 딥(deep)러닝이다. 딥러닝은 기계가 데이터를 스스로 학습하는 기술인 머신러닝(machine learning·기계학습)의 한 종류이며 인간 뇌의 신경망을 모방해 작동원리로 삼는 것이 특징이다. 딥러닝의 전신은 인공신경망(artificial neural network)이라는 기술로 인공신경망은 뇌의 뉴런(신경계의 단위)과 유사한 정보 입출력 계층, 또 복수의 은닉 계층을 활용해 데이터를 학습한다.

인공신경망으로 인간 뇌의 복잡성을 부분적이나마 컴퓨터에 이식하는 데 성공했지만 알고리즘 자체가 너무 복잡해 최적 값을 내기 어렵다는 것이 문제였다. 고도화한 컴퓨터 기술이라도 엉뚱한 결과 값을 내놓는다면 무용지물에 불과하다.

무용지물이 될뻔한 인공신경망은 지난 2006년 캐나다 토론토대의 제프리 힌턴 교수가 비지도학습(unsupervised learning) 방식을 고안하면서 현재의 딥러닝으로 탈바꿈한다. 이전까지는 인간이 직접 '사과는 빨간색의 동그란 물체' '상자는 네모난 육면체'라는 식의 '정의된' 정보를 컴퓨터에 입력하는 '지도학습'이었다면 비지도학습은 특정하게 정의되지 않은 채 사과와 상자의 특징을 모두 입력한 뒤 컴퓨터가 알아서 구별하게끔 하는 식이다. 이를 통해 컴퓨터는 입력된 정보 간 상관관계를 분석해 비슷한 것끼리 묶는 훈련을 하게 되고 자연스럽게 정보 선택 능력을 갖게 되는 것이다. 알파고에도 바둑 전문가의 지도학습과 알파고 스스로의 비지도학습이 모두 적용됐다. 이에 더해 최근에는 대상의 특징 자체를 컴퓨터가 추출하는 나선형 신경망(convolutional neural network) 기술까지 도입됐다. '빨갛고 동그랗다'는 사과의 특징을 아예 컴퓨터가 파악하는 것이다.

판단 능력이 월등해진 딥러닝은 빅데이터라는 촉매를 만나 괄목할 만한 성장을 거둔다. 국내 인공지능 기술 스타트업인 클디(Cldi)의 백승욱 대표는 "빅데이터는 딥러닝 같은 다층 구조의 신경망이 정보를 일반화하는 능력을 최대한으로 끌어올릴 수 있다"며 "알고리즘을 개선하는 것보다 빅데이터가 오히려 딥러닝의 성능을 더욱 향상시키는 요인"이라고 말했다.

고성능의 그래픽 처리장치인 GPU(Graphics Processing Units)의 범용화 역시 딥러닝 진화에 한몫했다. 사진 속 그래픽의 계산속도를 단축해주는 장치인 GPU가 이제는 스마트폰에 들어갈 정도로 활용 폭이 넓어졌고 컴퓨팅 시간은 과거와 비교해 수십 분의 일까지 줄어들었다.

빅데이터와 딥러닝, 높아진 컴퓨팅 성능의 조합은 눈부신 성과를 나타내고 있다. 최근에는 컴퓨터가 사진 이미지로 사물을 인식하는 데 95%가 넘는 정확도를 기록할 정도로 수준이 높아졌으며 사진 자체를 해석해 이를 문장으로 만들어내는 기술까지 나온 상태다.

음성인식 역시 딥러닝 알고리즘이 성능을 크게 개선한 분야 중 하나다. 음성을 듣는 것만으로 누구의 목소리인지 알아맞히는 확률이 95% 수준까지 뛰어오른 것이다. 삼성전자의 S보이스(Voice)를 비롯해 애플 아이폰의 음성인식 인공지능 '시리(Siri)', 마이크로소프트(MS)의 코타나(Cortana) 등 유수 음성인식 서비스들은 모두 딥러닝을 적용했다.



관련기사



조양준 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기