오피니언 사외칼럼

[포럼] 다시 보는 인공지능과 데이터

고영혁 트레저데이터 수석 데이터아키텍처 어드바이저

고영혁 트레저데이터 수석 데이터 아키텍처 어드바이저고영혁 트레저데이터 수석 데이터 아키텍처 어드바이저


이세돌 9단과 구글 알파고의 세기의 대국 이벤트는 대중·언론매체·산업계·학계는 물론이고 심지어 정부에 이르기까지 인공지능(AI)에 대해 한국에서 유례없는 관심을 불러일으켰고 이러한 국가적 관심은 여러 담론을 낳았다. 대표적인 담론은 인간과 AI 간의 대립 구도로 ‘터미네이터’ ‘블레이드 러너’와 같은 고전 영화에서부터 ‘허’ ‘엑스 마키나’와 같은 최근 영화에까지 단골 소재로 등장하는 구도다. 또 다른 담론은 알파고의 AI를 구현한 방법론에 대한 것으로 소프트웨어(SW) 관점에서는 지난해부터 화두가 된 딥러닝이 계속 이슈가 됐고 하드웨어 관점에서는 알파고의 막대한 연산능력을 낳은 기술적 배경에 대한 이야기들이 있었다. 덧붙여 알파고를 만든 딥마인드를 인수한 구글에 대한 담론도 꽤 있었다.

그런데 AI라는 뜨거운 감자에 대한 이야기가 오고 가는 와중에 우리가 살짝 간과하기 쉬운 부분이 있다. 바로 데이터다.


이 9단을 4대1로 이긴 알파고를 만든 핵심은 딥러닝 및 각종 AI 알고리즘과 막대한 연산처리를 가능하게 한 하드웨어, 그리고 방대한 양의 데이터다. 이 9단의 오픈된 기보는 물론이고 프로 기사들의 16만건의 기보 데이터를 재료로 알파고는 바둑을 배웠다. 인간의 바둑 데이터에서 기본을 학습한 것에 그치지 않고 마치 무협지에 나오는 고수들이 명상을 하며 가상의 대결을 펼치면서 무공을 강화하는 것처럼 또 다른 자기 자신과 수많은 모의 바둑을 두면서 다양한 경우의 전개와 그때의 승패 확률에 대한 데이터를 자체적으로 생산해내고 재차 학습하면서 바둑 내공을 키웠다.

관련기사



모든 것이 정형화돼 있는 알고리즘만으로는 정해진 순서의 고정 업무를 고속으로 자동 처리할 수 있을 뿐이지 AI를 만들어낼 수 없다. 결국 AI는 인간의 지성을 모방한 결과물이고 문제를 해결하는 인간 지성의 상당 부분은 외부 환경의 다양한 정보·데이터를 토대로 얻는 배움으로 구성되기 때문에 AI의 핵심 하나는 학습이다. 그리고 학습 대상은 모두 데이터로 표현할 수 있다.

어떤 문제든지 인간의 수준으로 대응하고 해결하는 범용적인 AI를 만드는 것은 아직도 요원한 일이다. 하지만 알파고의 사례에서 봤듯이 바둑과 같이 비교적 복잡하더라도 어느 정도 규칙이 정해져 있는 특정 분야에서는 AI 및 딥러닝과 같은 머신러닝을 적용해 향상된 성과를 만들어낼 수 있다. 이러한 성과를 만들기 위한 핵심은 결국 그 분야와 관련돼 어떤 데이터를 얼마나 많이 축적하고 있고 어떻게 관리하고 있느냐다. 기보 데이터가 없었다면 알파고가 이 9단에게 단기간에 한 판이라도 이기는 것은 불가능했다는 사실에 주목하자.

굳이 AI나 딥러닝까지 이야기를 꺼내지 않아도 어떤 분야에서 괄목할 만한 성과를 내는 데 데이터를 활용하는 것이 중요하다는 것은 명백한 사실이다. 이제는 딥러닝과 AI까지 가세해 데이터의 축적과 관리 및 활용의 중요성에 한 획을 그어버렸다. AI를 무서워하기 전에 데이터를 제대로 활용할 생각을 하는 것이 훨씬 현실적이지 않을까.

<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기