오피니언 사외칼럼

[포럼] 빅데이터 인간 이해가 먼저다


"거울아 거울아, 이 세상에서 가장 아름다운 여인이 누구지?" 백설공주 계모인 왕비가 마법에 걸린 거울에게 묻자 "왕비님도 아름답지만 백설공주가 몇 배 더 아름답지요"라고 거침없이 대답한다.

필자도 알고 싶다. 이 세상에서 가장 아름다운 여인이 누군지. 비록 왕비의 마법거울은 없지만 똑똑한 스마트폰이 있다. 말로 질문하면 음성인식 기술이 텍스트로 바꿔 몇초 만에 검색결과를 내놓는다. 답으로 백설공주를 지목하며 그가 왕비보다 더 아름다운 이유를 알려주기도 할 것이다. 그러나 답이 한가지일 리 만무하다. 비록 악녀지만 왕비의 아름다움도 인정해야 한다는 재치 있는 응답이 있을 수 있고 실제성을 고려해 2012년 미스유니버스 우승자를 제시할 수도 있다. 런던올림픽에서 따뜻한 인간미를 보여준 장미란 선수도 있을 것이다. 이처럼 웹에는 한가지 질문에 엄청나게 많은 답이 나올 수 있다.

간결·명쾌한 웹 검색 숙제로 남아


왕비를 위해 간결한 진실만을 말했던 거울처럼 웹도 질문의 의도에 맞는 최적의 답을 찾아줄 수 있어야 한다. 마법의 거울처럼 명쾌한 답을 줄 수 있는 웹은 불가능할까. 어렵지만 가능하다.

관련기사



이를 위해서는 인간에 대한 이해가 먼저다. 고대 그리스 철학자들이 인간에 대해 고민하기 시작했다면 요즈음 정보통신기술(ICT) 분야의 학자들은 웹, 즉 기계가 인간을 이해하는 방법에 골몰하고 있다.

기계에 인간을 이해시키기 위해 등장하는 개념이 바로 분류다. 인간이 자신의 존재를 인식하고 세상을 알아가는 과정은 끊임없이 대상을 고르고 비슷한 것을 모으며 모은 것에 대표성을 부여하는 반복학습을 통해 이뤄진다. 분류라고 하면 계ㆍ문ㆍ강ㆍ목ㆍ과ㆍ속ㆍ종으로 익숙한 칼 본 린네의 생물학적 분류가 떠오른다. 또 존 듀이가 고안한 도서관 분류체계인 듀이십진분류법도 있다. 린네는 모든 생물을 분류하려 했으며 듀이는 세상의 모든 책을 주제별로 정렬하려고 했다. 그러나 안타깝게도 린네나 듀이의 분류체계로는 세상의 모든 지식을 명쾌하게 분류하기에 역부족이었다. 사물을 특정한 단어나 문장 몇 개로 분류한다는 게 사실상 불가능한 일이기 때문이다.

인간 중심 검색기반 구축 투자 늘려야

일부에서는 웹 검색의 화두인 시맨틱웹(semantic webㆍ차세대 지능형 웹)의 기틀이 되는 정보기술인 '온톨로지(ontology)'에서 해답을 찾는다. 시맨틱웹은 빅데이터 활용 성공의 핵심 기술로 떠오르고 있지만 온톨로지에 대해 아는 이는 많지 않다. 존재론이라는 고대 철학에서 출발한 온톨로지는 인간과 기계가 특정 존재에 대한 세부설명을 공유하면서 이해하는 과정을 다루고 있다. 정보를 입력하기 전 웹은 정보를 어떻게 관리할지, 정보들 간의 관계는 어떻게 표현할지를 결정한다.

철학에서 인간의 존재에 대해 고민하고 이해하는 과정을 거쳤듯이 이제 웹에 인간과 관련된 모든 개체를 친절히 설명해야 한다. 이러한 과정이 바로 온톨로지 구축이며 모든 개체에 대한 설명과 정확한 사례들이 함께 표현된다. 사례가 쌓일수록 웹은 인간을 이해는 방향으로 진화하게 된다. 온톨로지가 제대로 구축돼야 시맨틱웹이 이용자들에게 정확한 검색결과를 제시해줄 것이다. 복잡한 네트워크 시대에 간결한 정답만을 즉시 제시해주는 왕비의 마법거울을 웹에서 원한다면 더 늦기 전에 온톨로지 구축에 투자해야 한다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기