산업 산업일반

수많은 데이터 기반으로 지식정보 발굴

수많은 데이터 기반으로 지식정보 발굴


강재우 교수

강재우 교수가 이끄는 고려대학교 데이터마이닝 연구실은 '나비효과' 처럼 불규칙해 보이는 방대한 양의 데이터로부터 특이한 패턴이나 유용한 지식정보를 발굴해내는 기술을 연구한다. 이는 정보화 사회를 지나 지식사회로 접어들면서 발생하는 대량의 데이터를 처리하고 효율적으로 활용하기 위해 반드시 필요한 연구분야이다. 데이터마이닝은 상상할 수 있는 모든 데이터는 분석 가능하고 정제가 가능하다는 대용량 이메일 로그(Log)를 기반으로 한 스패밍 봇넷(Spamming Botnet)의 탐지 및 방지 기법을 집중적으로 연구하고 있다. 그 대표적인 사례로는 지난해 국내는 물론 미국의 많은 민간단체와 정부기관을 공격한 악성 코드인 디도스(DDoS)를 꼽을 수 있다. 연구실에서는 이메일 로그 분석을 통해 이러한 악성코드의 전파과정을 분석해 봇넷에 관한 특징들을 추출하고, 나아가 봇넷의 확산을 방지하기 위한 연구를 수행한다. 연구실은 한국연구재단의 지원을 받아 고려대 데이터마이닝 연구실의 산업 협력체인 다우 기술의 메시징 랩(Messaging Lab)과 공동으로 연구를 진행하는 등 산학협력 모델도 구축해놓은 상태이다. 이밖에 연구실은 소셜 미디어를 통한 콘텐츠들 가운데 '지식' 발굴 기법 및 최소한의 검사결과를 토대로 효과적인 의학적 진단을 내릴 수 있는 '전자진단지원 시스템(Electro-diagnosis Support System), 암 발생의 유전적 기작 및 유형 등을 파악하고 분석하는 연구, 병렬 컴퓨팅 기법을 활용한 지식 추출 기법 등의 연구를 진행 중이다. 이처럼 연구실은 데이터마이닝이라는 분야의 특성상 데이터만 주어지면 분야에 상관 없이 연구를 진행할 수 있어 분야별 장벽을 두지 않고 자유롭게 연구를 진행할 수 있다는 경쟁력을 지니고 있다. 강 교수는 "앞으로 과학 분야는 컨버전스 시대인 만큼 수많은 종류의 데이터를 기반으로 기존에 없던 새로운 것을 발견하고 이를 세상에 알리는 것이 연구실의 비전"이라며 "컴퓨터 공학 자체에 대한 연구 뿐만 아니라 생물학, 생명 정보학, 의학, 사회 과학 등 여러 분야와 함께 활발한 공동 연구를 진행할 계획"이라고 밝혔다.

관련기사



<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기