AI 발전 속 개인정보 침해, 연합학습으로 막는다 : 서울경제

개인정보 보호 AI 연합학습 기술…다양한 데이터 분포에서 높은 성능
IT 기업 주목 기술 FedGF, 사용자 데이터 보호와 AI 성능 향상 동시에

연합학습 알고리즘. 각 사용자는 자신이 가진 데이터를 사용해 모델을 학습하고, 학습된 모델을 서버에 업로드 한다. 서버는 사용자들로부터 받은 모델을 Average하고, 다시 사용자에게 분배한다. 이 과정에서 모든 사용자들은 자신이 가진 데이터를 다른 서버 및 사용자에게 보여주지 않기 때문에 개인정보 침해를 막을 수 있다. 또한, 다른 사용자들이 가진 모델정보를 받기 때문에, 더 많은 데이터로 학습된 모델을 얻을 수 있다. 연구그림=유니스트

인공지능(AI) 발전과 함께 사용자 개인정보 침해 문제가 심각해지고 있는 가운데, 이를 해결할 연합학습 핵심기술이 등장했다. 정보기술(IT) 기업들이 주목하는 기기 내(On-Device) AI 학습에 도움이 될 전망이다.

유니스트(UNIST·울산과학기술원) 인공지능대학원 윤성환 교수팀은 개인정보를 보호하면서도 AI 성능을 높일 수 있는 FedGF(Federated Learning for Global Flatness) 기술을 개발했다고 1일 밝혔다. 사용자 데이터 유출 문제를 해결할 것으로 기대된다.

연구팀은 다양한 사용자 데이터 분포 상황에서도 일관되게 높은 성능을 내는 방법을 개발했다. 기존 기술은 사용자 데이터 분포와 유사한 환경에서만 우수한 성능을 보였지만, 다른 환경에서는 성능이 낮았다.

연합학습은 사용자 기기에서 딥러닝 모델을 학습해 개인정보를 보호하지만, 데이터 차이로 성능에 한계가 있다. FedGF는 데이터를 중앙 서버로 보내지 않고, 각 기기에서 학습된 모델을 통해 최적화된 모델을 만들어 높은 정확도를 보였다.

FedGF는 효율성도 뛰어났다. 기존 방법보다 적은 통신자원으로 완전한 학습이 가능하다. 와이파이(Wi-Fi)와 같은 무선통신을 사용하는 모바일 장치들에 특히 유리하다.

\윤성환 교수는 “연합학습 기술은 AI 개인정보 침해 문제 해결의 핵심적인 발판이 될 것이다”며 “IT 빅테크 기업들의 개인정보 문제와 분산 데이터 이질성 극복에 큰 도움이 될 것”이라고 밝혔다.

제1저자 이태환 연구원은 “FedGF 기술로 기업은 개인정보 침해 없이 높은 성능의 AI 모델을 얻을 수 있어 IT, 의료, 자율주행 등 다양한 분야에 주요 역할을 할 것”이라고 덧붙였다.

연구 결과는 세계적 국제학술대회 ICML(International Conference on Machine Learning)에 7월 20일 온라인 게재됐다. 연구는 과학기술정보통신부 지원 정보보호 국제공동연구 및 정보통신방송혁신인재양성사업을 통해 수행됐다.