개인정보보호위원회는 생성형 인공지능(AI) 서비스 개발에 필요한 ‘공개된 데이터’를 안전하게 사용할 수 있도록 ‘AI 개발·서비스를 위한 공개된 개인정보 처리 안내서’를 마련했다고 17일 밝혔다.
인터넷 상 공개된 데이터는 누구나 합법적으로 접근할 수 있다. AI 기업들은 위키백과(wikipedia) 등에 공개된 데이터를 웹 스크래핑 등의 방식으로 수집해 AI 학습 데이터로 사용하고 있다. 다만 공개된 데이터에는 주소나 고유식별번호, 신용카드번호 등 개인정보가 포함될 수 있어 개인정보 유출 우려가 제기됐다. 현 개인정보 보호법에도 관련 정보를 처리하기 위한 명확한 기준이 나와있지 않다.
이에 개인정보위는 공개된 개인정보 수집‧활용의 법적 기준을 명확히 하고, 기업들이 AI 개발 및 서비스 단계에서 참고할 수 있도록 하기 위해 공개된 개인정보 처리 안내서를 마련했다. 개인정보위는 지난해 8월 ‘AI 시대 안전한 개인정보 활용 정책방향’을 발표하고 AI 프라이버시 민·관 정책협의회를 중심으로 안내서 관련 논의를 진행했다.
안내서에서는 개인정보 보호법 제15조의 ‘정당한 이익’에 따라 공개된 개인정보를 AI 학습·서비스 개발에 활용할 수 있다는 점을 분명히 했다. 정당한 이익 조항이 적용되려면 △AI 개발 목적의 정당성 △공개된 개인정보 처리의 필요성 △구체적 이익형량 등 3가지 요건을 충족해야 한다. 공개된 개인정보를 수집·이용할 때는 합리성이 인정돼야 한다. 가령 의료진단보조 AI를 개발할 경우 개인의 소득이나 재산 등 서비스 개발에 필요없는 정보는 배제해야 한다. 개인정보 주체 관리도 최우선으로 해야 한다.
개인정보위는 AI 기업이 모든 안전조치를 의무적으로 시행해야 하는 것은 아니며, 안내서에 제시된 안전조치의 순기능과 AI 성능저하, 편향성 등 부작용과 기술 성숙도를 고려해 기업의 특성에 맞게 활용하면 된다고 설명했다.
고학수 개인정보위 위원장은 “이번 안내서를 통해 국민이 신뢰하는 AI·데이터 처리 관행을 기업 스스로 만들어 나가고 이렇게 축적된 모범사례가 안내서에 지속적으로 반영될 수 있기를 기대한다”고 말했다.