익명성의 종말

THE END OF ANONYMITY
얼굴 사진만으로 이름까지 알아내는 기술이 범죄자 색출에 활용되고 있다. 이 기술이 누구에게나 쓰인다면 어떻게 될까?

미국 펜실베이니아주 첼트넘 타운십 경찰국. 짐 맥클레랜드 형사가 키보드를 누르자 모니터에 떠있던 용의자의 클로즈업 사진이 사라졌다. 흐릿한 사진 속 용의자는 턱수염이 있었으며, 무표정한 데다 카메라에서 시선을 돌리고 있었다.

이윽고 사진 대신 가상의 머리가 3D로 나타나더니 조금씩 용의자의 모습으로 또렷하게 바뀌어갔다. 렌더링이 끝나고 맥클레랜드는 용의자의 얼굴이 정면을 향하도록 방향을 틀었다.
“드디어 얼굴을 똑똑히 알게 됐네요.”

이 용의자는 필라델피아 교외의 편의점을 돌아다니며 훔친 신용카드로 물건을 구입했다. 경찰이 편의점 CCTV에 찍힌 그의 모습을 찾았지만 해상도가 좋지 않고, 옆모습이어서 경찰용 안면 대조 시스템이 별다른 역할을 하지 못했다. 시스템이 펜실베이니아주 전과자 리스트에서 추출해준 수백명의 후보자 중 용의자와 닮은 사람이 없었던 것. 그에게 이는 놀랄 일이 아니었다. 펜실베이니아주의 안면 대조 시스템을 처음 이용했던 2007년 이래 수사에 전혀 도움을 받지 못한 경우가 허다했기 때문이다.

“서버에 저장된 전과자들의 사진은 카메라를 똑바로 쳐다보고 있지만 거리나 상점의 CCTV가 촬영한 영상 중에 그런 것은 거의 없습니다. 그러니 오류나 오차가 많을 수밖에요.”

그러던 지난 2012년 펜실베이니아주가 시스템을 업그레이드하면서 자세 교정 소프트웨어를 추가했다. 덕분에 형사들은 용의자의 얼굴을 3D로 렌더링한 뒤 정면을 바라보도록 조정, 분석 정확도를 높일 수 있게 됐다.

실제로 맥클레랜드 형사가 신용카드 도둑의 정면 사진을 시스템에 입력하자 모니터에 그와 닮은 범죄자들의 사진이 가득 채워졌다. 수학적으로 유사성이 높은 순서대로 앞쪽에 배치돼 있었다. 그는 범죄자일 확률이 가장 높다고 분석된 첫 번째 사진을 클릭했다. 찾고 있었던 용의자가 분명했다. 작년에도 신용카드 사기로 기소된 적이 있는 사람이었다. 이제 화질이 떨어지는 캡처 사진 1장만 있어도 350만명의 범죄자 데이터베이스(DB)와 비교해 용의자를 정확히 찾아낼 수 있게 된 것이다.

특히 올 여름이 되면 안면 대조 시스템의 수준은 한 단계 더 높아진다. 미 연방수사국(FBI)의 ‘차세대 신원확인(NGI) 프로그램’에 의해 전국 수사기관들이 FBI가 보유한 1,600만명의 범죄자 사진에 자유롭게 접속할 수 있는 시스템이 구축될 것이기 때문이다. 여기에다 각 지역 및 주경찰당국이 자체 보유 중인 범죄자 사진 수백만 장을 NGI 시스템에 추가 업로드할 예정이기도 하다.

이렇게 기관별로 독자 운용해왔던 그동안의 방식에서 벗어나 국가 전체를 포괄하는 시스템이 구축되면서 법 집행기관들의 능력은 한 차원 향상될 것이 자명하다. 첼트넘 타운십 경찰국과 달리 미국 내 경찰관서 대부분은 자체 안면 대조 시스템을 갖추고 있지 않았지만 앞으론 이런 곳에서도 웨스트 버지니아주 클라크스버그에 있는 FBI의 서버를 이용해 가장 확률 높은 2~50명의 용의자 후보들을 선별해낼 수 있게 된다. 게다가 총 12억 달러가 투자되는 NGI 프로그램에서는 범죄자의 얼굴 외에도 지문, 장문(掌紋), 홍채, 음성 등의 정보까지 취급한다.

그런데 이 같은 트렌드를 보면서 일반 대중들은 사회가 안전해지고 있다는 안도감과 함께 불안감도 엄습한다. 그 근간에는 얼굴이 지문, DNA 같은 정보와 달리 너무 손쉽게 얻을 수 있다는 데 있다. 요즘은 휴대폰만 있어도 상대방 동의 없이 얼마든지 몰래 얼굴을 촬영할 수 있다. 그만큼 오남용 가능성이 크다. 최근 미 국가안보국(NSA)이 ‘프리즘(PRISM)’이라는 프로그램을 통해 수년간 민간인에 대한 무차별적 개인정보 수집활동을 벌인 사실이 드러난 게 그 실례다. 시민의 안전 수호와 사생활 침해의 경계는 생각보다 쉽게 무너질 수 있다.

NGI가 미해결 사건을 줄이고, 더 많은 범죄자를 감옥으로 보냄으로써 사회를 안전하게 만들 수 있을까? 설령 그렇더라도 혹여 그 과정에서 시민들의 익명성이 말살되지는 않을까?



FBI의 신원확인 부서는 지난 1924년 창설이후 지금까지 범죄자들에 대한 정보를 모아왔다. 첫 수집 대상은 지문이었는데 색인카드에 잉크로 찍은 지문을 포함, 총 1억3,500만개의 지문이 디지털 DB로 구축돼 있다.

초기에만 해도 법의학자들이 범죄현장에서 발견한 지문과 범죄자들의 지문을 육안으로 대조해야 했지만 1980년대 들어 컴퓨터로 지문 대조가 가능해지면서 수개월씩 걸렸던 분석시간이 몇 시간으로 줄어들었다. 또한 2개의 표본을 대조해 유사성을 찾아주는 매칭 알고리즘은 오래지 않아 DNA, 얼굴 등 다른 생체 표지까지 분석할 수 있도록 진화했으며 FBI는 1994년 미국 최초로 범죄자의 DNA DB를 구축했다.

FBI에 따르면 염색체의 위치 13군데를 비교하는 DNA 분석은 그 정확성이 99.99%에 달한다. 지문의 경우 범죄현장에서 찾은 지문이 DB에 있을 때 86%의 확률로 찾아낸다고 한다. 범죄현장의 지문은 희미할 수도, 손가락의 일부분만 찍혀 있을 수도 있는 탓이다. 물론 이는 DB의 지문과 매칭해내지 못할 확률이 14%라는 것이지 엉뚱한 사람을 범인으로 지목할 개연성이 있다는 의미는 아니다. DNA 및 지문 분석 결과가 선의의 피해자를 만들어낼 여지는 사실상 없다고 봐도 무방하다.

안면 대조 시스템은 어떨까. DB에 범인의 얼굴이 있어도 매칭해내지 못할 가능성이 상대적으로 높다. 대부분은 용의자의 범위를 압축하고, 추가 수사의 방향을 제시해주는 수준에서 멈춘다. 이 문제의 핵심 원인 중 하나는 사람의 얼굴이 쉽게 변한다는 점이다. 지문에는 콧수염이 자라지 않고, DNA가 선글라스를 쓸 일도 없다. 하지만 얼굴은 다르다. 털이 자라기도 하고, 세월에 따라 늙는다. 헤어스타일이나 바라보는 각도에 따라 느낌이 완전히 달라질 수도 있다.

특히 사진 속 얼굴은 실물로 볼 때 보다 훨씬 다른 사람의 얼굴과 비슷해 보인다. 정말 닮은 경우도 있지만 화질이 좋지 않아서 매칭 알고리즘이 잘못 판단하기도 한다. NGI를 포함한 세상의 모든 안면 대조 시스템이 DB에서 단 1명을 골라주지 못하고 확률에 의거해 다수의 후보들을 선별해주는 것도 이 때문이다.

이와 관련 NGI 프로그램 책임자인 케빈 레이드는 고품질의 얼굴 사진이라면 DB에서 실제 동일인을 첫 번째 후보자로 추출해낼 확률이 약 80%라고 밝혔다. 그러나 이는 말장난에 불과하다. 일선 경찰이나 형사들이 그런 사진을 확보하는 일은 가뭄에 콩 나듯 한다. 필자가 맥클레랜드 형사를 취재하는 동안에도 다른 형사가 동영상 캡처 사진을 인쇄한 종이를 들고 찾아온 적이 있다.
“이걸로 신원파악이 가능할까요?”

맥클레랜드는 인쇄물을 흘깃 보더니 고개를 내저었다. 그건 사진이라기보다는 표현주의 작가가 그린 얼룩덜룩한 픽셀 덩어리에 가까웠다. 매주 수십 여장의 사진이 그에게 도착하지만 시스템에 입력할 만한 것은 1~2컷 정도라고 한다. 그나마 용의자의 신원을 알아낸 케이스도 무장 강도 같은 강력범죄는 거의 없었고, 살인범은 단 한 번도 없었단다.

“강력범들은 얼굴을 잘 가리고 다닙니다. 웬만해선 공개된 곳에서 범행을 저지르지 않아요. 설령 범행현장 주변의 CCTV에 용의자가 찍혔더라도 대개는 빠르게 걷거나 달리고 있어서 얼굴을 알아보기가 쉽지 않습니다.”

그래서 현재의 안면 대조 시스템은 잔챙이 도둑들을 잡을 때나 최고의 효용성을 발휘한다. 상점에서 물건을 훔치거나 남의 신용카드로 물건을 구입하는 사람들 말이다. 이를 개선하려면 정확도 향상이 필요하다. 하지만 기술적 관점에서 이것은 법 집행기관의 소관이 아니다. 정확도를 높여 사회적 기대에 걸맞은 도구로 만드는 일은 생체인식 학계의 몫이다.



2011년 8월 영국 런던에서 폭동이 일어났다. 경찰의 총격으로 시민이 숨지면서 촉발된 이 폭동으로 5일간 방화와 약탈이 자행됐다. 당시 영국정부는 폭도들의 검거를 위해 2012년 런던올림픽에 대비해 개발한 것으로 알려진 안면 대조 기술을 사용했다. 독일의 유명 안면 인식 알고리즘 개발기업인 코그니텍의 마케팅매니저 엘케 오베르크에 의하면 용의자사진 가운데 안면 대조가 가능한 수준의 화질과 촬영 각도를 지닌 것은 6,000장 중 1장 꼴이었다.

주지하다시피 안면 대조는 무수한 요인들에 의해 방해를 받는다. 카메라 렌즈에 달라붙은 먼지 하나에도 영향을 받을 수 있다. 그중 분석상의 문제를 촉발하는 최대 요인들은 ‘아피어(APIER)’라는 약자로 집약된다. 노화(aging), 자세(pose), 조명(illumination), 표정(expression), 해상도(resolution)가 그것이다.

예컨대 안면 대조 알고리즘은 기본적으로 정면을 바라본 얼굴 사진을 2차원으로 매핑한 뒤 눈, 코, 입의 거리나 서로의 상대적인 위치처럼 물리적인 특징들을 조합해 두 사진 속 인물이 동일인인지 여부를 가려낸다. 하지만 각 식별점들의 물리적 거리는 나이가 들면서 멀어지기도, 짧아지기도 하며 뺨과 턱선의 모양도 달라진다.

자세와 표정도 마찬가지다. 고개를 조금만 돌려도 식별점 사이의 거리가 달라지며, 웃거나 울거나 화를 내면 이목구비를 포함한 얼굴의 전체적 모양이 변한다. 그리고 조명이나 카메라의 해상도가 나쁠 때는 얼굴의 특징이 사진에 잘 드러나지 않는다.

대다수 생체 인식 기술 개발자들은 이른바 ‘훈련’을 통해 이 문제에 맞선다. 저화질, 특이한 각도 등 결함을 가진 사진들을 활용해 알고리즘에게 끝없이 대조작업을 하도록 시키면서 APIER에 의한 변화에 조금이라도 적응시키는 것이다. 이 방식으로 안면 대조 기술은 비약적 발전을 이뤘다. 10년 전만 해도 사진이 촬영된 지 5년이 지나면 매칭 정확도가 25%나 떨어졌다. 연평균 5% 꼴이다. 그러나 요즘은 정확도 하락률이 연간 약 1%에 불과하다.

여기에는 원본 사진의 결함을 최소화시켜주는 안면 대조 시스템용 보조 소프트웨어들의 힘도 컸다. 현존 소프트웨어 중 가장 뛰어난 성능을 인정받고 있는 것이 미국 뉴햄프셔주 소재 안면 인식 솔루션 기업 애니메트릭스가 2012년 출시한 3D 자세 교정 소프트웨어 ‘포렌시카 GPS(ForensicaGPS)’다. 고객들의 정확한 숫자는 공개되지 않았지만 미국은 물론 전 세계 법 집행기관에 납품된 것으로 알려져 있다. 맥클레랜드 형사가 사용했던 소프트웨어도 바로 이것이다.

이 제품은 2D 이미지를 3D로 전환하기 전에 소프트웨어가 자동 마킹한 식별점을 사용자가 조정할 수 있다. 얼굴에 나타난 특징을 좀더 명확히 하기 위함이다. 이후 식별점에 맞춰 선으로 표시된 3D 얼굴 형상이 만들어지면 코의 길이, 광대뼈의 각도 등 기존 2D 안면 대조 알고리즘이 놓치거나 무시했던 데이터를 획득한다. 덕분에 어떤 종류의 안면 대조 시스템이라도 대폭적인 정확도 향상이 가능하다는 게 애니메트릭스 폴슈에프 최고경영자(CEO)의 설명이다.

이외에 미국 미시건주립대 컴퓨터공학부 특훈교수이자 세계 최정상급 생체인식 전문가인 애닐 제인 박사팀은 아예 참조 사진이 필요 없는 소프트웨어를 개발했다. ‘페이스 스케치 ID(FaceSketchID)’라는 이 소프트웨어는 경찰 소속 법의학 스케치 전문가들이 그린 용의자의 그림을 서버의 사진과 대조할 수 있는 기능을 갖추고 있다. 현재 법의학 스케치 전문가들은 거칠고, 각도가 좋지 않으며, 부분적으로 흐릿한 캡처 사진을 가지고 정면 얼굴 스케치를 그려낼 수 있기 때문이다. 얼굴을 적절한 각도로 돌려서 최적의 조명 상황을 표현하고, 일자눈썹이나 매부리코 같은 특징을 강조해 생생한 그림으로 재현해낸다.

“이제 저희 소프트웨어를 활용하면 화질이 매우 나쁘거나 옆얼굴이 찍힌 사진이라도 정면 스케치로 전환해 시스템에 입력할 수 있습니다.”

연구팀은 스케치 전문가들의 시선에 맞춰 페이스 스케치 ID도 전반적인 인상 대신 다른 사람과 차별화되는 이목구비의 특징에 부합하는 사진을 선별하도록 알고리즘을 코딩했다. 이와는 별도로 제인 박사팀은 FBI의 지원을 받아 감시·정찰팀이나 최신 CCTV가 촬영한 적외선 동영상에서 사람의 얼굴을 추출해내는 알고리즘도 개발 중이다. 개발이 완료되면 방첩기관이 테러 용의자처럼 이미 신원이 파악된 사람을 감시할 때 주변을 오가는 일반 시민들과 용의자를 확실히 구분할 수 있게 된다.

다만 현존 안면 대조 시스템용 보조 소프트웨어와 기술들 중 스스로 모든 과정을 수행해내는 것은 하나도 없다. 항상 추가 데이터나 사람의 수작업이 곁들여져야 한다. 일례로 이미지의 유효화소수를 2배 높여주는 ‘슈퍼 해상도(SR)’ 기술은 2장의 사진, 그것도 연속적으로 촬영된 사진이 꼭 필요하다. 동영상에서 얼굴을 자동 추출해주는 애니메트릭스의 최신 영상 분석 솔루션 ‘바이널(Vinyl)’도 하루 종일 걸렸던 작업을 20분 만에 끝낼 수 있게 해주지만 추출된 많은 수의 얼굴 사진을 안면대조 시스템에 입력할 때는 분석관이 일일이 수작업으로 해야 한다.

향후 이 소프트웨어들이 하나로 통합된다면 안면 대조 시스템의 정확성은 비약적으로 상승된다. 그때는 매칭 결과의 법적 증거력도 DNA나 지문 증거만큼 향상될 수 있다. 그러려면 각 기술들에 대한 표준화가 이뤄져야 하는데 지금 시작해도 여러 해가 걸린다. 산발적인 기술혁신은 업계 전체의 기술향상을 불러오므로 예상보다 이른 시일 내에 눈에 띄는 진화가 일어날 수도 있지만 말이다. 어쨌든 이 시점에서 꼭 한번 생각해봐야 할 사안은 그런 진화가 우리에게 약이 될지, 독이 될지다. 아마도 그건 그 기술로 누구의 얼굴을 대조하는가에 달려 있을 것이다.



필자가 첼트넘 타운십 경찰국에 머무르는 동안 맥클레랜드 형사가 사용했던 얼굴 사진 중 제일 화질이 좋은 것은 소셜 미디어에서 얻은 것이었다. 사실 소셜 미디어는 현재의 안면 대조 시스템 하에서 가장 완벽한 사진 공급처다. 밝은 조명 아래 가까운 거리에서 찍힌 고해상도 정면 사진들이 널려 있으니 말이다. 그 사진은 포렌시카GPS를 거치지 않았음에도 안면 대조 시스템에 입력하자마자 3명의 후보 용의자 사진이 모니터에 나타났다. 3명 모두 동일인이었다. 세 차례나 경찰에 체포된 적이 있다는 의미였다.

“이거 보세요. 사진만 좋으면 일이 이렇게나 쉽게 풀립니다.”
애니메트릭스의 설명에 의하면 양쪽 눈 사이에 최소 65화소가 들어있어야 효과적인 대조가 가능하다. 일반적인 CCTV 영상 캡처 사진이 보통 10~20화소 밖에 들어가 있지 않는 반면 SNS의 셀카 사진은 못해도 수백만 화소의 해상도를 자랑한다. 눈 사이의 65화소는 일도 아니다. 우리 스스로 SNS에 올려놓은 사진이야 말로 안면 대조 분석가들에게는 꿈의 사진인 셈이다.

“지금도 SNS에는 고화질의 정면 얼굴 사진이 수십억 장이나 있습니다. SNS가 좋은 것은 그 사진의 주인공이 누구인지 신원 파악도 쉽다는 겁니다.”

이와 관련 구글과 페이스북은 이미 안면 인식 기술의 인큐베이터 노릇을 하고 있다. 2011년 구글이 피트팻(PittPatt)을, 1년 뒤 페이스북이 페이스닷컴(face.com)이라는 얼굴 인식 소프트웨어 업체를 인수한 것. 당시 페이스북은 사생활 침해 논란에 빠진 페이스닷컴의 ‘클릭(Klik)’ 앱 서비스를 중단하기도 했다. 디지털 사진을 스캔, 페이스북 프로필과 연계해 자동으로 태그를 붙여주는 앱이었다. 후일 페이스북을 통해 이 앱과 거의 유사한 기능의 태그 추천 기능을 서비스했지만 프라이버시에 대한 우려로 유럽연합(EU) 국가에서는 사용되지 못하고 있다.

반면 구글은 에릭 슈미트 회장이 직접 논란의 여지를 싹부터 잘라냈다. 구글은 안면 인식 검색 기능을 제공할 기술력이 있지만 명백한 사생활 침해 가능성 때문에 그렇게 하지 않겠다고 밝힌 것이다. 구글은 또 스마트 안경 ‘구글 글래스’를 위해 개발 중이던 안면 대조 앱의 개발도 중단시켰다. 필자는 안면 대조 기술과 관련해 두 기업에 인터뷰를 요청했지만 페이스북은 묵묵부답이었고, 구글은 거절 의사를 표명했다. 그러나 소셜미디어에 저장돼 있는 이미지들이 안면 대조 용도로 활용될 수 있음은 결코 가상의 위협이 아니다.

피트팻이 구글에 합병된 직후 미국 카네기멜론대학의 IT 및 공공정책 학자인 알렉산드로 애퀴스티 박사가 자신의 이론 검증을 위해 시연한 앱이 그 실례다. 당시 그는 피트팻의 알고리즘을 채용, 페이스북의 이미지를 통해 특정인의 신원을 파악하는 이 앱을 가지고 손쉽게 인구학적 정보 취득이 가능함을 증명했다. 일부 사람들의 경우 사회보장번호까지 알아냈다. 물론 한 국가나 전 세계의 소셜 미디어를 DB로 삼는다면 수조장 이상의 대조 작업을 수행할 수 있는 엄청난 시스템이 요구된다. 그래서 적어도 아직은 너무 두려워할 필요는 없다고 여기나? 애퀴스티 박사의 생각은 다르다.

“지금 상황이 그렇다는 것이지 앞으로도 그럴 것이라고 생각한다면 오산이에요. 저는 오히려 반드시 그런 세상이 온다고 봅니다. 컴퓨터와 안면 대조 시스템의 성능이 갈수록 강력해지고 있고, 데이터 저장능력도 일취월장하고 있으니까요.”

그런 경우에 벌어질 수 있는 최악의 시나리오 중 하나는 소셜 미디어들이 우리를 배신하고, 안면 인식이나 안면 대조 서비스를 제공하는 것이다. 애퀴스티 박사는 길어도 20년 안에 그렇게 될 것으로 예견한다. 페이스북과 구글에 저장된 얼굴 사진 정보로 국한하면 시간은 훨씬 촉박하다. 지금 당장이라도 정부가 내놓으라고 요구하면 어쩔 도리가 없다는게 미국 노터데임대학 생체 인식 및 데이터분석 전문가인 케빈 보이어 교수의 판단이다.

“상당수의 기업이 고객정보를 마구 수집해 보관하고 있습니다. 법집행 기관들은 누구보다 그 사실을 잘 알고 있죠. 언젠가 어떤 이유를 들어 정보를 달라고 요구할 겁니다.”

소셜 미디어들이 정보 제공을 거부할 수 있지 않겠냐고? 지금도 법집행기관들이 범죄수사를 위해 협조를 요청하면 관련 정보를 넘겨주거나 특정 계정에 대한 접속을 허용하고 있다. 비영리 단체인 일렉트로닉 프런티어 재단(EFF)의 선임 상근 변호사 제니퍼 린치는 이렇게 말한다.
“NSA의 감시 활동이나 FBI가 획득한 정보의 상당부분이 민간기업에서 나옵니다. 그들이 가진 데이터와 사진 정보는 정부에게 있어 꿀단지와 같아요.”

아직 FBI는 개인정보를 필요 이상 수집하거나 남용한 사례가 발견되지 않았다. 범죄자라면 몰라도 NGI 프로그램 또한 선량한 시민들의 사생활에는 별반 위협이 되지 않는다. 그러나 안면 대조 시스템에 새로운 정보를 몰래 추가하는 일이 벌어지고 있다는 건 큰 문제다. 필자는 맥클레랜드 형사에게 아무 생각 없이 주(州) 차량국(DMV)의 사진도 검색 가능한지를 물은 적이 있다. 운전자는 범죄자가 아니니 검색될 리가 만무했지만 그는 필자를 바라보며 답했다.
“펜실베이니아주에서요? 네! 가능합니다.”

DMV 사진 접속 기능은 수년전 만들어졌다고 한다. 이름, 주소 등의 검색어를 입력해 정보를 찾을 수 있으며, 작년에는 사진 대조 기능도 추가됐다. 사진을 입력한 뒤 검색하면 펜실베이니아주 DMV가 보관 중인 3,000만건 이상의 운전면허 및 신분증 사진 DB와 안면 대조가 이뤄진다. FBI의 호언장담에도 불구하고 안면 대조 대상이 일반인들에게로 확장되고 있는 것이다. 그들은 범죄는커녕 운전면허증 발급을 위해 사진을 제출한 죄밖에 없는데도 말이다.

그나마 다행인 것은 DMV가 범죄자 체포가 아닌 신분증 무단복제를 방지에 최우선 순위를 두고 있다는 점이다. 맥클레랜드 형사에 의하면 DMV의 DB는 DMV가 보유 중인 정면 사진과 완벽히 일치하지 않으면 검색 결과에 나타나지 않도록 별도의 알고리즘이 적용돼 있다.
“개인적으로 DMV 자료 검색을 좋아합니다. 엉터리 결과가 무더기로 쏟아지는 일이 없으니까요.”



안면 대조 기술이 최소한의 익명성을 무너뜨려 대중들의 프라이버시를 붕괴시킬 수 있다는 말로 글을 끝내기는 쉽다. 거침없는 생체 지표 패턴분석기술의 발전과 방대한 데이터베이스가 합쳐지면 스릴러 소설에 나옴직한 무서운 미래가 펼쳐질 수 있다. 하지만 어쩌면 그것이 미래에 다가올 위기에서 우리 모두를 구할지도 모른다.

보스턴 마라톤 폭탄테러로 3명이 숨지고 250여명이 다친 지 1개월이 지난 작년 5월. 미국 미시건주립대학의 애닐 제인 박사는 그날 무슨 일이 벌어졌는지에 대한 연구결과를 발표했다. 당시 그녀는 일본 NEC의 안면 인식 소프트웨어인 ‘네오페이스(NeoFace)’의 알고리즘을 가지고 테러 현장이 촬영된 사진 속에서 용의자인 차르나예프 형제를 검색했다. 형인 타메를란은 2009년 가택침입과 폭행 혐의로 체로된 적이 있어 경찰의 범죄자 DB에 사진이 올려져 있었다. 그럼에도 알고리즘이 DB에서 추출한 200명 중 그는 없었다. 사건 당시 선글라스와 모자를 쓰고 있었기에 알고리즘이 그의 얼굴을 DB의 사진과 매칭시키지 못했던 것이다.

그러나 동생인 조하르는 얘기가 좀 다르다. 제인 박사는 조하르가 졸업식 때 촬영한 사진을 범죄자 사진 중심으로 구성된 100만장 규모의 데이터세트에 넣은 다음, 테러현장에서 촬영된 조하르의 사진으로 안면대조 작업을 수행했다. 나이, 성별 등 일체의 인구학적 데이터를 추가 입력하지 않은 무작위 검색이었지만 후보자의 범위를 조금씩 줄여나가자 결국 네오페이스는 용의자일 확률이 가장 높은 사진으로 조하르의 졸업식 사진을 선택했다. 안면 대조 시스템은 이렇듯 수사에 필요한 최고이자 유일한 단서를 제공할 수 있다.

안면 대조 시스템을 둘러싼 최대 딜레마가 여기에 있다. 제인 박사가 데이터세트에 넣은 졸업식 사진은 페이스북에서 찾은 것이다. 만일 법집행기관이 소셜 미디어에 공개된 1조장 이상의 얼굴 사진을 철저히 뒤졌더라면 단 하루 만에 용의자로 조하르를 특정할 수 있었을 것이라는 얘기다.

현실은 어땠을까. 차르나에프 형제가 용의선상에 오른 것은 폭탄 테러 후 3일이 지난 후였다. 그것도 MIT 대학의 청원경찰관 살해, 캠브리지 인근지역에서의 총격전 가담 등 폭탄 테러와는 직접 관련이 없는 혐의 때문이었다.

이 모든 것을 감안할 때 안면 대조 기술의 한계와 부작용을 논하는 것은 시기상조일 수 있다. 이유야 어찌됐건 안면 대조 기술이 가져올 최고의 성과와 최악의 악몽은 아직 모두 구체화되지 않았기 때문이다. 어쩌면 우리는 멀지 않은 미래에 절대 다수의 프라이버시와 한 사람의 목숨이 지닌 가치를 저울질해야하는 가혹한 운명에 처할 수도 있다. 당신의 선택은 무엇인가?




고해상도 3D 몽타주 제작 메커니즘
애니메트릭스가 법집행 기관들을 위해 개발한 ‘포렌시카GPS’는 저화질 2D 사진을 3D로 모델링해 DB에 저장된 범죄자 사진과 정확히 비교분석할 수 있도록 해준다.

1 카메라로부터 얼굴을 돌리고 있는 이런 종류의 사진은 안면 대조 시스템이 제대로 인식하기 어려운 표본이다.
2 포렌시카GPS가 사진 속 얼굴에서 최대 40개의 특징적 지점을 잡아낸다. 필요하다면 사용자가 이 식별점을 조정할 수도 있다.
3 식별점에 기반해 선으로 된 3D 얼굴 형상이 만들어진다. 얼굴의 윤곽과 특징점들의 위치를 확인할 수 있다.
4 2D 사진의 얼굴을 3D 형상에 덮어씌운다. 덕분에 피부 질감이나 점 같은 특징들이 그대로 살아 있다.
5 3D로 렌더링된 얼굴을 회전시켜 정면 사진을 만들 수 있다. 이렇게 하면 범죄자 사진 DB와의 비교가 매우 용이해진다.
6 렌더링된 얼굴을 다른 얼굴 사진과 병합, 두 사진을 비교함으로써 동일 인물 여부를 한층 명확히 확인할 수도 있다.




안면 탐지 카메라
일상 속 자연스런 표정에서 인구통계학적 정보 추출


미국 뉴욕의 한 리복 매장에는 ‘카라(Cara)’라는 안면 탐지 시스템이 설치돼 있다. 이 시스템은 매장에 들어온 모든 고객의 얼굴을 초당 10~20회씩 분석, 성별과 연령대에 더해 행동과 감정 상태까지 알아낸다. 고객의 표정을 읽고, 시선을 추적하며, 한 자리에 머문 시간을 측정해 특정제품에 대한 관심도 파악이 가능하다. 작년 5월 리복이 처음 운용한 이래 다수의 업체들이 카라를 도입하고 있는 상태다. 영국 테스코의 경우 작년 11월 주유소 편의점에 들어온 고객의 얼굴을 분석, 성별과 연령대에 맞춰 디지털 광고를 송출하는 기술을 공개하기도 했다. 이런 안면 ‘탐지’ 기술은 안면 ‘대조’와는 다르다. 카라만 해도 동시에 최대 25명의 얼굴을 탐지하지만 DB에 저장하거나 다른 DB와 대조하지 않는다. 또한 개발사인 IMRSV에 의하면 탐지된 얼굴 이미지는 1초 내에 100% 파기된다. 이렇듯 대부분의 기업들은 고객의 얼굴 이미지 수집에 관심이 없다. 얼굴에 드러난 인구통계학적 정보가 궁금할 뿐이다.




신원정보 생체 표지 사대천왕
생체 표지를 이용해 개인의 신원을 파악하기 시작한 것은 지문이 증거로 활용된 100여 년 전부터다. 이후 컴퓨터의 성능 발전에 힘입어 매칭 알고리즘도 진화를 거듭하면서 DNA, 얼굴, 목소리 등으로도 생체 정보 대조가 가능해졌다.


1 지문 / 장문(掌紋)
범죄현장에서 수거된 지문과 장문은 용의자의 신원을 확인할 결정적 증거물이다. 그러나 많은 경우 지문(장문)이 오염돼 있거나 일부분만 찍혀 있어 매칭 정확도를 떨어뜨린다. 이런 가운데 작년 4월 FBI가 분석의 혁명을 일으켰다. 전국 단위의 장문 DB를 최초로 구축함과 동시에 기존 알고리즘을 업그레이드해 지문 대조의 정확도를 3배나 높였다.

2 DNA
과거에는 범죄현장에서 발견된 DNA와 용의자의 DNA를 대조하는데 60일이나 걸렸다. 하지만 인터젠X의 ‘래피드HIT(RapidHIT)’를 이용하면 90분 내에 DNA 대조를 끝낼 수 있다. 용의자를 영장 없이 심문할 수 있는 48시간 안에 결정적 증거를 제시하기에 충분한 시간이다. 60×60㎝의 작은 크기지만 실험실 수준의 화학분석 능력을 지녔다.

3 홍채
홍채 스캔 기술은 사람이 카메라에 눈을 들이밀고 응시해야 해 범죄 수사용으로는 쓸모가 없다. 그럼에도 홍채는 지문 이상의 확실한 신원 확인 수단이며, 일반 소비자용 카메라로도 홍채 촬영이 가능할 만큼 범용성이 높다. 그래서 기업이나 학교, 교도소 등의 보안시스템으로 홍채 스캐너가 다수 채용돼 있다.

4 음성
음성 인식은 이미 널리 쓰이고 있는 기술이다. 영국 바클레이즈를 포함한 몇몇 은행들은 현금이체 시 음성패턴 대조 기술로 고객 신원을 확인하고 있다. 뉘앙스 커뮤니케이션이라는 앱 개발사는 보이스피싱 사기꾼을 알려주는 앱을 개발하기도 했다. 30초간의 음성패턴을 분석, 실제 사기꾼들의 음성패턴 DB와 대조하는 방식이다.




안면 대조 시스템의 5대 극복 과제

1 노화
세월에는 장사가 없다. 얼굴도 마찬가지다. DB의 사진과 시스템에 입력된 사진의 촬영 시점이 차이가 날수록 이목구비나 턱선, 살집 등이 변했을 가능성이 크다. 예전 얼굴에 나타났던 특징들이 사라지는 것이다.

2 자세
대부분의 안면 대조 알고리즘은 눈 사이처럼 각 부위의 거리를 측정해 DB의 사진과 대조한다. 하지만 사진이 카메라를 정면으로 바라보고 있지 않으면 이 거리를 정확히 측정하기가 어려워진다.

3 조명
조명이 부족해 어둡거나 조명 각도에 의해 얼굴에 그늘이 드리울 경우 안면 대조의 정확성이 떨어진다. 알고리즘이 얼굴에 나타난 시각적 특징을 제대로 포착하지 못하기 때문이다.

4 표정
입을 벌리고 있거나, 웃거나, 누군가를 위협 중인 사람의 얼굴은 입의 크기와 위치 같은 주요 특징들이 평상시와 달라진다. 때문에 동일인의 사진이라도 알고리즘이 다른 사람으로 인식할 수 있다.

5 해상도
안면 대조 알고리즘은 사진의 해상도가 좋을수록 매칭 정확도가 높아진다. 이런 해상도는 카메라의 성능에서 사진 속 얼굴의 크기에 이르기까지 모든 요인에 의해 영향을 받는다.



NGI Next Generation Identification.
SR Super Resolution.

<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>