불과 2주 전 페이스북 인공지능(AI) 연구센터의 연구진은 향후 신경망 구조 설계의 흐름을 바꿀지도 모를 획기적인 논문을 발표했다. 결론부터 말하자면 망 자동 생성기(network generator)에서 무작위 연결을 통해 생성한 망의 성능이 사람이 공들여 만든 망을 추월한 것이다.
그동안 영상인식 분야에서 최고의 성능을 내는 것으로 평가받아온 신경망 레스넷(ResNet)이나 덴스넷(DenseNet)의 구조는 모두 고유의 설계철학과 섬세한 조율을 통해 만들어졌다. 두 신경망이 기존의 유명한 망과 다른 점은 다수지만 그중 ‘건너뛰기 연결(skip connection)’이라고 불리는 독특한 연결 방식이 있다. 기존 망에서의 내부 연결은 인접한 구성요소들끼리만 연결됐던 데 반해 이 두 신경망은 인접한 구성요소들 간의 연결뿐 아니라 여러 단계를 건너뛰어 연결하는 방식을 사용해 꽤 성능을 향상시킬 수 있었다. 페이스북 연구진 중 한 명이 레스넷의 설계자였기 때문에 의식적이든 무의식적이든 신경망에서 내부 구성요소의 연결이 중요함을 인지했던 것으로 추정되며, 그래서 무작위 연결의 의미를 찾기 위한 시도를 한 것 같다.
‘오토ML(AutoML)’이라 불리는 대부분의 기존 망 자동 생성기는 모든 부분을 자동 생성할 경우 채널 수와 입출력 크기가 맞지 않아 연결이 불가능한 구조가 나올 수 있기 때문에 수작업으로 만든 기존 유명 망의 일부를 코어로 정하고 그것들의 배열이나 연결의 일부만을 변경시키는 방식을 사용했다. 그래서 자유도 관점에서 제한이 많기 때문에 진정한 의미의 무작위 망이라고 볼 수 없었다.
페이스북 연구팀은 이 문제를 슬기롭게 극복하면서 진보된 구조를 제안한다. 채널 수와 입출력 크기가 맞지 않는 문제를 극복하기 위해 전체 망을 여러 개의 그룹으로 나누고 그룹 내 요소들만 무작위 그래프 생성기로 생성한다. 무작위 그래프 생성기를 통해 선과 노드를 형성한 다음, 연결선은 그대로 사용하지만 연결선이 만나는 노드를 신경망의 기본 구성요소로 치환해주면 문제가 깔끔하게 해결된다. 즉 신경망의 구조를 따르면서 거의 무작위로 연결 가능한 망을 얻게 된 것이다.
이렇게 생성된 망의 복잡도는 노드의 수에 비례한다. 레스넷처럼 수작업으로 설계한 비슷한 복잡도의 망과 비교실험을 해보면 망 연결 방식에 따른 성능 차를 확인할 수 있게 된다. 비록 그 차가 크지는 않지만 무작위로 연결한 방식의 결과가 더 좋았다.
페이스북 연구팀의 결과는 향후 신경망 구조 연구의 방향을 변화시킬 것 같다. 사람들이 직접 특징을 추출하던 방식이 신경망의 등장과 더불어 망을 통해 자동 추출하는 것으로 바뀌었듯이 수작업으로 망의 구조를 설계하는 방식은 최적화된 망의 구조를 무작위로 탐색하는 망 생성기를 통해 최적의 모델 집단을 만들어내는 방식으로 빠르게 전환할 것으로 전망된다.