17일 정부 행정전산망이 마비된 원인이 네트워크 장비인 라우터(서로 다른 네트워크를 연결해주는 장치) 불량 때문인 것으로 나타났다. 해킹 징후는 발견되지 않았다.
고기동 행안부 차관과 송상효 숭실대 교수 등 '지방행정전산서비스 개편 태스크포스(TF)' 공동 팀장은 25일 정부서울청사에서 진행된 '지방행정전산서비스 장애 원인 및 향후 대책 브리핑'에서 이같이 밝혔다.
TF는 이번 장애의 원인이 네트워크 영역에서 발생했을 확률이 높다고 분석했다. 행안부는 장애 후 네트워크 장비를 대상으로 성능을 점검하기 위해 구간을 나눠 반복적인 부하 테스트를 진행했다. 장애 및 접속 지연이 발생한 영역을 확인하는 방식으로 장애 유발 원인을 좁혔다.
그 결과 네트워크 장비인 라우터에서 패킷(데이터의 전송단위)을 전송할 때 용량이 큰 패킷이 유실되는 현상이 관찰됐다. 특히 1500바이트 이상의 패킷은 약 90%가 유실됐다.
이 현상의 원인은 라우터 장비의 케이블을 연결하는 모듈에 있는 포트 중 일부가 이상이 있었기 때문인 것으로 분석됐다. 송 교수는 "패킷이 유실돼 통합검증서버가 라우터로부터 서비스 제공에 필요한 패킷을 정상적으로 수신할 수 없었다"며 "지연이 중첩돼 작업을 정상적으로 수행할 수 없는 상황에 이르게 된 것"이라고 설명했다.
TF에 따르면 17일 첫 장애 후 정상 작동하지 않던 L4(네트워크 장비의 일종) 스위치를 고성능 장비로 교체했다. 교체 후에도 일부 기능에 지연 현상이 발견돼 광주센터와 대전센터를 연결하는 라우터를 상세 분석했다. 그 결과 포트 불량이 발견돼 다른 포트로 연결하자 지연 현상이 해소됐다.
다만 불량 외 다른 오류가 있을 가능성을 배제할 수 없어 서버에서 발생한 로그(컴퓨터 시스템에서 발생하는 활동을 기록한 파일)를 분석하고 다양한 네트워크 구간에서 장비의 이상을 검증하고 테스트하는 과정을 거쳤다.
송 교수는 "앞서 말씀드린 라우터 장비의 불량 외에는 다른 이상 현상을 발견할 수 없었다"며 "이러한 검증 과정을 거치느라 장애 발생일 후 원인을 발표하기까지 오래 걸렸으나 이번 장애가 가지는 사안의 중요성, 관련 시스템의 복잡성을 고려했을 때 종합적인 검토와 충분한 검증이 필요했다"고 말했다.
TF는 해킹에 대해서도 모든 가능성을 열어놓고 확인했으나 현재까지는 해킹 징후가 보이지 않는다고 했다. 고 차관은 이번 사태의 재발을 방지하기 위해 수립하는 종합대책을 설명했다.
행안부는 먼저 이번과 유사한 포트 불량이 있을 수 있는 오래된 장비들에 대해 전수 점검할 계획이다. 또한 장애 발생 시의 처리 매뉴얼을 보완해 국민에게 신속히 안내할 수 있도록 하고, 신속한 복구조치가 가능한 체계를 마련할 예정이다. 아울러 핵심 디지털정부 서비스가 중단되는 상황에서도 행정서비스가 제공될 수 있도록 행정조치 방안을 마련하기로 했다.
끝으로 디지털정부를 안정적으로 운영하기 위해 범정부 디지털정부 위기대응체계를 확립하고 공공정보화사업 추진방식을 개선하는 등 중장기적인 제도 개선방안을 준비할 방침이다. 행안부 네트워크망을 도맡아 관리하는 국가정보자원관리원의 운영방식 또한 전면 재검토하기로 했다.
고 차관은 "다시는 유사한 문제로 국민이 불편을 겪지 않도록 어떠한 상황에서도 중단 없는 안정적인 디지털정부를 만들어 나가겠다"며 "세계적 수준의 디지털정부 명성에 걸맞은 편리하면서도 보다 안정성 높은 서비스를 제공할 수 있도록 최선을 다할 것"이라고 강조했다.