17일 정부 행정전산망이 마비된 원인이 네트워크 장비인 라우터(서로 다른 네트워크를 연결해주는 장치)의 포트 불량 때문이었던 것으로 최종 결론이 났다. 정부 조사 결과 해킹 징후는 발견되지 않았다.
고기동 행정안전부 차관과 송상효 숭실대 교수 등 '지방행정전산서비스 개편 태스크포스(TF)' 공동 팀장은 25일 정부서울청사에서 진행된 '지방행정전산서비스 장애 원인 및 향후 대책 브리핑'에서 이같이 밝혔다. TF는 이번 장애의 원인이 네트워크 영역에서 발생했을 확률이 높다고 분석했다.
다만 기존에 원인으로 지목했던 L4(네트워크 장비의 일종) 스위치의 문제가 아닌 라우터 문제로 확인했다. 행안부는 장애 후 네트워크 장비를 대상으로 성능을 점검하고자 구간을 나누어 반복적인 부하 테스트를 진행했다. 테스트를 통해 장애 및 접속 지연이 발생한 영역을 확인한 뒤 장애 유발 원인을 좁혔다. 그 결과 네트워크 장비인 라우터에서 패킷(데이터의 전송단위)을 전송할 때 용량이 큰 패킷이 유실되는 현상이 관찰됐다. 특히 1500바이트 이상의 패킷은 약 90%가 유실됐다.
이 현상의 원인은 라우터 장비의 케이블을 연결하는 모듈에 있는 포트 중 일부가 이상이 있었기 때문인 것으로 나타났다. 송 교수는 "패킷이 유실돼 통합검증서버가 라우터로부터 서비스 제공에 필요한 패킷을 정상적으로 수신할 수 없었다"며 "지연이 중첩돼 작업을 정상적으로 수행할 수 없는 상황에 이르게 된 것"이라고 설명했다.
지방행정전산서비스를 관리하는 국가정보자원관리원의 이재용 원장은 "이번과 같은 장비의 물리적인 손상은 원인을 밝히기 어려우나 장비가 2016년에 도입돼 노후한 것은 아니다"며 "매일 시스템을 점검하지만 장비의 고장은 발생 전에 예측하기 어렵다"고 밝혔다.
TF에 따르면 17일 첫 장애 후 정상 작동하지 않던 L4 스위치를 고성능 장비로 교체했고, 교체 후에도 일부 기능에 지연 현상이 발견돼 광주센터와 대전센터를 연결하는 라우터를 상세 분석했다. 그 결과 포트 불량이 발견돼 다른 포트로 연결하자 지연 현상이 해소됐다.
다만 불량 외 다른 오류가 있을 가능성이 있어 서버에서 발생한 로그(컴퓨터 시스템에서 발생하는 활동을 기록한 파일)를 분석하고 다양한 네트워크 구간에서 장비 이상을 검증하고 테스트하는 과정을 거쳤으나 별다른 문제는 발견되지 않았다.
송 교수는 "앞서 말씀드린 라우터 장비의 불량 외에는 다른 이상 현상을 발견할 수 없었다"며 "이러한 검증 과정을 거치느라 장애 발생일 후 원인을 발표하기까지 오래 걸렸다"고 밝혔다. 이어 "이번 장애가 가지는 사안의 중요성, 관련 시스템의 복잡성을 고려했을 때 종합적인 검토와 충분한 검증이 필요했다"고 그간 과정을 설명했다.
TF는 해킹에 대해서도 모든 가능성을 열어놓고 확인했으나 현재까지는 해킹 징후가 보이지 않는다고 밝혔다. 고 차관은 이번 사태의 재발을 방지하기 위해 문제점을 하나하나 들여다보면서 근본적이고 실효성있는 보완대책을 마련하겠다고 약속했다.
행안부는 먼저 이번과 유사한 포트 불량이 있을 수 있는 오래된 장비들을 전수 점검할 계획이다. 또한 장애 발생 시 처리 매뉴얼을 보완해 국민에게 신속히 안내할 수 있도록 하고, 신속한 복구 조치가 가능한 체계를 마련하기로 했다. 디지털정부를 안정적으로 운영하기 위해 범정부 위기대응체계를 확립하고 공공정보화사업 추진방식을 개선하는 등 중장기적 제도 개선을 준비할 방침이다.
고 차관은 "다시는 유사한 문제로 국민이 불편을 겪지 않도록, 어떠한 상황에서도 중단 없는 안정적인 디지털정부를 만들어 나가겠다"며 "세계적 수준의 디지털정부 명성에 걸맞은 편리하면서도 보다 안정성 높은 서비스를 제공할 수 있도록 최선을 다할 것"이라고 강조했다.