정부가 사흘 만에 네트워크 장애로 인해 행정전산망이 먹통이 됐다고 설명했지만 근본적인 장애 원인은 정확하게 밝혀지지 않았다. 정부는 서버 이중화도 갖추고 있으며 노후화나 해킹은 아니라고 해명하면서도 네트워크 장비 문제의 구체적인 이유에 대해서는 설명을 미뤘다. 이 때문에 안일했던 문제 인식과 함께 관리에서 대처까지 시스템이 심각하게 미비하다는 비판이 나온다. 또 공공 전산망 구축 시 대기업을 배제한 정책의 부작용이 드러났다는 지적도 제기된다.
서보람 행정안전부 디지털정부실장은 19일 브리핑에서 장애 원인 발표까지 사흘이 걸린 이유에 대해 “18일 오전 9시에 정부24 서비스를 재개했으므로 실질적으로 문제가 발생한 시간은 하루가 조금 넘는다”면서 “다만 어디가 문제인지 구체적으로 밝히는 것은 또 다른 문제를 야기할 수 있어 조금 더 신중하게 하겠다”고 밝혔다. 정부는 해킹 여부에 대해서는 이상 징후는 없었다고 설명했다.
서 실장은 또 “장비 문제가 발생하지 않도록 이중화해서 운영하고 있는데 당일에는 두 개의 장비가 순차적으로 계속 문제를 일으켰다”며 “해당 장비는 국가정보자원관리원에서 수십 대의 동일 장비를 운영하면서 문제가 발생하지 않았다”고 말했다. 백업 시스템이 작동하지 않았는데도 그저 어쩔 수 없었다는 해명이다.
정보통신기술(ICT) 업계를 중심으로 16일 밤 대전 국가정보자원관리원에서 관련 프로그램 업데이트를 실시한 것이 네트워크 장비(L4 스위치) 문제로 이어져 정부공개키인프라(GPKI) 인증 시스템 장애를 촉발했다는 분석이 나온다. 동시에 업데이트를 진행하면서 문제가 발생했다고 추정한다.
하지만 은행 등 민간 기업과 달리 왜 휴일이 아닌 평일에 업데이트를 했는지는 의문이다. 권헌영 고려대 정보보호대학원 교수는 “소프트웨어(SW) 결함인지, L4 스위치에 생기는 장비의 문제인지는 더 조사를 해야 명확하게 나올 것”이라며 “365일 24시간 운영하는 국가 서비스는 미리 안내하고 잠시 중단하더라도 점검 시간을 확보할 필요가 있다”고 지적했다.
전문가들은 그간 서버 업데이트 과정에서 큰 문제가 없어 이용자가 몰리는 평일에 안일하게 한 것으로 보고 있다. 일각에서는 하드웨어가 아닌 데이터와 같은 SW 문제가 이번 사태의 원인일 수 있다는 관측도 있다. L4 스위치의 문제였다면 롤백(패치 이후 문제가 나타나 다시 원래대로 되돌리는 것)을 했을 때, 또 장비를 교체했을 때 ‘왜 바로 정상화되지 않았는지’ 의문이 남기 때문이다.
김명주 서울여대 정보보호학과 교수는 “어떤 상황이건 업무가 끊기지 않아야 하는 연속성(BCP)과 이른 시간 내 복구해야 하는 기본 원칙(DRP)이 지켜지지 않았다”고 꼬집었다. 문송천 한국과학기술원(KAIST) 경영대학원 명예교수는 “장비 문제라면 몇 시간 안에 해결할 수 있다”며 “데이터 설계가 잘못돼 전산망 마비 사태가 발생했을 가능성이 크다”고 분석했다.
분리 발주를 통해 대기업은 배제한 채 중소기업들이 공공 SW 사업에 대거 참여하면서 문제가 커졌다는 해석도 있다. 대기업 또한 공공 SW 사업 참여가 가능하지만 중소기업과 컨소시엄을 구성해야 사업 수주가 가능한 구조여서 중소기업이 도맡아 하는 분야가 많다.
실제 정부의 공공 SW 사업 배정 규칙 등을 살펴보면 사업의 최소 50%를 중소기업에 할당해야 5점 만점의 가산점을 받을 수 있다. 컨소시엄 구성과 관련한 현행 기준 때문에 현장에서는 실제 기업들의 업무 역량이나 기술 수준을 고려하지 않은 채 업무 분장이 이뤄질 수밖에 없는 구조다. 시스템통합(SI) 업계에서는 앞서 벌어진 교육부 4세대 나이스(NEIS·교육행정정보시스템) 먹통 사태 또한 이 같은 대기업의 공공사업 참여 제한과 연관성이 적지 않다고 본다.
SW 업계 관계자는 “중소·중견기업들도 역량이 높아진 만큼 관련 사업 참여에 대한 대기업 관련 규제를 어느 정도 완화할 필요가 있다”며 “특정 공공 SW 사업은 국민 일상과 관련이 깊은 만큼 실력 있는 기업이 맡아서 할 수 있게 제도를 정비할 필요가 있어 보인다”고 밝혔다.