카카오가 최근 3차례 연속 서비스 장애를 빚은 것과 관련해 정부가 시정 요구에 나섰다.
과학기술정보통신부(과기부)는 카카오에 통신재난과 관련해 1개월 이내에 개선 조치계획을 수립해 제출하고 3개월 내에 시정결과를 제출하도록 했다고 31일 밝혔다.
과기부는 지난 21일과 23일 카카오 통신재난 관리계획의 이행 여부를 점검했다. 이후 지난 28일~30일 통신재난관리심의위원회를 열고 카카오의 미흡사항에 대한 시정조치를 요구사항으로 심의·의결했다.
카카오의 메신저 플랫폼인 카카오톡에서는 지난 13일과 지난 20일, 지난 21일 서비스 장애가 발생했다. 장애는 짧게는 6분, 길게는 54분가량 지속됐다.
13일 발생한 첫 장애에서는 카카오톡 이용자의 약 80%가 카카오톡 메시지 발신 지역과 실패로 불편을 겪었을 것으로 추정된다. 데이터센터 서버의 파일을 업데이트하는 중 기존 파일을 삭제하는 과정에서 오류가 발생한 것으로 전해졌다. 카카오는 작업 진행 전 사전테스트를 실시하지 않아 오류에 대비하지 못한 것으로 확인됐다.
두 번째 장애도 첫 장애와 비슷한 불편을 일으켰다. 그러나 원인은 달랐다. 네트워크 부하 분산을 위한 내부시스템 기능 개선 작업 중 발생한 오류가 원인으로 꼽혔다. 카카오는 이때는 사전테스트를 실시했으나 개별결과물의 테스트 환경이 실제 카카오톡 운영환경과 차이가 커 미리 장애 가능성을 식별하지 못했다.
가장 길었던 21일 장애는 카카오톡 이용자의 약 8%가 영향을 받았을 것으로 추정된다. PC용 카카오톡 로그인 실패 및 모바일용 카카오톡 메시지 수발신 지연 등이 발생했다. 이번 장애는 두 번째 장애를 일으킨 서버의 오류를 미해결한 상태에서 동일 데이터센터에 있는 다른 서버에 Java 프로그램 업데이트를 진행한 것이 원인이었다.
과기부는 △주요 작업 전 사전테스트 체계 강화 △작업관리 통제 강화 △통신재난 관련 매뉴얼 및 지침 보완 △모니터링 시스템 고도화를 통한 장애 탐지 강화 △장애 원인분석, 사후관리 체계화 △장애 사실 이용자 고지 개선 등의 책임 있는 대책 마련을 촉구했다.
이종호 과기부 장관은 “국민 생활에 큰 영향을 주는 디지털 서비스 장애가 다시는 반복되지 않아야 한다”며 “디지털 서비스 장애는 국민 일상의 불편을 넘어 사회·경제 전반에 지대한 영향을 끼치는 만큼 재발방지를 위해 사업자의 관리체계를 면밀히 점검하겠다. 카카오도 재난·장애 관리를 위한 조직문화 개선과 함께 이용자에게 편리하고 안정적인 서비스 제공을 다할 필요가 있다”고 밝혔다.
이소연 기자 soyeon@kukinews.com