“판교데이터센터 화재 이전 이상 징후 없었다”

“판교데이터센터 화재 이전 이상 징후 없었다”

과기정통부, 디지털 서비스 장애 조사결과 발표
SK C&C, 리튬이온배터리 설치 후 특화 방화조치 안해

기사승인 2022-12-06 19:24:09
SK㈜ C&C

지난 10월 15일 SK㈜ C&C 판교데이터센터에서 화재가 발생하기 직전까지 이상 징후는 없었던 것으로 판단됐다.

과학기술정보통신부는 6일 판교센터 화재와 카카오·네이버 등 부가통신 서비스 장애 조사결과를 발표했다.

발표에 따르면 화재는 이날 오후 5시 19분 데이터센터 지하 3층 배터리 실에서 발생했다. 불은 당일 오후 11시 45분에 완전히 꺼졌다. 전력은 19일 새벽 5시경 복구됐다.

화재 진압과 건물 전력 차단으로 카카오와 네이버 등 입주기업 서비스가 중단됐다. 카카오는 서비스 복구까지 127시간 33분이, 네이버는 약 20분에서 12시간이 걸렸다.

센터는 배터리 온도나 전압을 점검하는 시스템(BMS)을 갖추고 있다. 화재발생 직전까지 BMS에 이상 징후는 감지되지 않았던 것으로 나타났다.

정부는 “화재가 발생하고 가스 소화 장비가 작동했지만 가스 소화가 어려운 리튬이온배터리 화재 특성 상 초기 진압에 한계가 있었다”며 당시 상황을 전했다.

SK㈜ C&C는 2016년 리튬이온배터리를 설치한 뒤로 특화한 방화조치를 한 적이 없었던 것으로 알려졌다.

그러면서 “리튬이온배터리가 일부 무정전전원장치(UPS)와 분리되지 않은 공간에 배치돼있어서 화재 열기 등으로 UPS 작동이 중지됐고, 일부 전원공급도 중단됐다”고 설명했다.

전체전력을 차단해야 했던 배경으론 “배터리 상단에 포설돼있던 전력선이 화재로 손상됐고 화재 진압을 위한 살수 시 누전 등 2차 피해 우려가 있었다”고 밝혔다.

카카오 복구 지연에 관해선 “서비스 기능을 5개 레이어로 구분하고 판교 데이터센터와 기타 센터 간 동작-대기 체계로 이중화했으나 이번 사고 시 대기 시스템이 제대로 동작하지 못했다”고 지적했다.

대기 서버를 동작으로 만들기 위한 권한관리 기능인 ‘운영 및 관리도구’가 판교 데이터센터 내에서만 이중화한 게 화근이 됐다는 것.
SK㈜ C&C 판교 데이터센터 화재 전개 과정 개요도


이어 “타 데이터센터에 이중화를 안 해 판교 데이터센터 동작서버 작동 불능 시 서비스 장애 복구가 지연됐다”고 밝혔다.

정부는 또 △일부 서비스 구성요소가 데이터센터 간 이중화 미흡 △카카오 인증 등 핵심 기능 판교센터 집중 심화를 피해 확대 원인으로 진단했다. 

네이버에 관해선 “데이터센터 간 이중화 조치를 해 서비스 중단은 없었으나 타 데이터센터로 서비스 전환 과정 등에서 일부 기능에 오류가 발생했다”라며 “대부분 기능 오류는 다른 기능보다 상대적으로 낮은 복구 우선순위, 복구하는 데이터 무결성 확인 등 이유로 복구에 시간이 소요됐다”고 설명했다. 

정부는 이날 서비스 중단 당사 기업인 SK㈜ C&C와 카카오, 네이버에 한 달 이내에 주요 사고원인을 개선하고 재발방치 계획을 수립해 제출하라고 요구했다. 


송금종 기자 song@kukinews.com
송금종 기자
song@kukinews.com
송금종 기자
이 기사 어떻게 생각하세요
  • 추천해요
    0
  • 슬퍼요
    0
  • 화나요
    0
추천기사
많이 본 기사
오피니언
실시간