빅데이터를 기반으로 제2형 당뇨를 예측할 수 있는 모델이 국내 의료진에 의해 개발됐다.
고려대학교 구로병원 심혈관센터 나승운 교수팀(고려대학교 보건과학대학 최병걸 연구교수, 서울대학교 기계항공공학부 노영균 BK조교수)은 ‘전자의무기록(EMR) 빅데이터 분석 기반 머신러닝(Machine Learning, 기계학습) 기술을 활용한 제 2형 당뇨병 발병 예측모델 개발’ 결과를 24일 발표했다.
연구팀은 전자의무기록 자료로부터 추출한 28가지의 환자정보(유병질환, 검사결과, 투약정보 등)를 변수로 해 비당뇨환자 8454명을 분석했다. 5년의 추적관찰 기간 동안 발생한 제2형 당뇨의 유병율은 4.78%였으며, 본 연구의 핵심인 머신러닝 알고리즘을 적용하여 개발된 제 2형 당뇨 예측모델의 성능은 70~80% 정도로 일관된 판별 능력을 보였다.
제2형 당뇨란 인체의 혈당 신진대사가 손상되고, 혈당수치가 높아지는 만성질환이다. 제2형 당뇨가 심·뇌혈관질환 환자들에게 장·단기적 악영향을 미친다는 것은 잘 알려져 있는 사실이다. 따라서 생활습관 개선 및 약물치료를 통해 합병증을 예방하고 제2형 당뇨 발병률을 낮추는 것이 매우 중요하다.
지난 수 십 년간 많은 연구를 통해 제2형 당뇨 예측모델이 제시됐다. 그러나 기존의 예측모델은 사용자의 편의성과 반복 정밀도에 한계가 있었다. 이번 연구는 기존의 한계를 극복한 전자의무기록과 머신러닝을 활용힌 제2형 당뇨의 고성능 예측모델을 개발하고, 이 모델의 성능을 기존의 통계방법과 비교하기 위해 진행됐다.
나승운 교수는 “본 연구는 4차 산업혁명의 미래하고 할 수 있는 빅데이터 분석을 기반으로 한 머신러닝을 통해 2형 당뇨병 등의 질병이 발병하기 전에 예방법을 제시하고, 발병하더라도 최적의 개인 맞춤 치료법을 제시한다는 점에서 중요한 의미를 갖는다”며 연구 의의를 밝혔다.
최병걸 교수는 “2형 당뇨는 만성질환 중 하나로, 5년의 추적관찰기간은 질병의 진행에 매우 짧은 기간일 수 있기 때문에 10년~20년 이상의 자료를 분석 시 예측 성능이 더욱 향상될 것”이라고 말했다.
한편 이번 논문은 국제학술지 ‘Yonsei Medical Journal’ 2월호에 게재될 예정이며, 1월 22일 본지 온라인 판에 게재됐다.
유수인 기자 suin92710@kukinews.com