4차 산업혁명에서의 공공빅데이터를 활용한 보건의료 정책 연구 : 노인 인구 치매예측 모델 개발을 중심으로
= A Study on Healthcare Policy using Public Big Data in the Fourth Industrial Revolution: Focusing on the Development of Dementia Predictive Model for the Senior Population
- 저자[authors] 김희철
- 발행사항 서울 : 과학기술연합대학원대학교, 2018
- 형태사항[Description] ; 26 cm
- 일반주기명[Note] 지도교수: 문영호
- 학위논문사항[Dissertation] 학위논문(박사)-- 과학기술연합대학원대학교 : 과학기술경영정책(ScienceandTechnologyManagementPolicy) 2018.2
- 발행국(발행지)[Country] 서울
- 출판년[Publication Year] 2018
- 주제어 치매,고령화,빅데이터,기계학습,4차 산업혁명
- 소장기관[Holding] 과학기술연합대학원대학교 (230003)
- UCI식별코드 I804:30003-200000011419
초록[abstracts]
한국의 보건의료 정책 문제 중 하나인 고령화는 점점 심화되고 있으며, 빠른 고령화는 여러 가지 사회적 문제를 만든다. 고령화에 의한 증상 중의 하나인 치매로부터 발생하는 보건의료 정책 문제를 해결하고자 국민건강보험공단 노인코호트 데이터베이스의 빅데이터를 활용하여, 치매 예측 연구를 하였다.
치매노인과 정상노인 간에는 증상의 유무에 따라 의료기록 상의 차이가 발생할 것이다. 의료 기록 중에서도 진료내역의 시계열적 변화를 치매 증상이 시작되기 전에 찾아내어 측정하게 된다면 치매를 예측 할 수 있을 것이다. 예측 모델 개발을 위해 국민건강보험공단 노인코호트 데이터베이스 중에서 자격DB, 진료DB, 건강검진 DB에서 변수들을 추출하였다. 기계학습 기법 중 의사결정나무 (Decision tree: DT), 랜덤 포레스트 (Random Forest: RF), 지지벡터기계 (Support Vector Machine: SVM), 딥 러닝 (Deep Learning: DL) 을 사용하여 모델을 만들었으며, 10-fold validation을 수행하였다. 그 결과 0.8268 F-Measure로 치매를 예측하는 모델을 만들었다.
한국 전체 인구를 대표하는 표본을 대상으로 수행된 연구로 시계열 관련 변수들의 영향력이 상대적으로 큰 것을 확인하였다. 빅데이터를 활용한 질병의 예측 연구들을 통해 보건의료 정책 문제의 완화가 될 수 있을 것이라 기대된다.
초록[abstracts]
Issue of public health in Korea has been exacerbated by the aging of its population; such rapid aging creates many kinds of social problems. The proposed approach aims to solve the issue of public health care caused by dementia, which is one of the most significant symptoms of aging. The proposed approach performed dementia predicting study using the big data provided by the National Health Insurance Service Senior Cohort Database.
Between dementia group and normal control group, there may have different patterns in medical history. Prediction performance of dementia might be increased if time series patterns of dementia are recognized. The proposed approach selected features from the personal disease history, sociodemographic data, the personal health
examination in the personal medical history to develop a prediction model. The model used machine learning technique of decision tree (DT), random forest (RF), support vector machine (SVM), deep learning (DL) technique, and 10-fold cross validation was conducted. The experimental results showed an encouraging performance, 0.8268 F-measure.
The proposed approach was conducted on representative samples of Korean population and proved the significant influence of the personal disease history features. It is expected that big data based disease prediction might be contributing to solving the problems of public health care.