경제성을 고려한 CEP 기반의 의료기관 데이터 실시간 분석 시스템 구현에 관한 연구
= A study on the real-time analysis implementation of CEP-based medical institutions in consideration of the economic efficiency
- 초록 (Abstract)
- 스마트 시대의 소셜 네트워크, 사물인터넷, 라이프 로그 데이터 등은 빅데이터 시대 진입에 중요한 요소들이다. 스마트 단말기는 수많은 데이터를 생산하고, 그 기기들로부터 생산되는 수많...
- 스마트 시대의 소셜 네트워크, 사물인터넷, 라이프 로그 데이터 등은 빅데이터 시대 진입에 중요한 요소들이다. 스마트 단말기는 수많은 데이터를 생산하고, 그 기기들로부터 생산되는 수많은 데이터들은 분산 파일 형태로 수집되어 중요한 정보로 가공된다. 빅데이터 분야는 최근 많은 기술 및 학문 분야에서 각광받고 있는 분석 기술 경향의 하나로, 이 기술이 소개됨에 따라 기존에는 분석하기 어려웠던 여러 가지 데이터들에 대한 새로운 분석 및 해석이 가능하게 되었다. 이에 따라 다양한 분야에서 빅데이터 수집 및 분석기법을 적용하여 유의미한 분석 결과를 내놓고 있어 앞으로 활용가능성이 매우 높을 것으로 보고 있다. 개개인의 데이터가 비즈니스적으로 중요하지 않을 수 있지만, 대량으로 모으면 그 안에 숨겨진 새로운 정보를 발견할 가능성이 있는 데이터의 집합체로 빅데이터 분석 활용 사례는 점차 늘어나는 추세이다. 빅데이터 분석 기술 중 전통적인 데이터 분석 방법인 Hadoop은 예전부터 배치성 처리 시스템으로 데이터가 많아질수록 응답 지연이 발생할 가능성이 높아, 현재 기업 경영환경과 시장환경에 대한 엄청난 양의 고속 이벤트 데이터에 대한 실시간 분석이 어려운 상황이다. 또한 다양한 기업군에서 빅데이터 분석 정보를 활용하길 원하지만, 빅데이터 솔루션은 대부분 고비용의 문제로 도입해서 사용하기 힘든 실정이다. 빅데이터 분석 활용 중 특히 주목받고 있는 분야가 의료보건 분야이다. 인구 고령화에 따른 만성병 및 퇴행성 질환의 증가로 인해 보건의료 분야에서는 빅데이터를 의료비 절감, 전염병 예방, 의료 서비스의 질 향상에 활용하고자 다양한 연구들이 시도되고 있으며, 효율적인 진단 및 처치 방법의 탐색, 예후 예측 등에 효과적인 대안 방법들이 제시되고 있다. 맥킨지 보고서에서도 의료분야 가치는 국민의료비의 절감과 혁신적인 임상연구를 가능케 하는 것과 연관이 매우 깊을 것이라 보고하고 있다. 본 논문에서는 빅데이터 기술을 활용하여 중·소규모의 의료기관들을 대상으로 저비용의 빅데이터 시스템을 구축하였다. 구축된 실시간 빅데이터 분석 시스템은 CEP 기반 오픈 플랫폼을 기반으로 구현하였으며, 이벤트 기반 실시간 분석 메커니즘을 보완하여 보건의료 분야에서 생성되는 방대한 양의 데이터를 실시간 분석 가능하도록 설계하여 효율적인 진단 및 처치 방법과 의료관련 정보 등 효과적인 환자 관리 및 의료기관의 경영관리 등을 체계적으로 제공할 수 있도록 시스템을 구축하였다. 또한, CEP 기반의 실시간 분석을 위해서 실시간으로 유입되는 데이터의 이벤트 처리에 대한 알고리즘을 설계하였고, 실시간 데이터 처리 알고리즘에 대한 성능검증을 통해 전체시스템의 성능 개선효과를 입증하였다.
- 목차 (Table of Contents)
- 1. 서 론 1
- 1.1. 연구 배경 및 필요성 1
- 1.2. 논문 시스템 개략도 3
- 1.3. 논문 구성 4
- 2. 관련 연구 5
- 2.1. 관련 연구 사례 분석 5
- 2.2. 실시간 빅데이터 분석 시스템 8
- 2.2.1. 실시간 빅데이터 분산 시스템의 개요 8
- 2.2.2. Hadoop 기술의 현황과 그 한계 9
- 2.3. Hadoop 기반과 CEP 기반 11
- 2.3.1. Hadoop 11
- 2.3.2. CEP(Complex Event Process) 18
- 2.3.3. 빅데이터 접근방식에 대한 Hadoop과 CEP 비교 22
- 2.3.4. 이벤트 처리 시스템 23
- 2.4. Hadoop 2.0 기반 26
- 2.4.1. Hadoop 2.0의 개요 26
- 2.4.2. Hadoop 2.0의 구성 요소 29
- 2.3.2.1. Resource Manager 30
- 2.3.2.2. Node Manager 31
- 2.4.3. Hadoop 2.0의 동작방식 32
- 2.5. CEP 기반 34
- 2.5.1. Esper 34
- 2.5.2. Siddhi 36
- 3. CEP 기반 실시간 분석 시스템 구축 39
- 3.1. 시스템의 구성 39
- 3.1.1. Event Adaptor 40
- 3.1.2. CEP Analysis Engine 42
- 3.1.3. Event Generator 43
- 3.1.4. Reporter 49
- 3.2. 시스템 설계 및 구현 51
- 3.2.1. CEP기반 실시간 분석 시스템 컴포넌트 구성 51
- 3.2.1.1. Event Collector 52
- 3.2.1.2. Big Data Analyzer 53
- 3.2.1.3. Event Generator 54
- 3.2.1.4. Reporter 56
- 3.2.2. 시스템 데이터베이스 설계 57
- 3.2.3. 시스템 프로세스 설계 69
- 3.2.3.1. 전체 시스템 업무처리 프로세스 69
- 3.2.3.2. 이벤트 업무처리 프로세스 70
- 3.2.3.3. Dashboard 업무처리 프로세스 71
- 3.2.4. 실시간 처리 알고리즘 설계 72
- 3.2.4.1. 실시간 데이터 처리 흐름도 76
- 3.2.4.2. Write(쓰기) 77
- 3.2.4.3. Read(읽기) 78
- 3.2.5. 웹 기반 시스템 UI Interface 구현 80
- 3.2.5.1. 실시간 Dashboard 80
- 3.2.5.2. Report 프로세스 81
- 3.2.5.3. Social분석 82
- 3.2.5.4. 실시간 환자분포도 83
- 3.2.5.5. 재고관리 84
- 3.2.5.6. 수납관리 85
- 3.2.5.7. 환자정보 86
- 3.2.6. 모바일 기반 시스템 UI Interface 구현 87
- 3.2.6.1. 모바일 UI Interface 메인 화면 87
- 3.2.6.2. 의료진 정보화면 89
- 3.2.6.3. 나의 서비스화면 91
- 3.2.6.4. 병원 안내 화면 94
- 4. 시스템 평가 95
- 4.1. 빅데이터 실시간 처리 시스템 95
- 4.1.1. Agent 96
- 4.1.2. 입력어댑터(Input Adaptor) 96
- 4.1.3. 이벤트 빌더 96
- 4.1.4. SIDDHI Engine 96
- 4.1.5. 이벤트 포맷터(Event Formatter) 96
- 4.1.6. 출력어댑터(Output Adaptor) 96
- 4.2. 웹 기반 성능평가 항목 테스트 97
- 4.2.1. 웹 기반 테스트 항목 및 시험 기준 97
- 4.2.2. 웹 기반 테스트 환경 98
- 4.3. 웹 기반 기능시험 방법 및 결과 99
- 4.3.1. 로그인 기능 99
- 4.3.2. 실행계획 기능 100
- 4.3.3. 이벤트스트림 기능 101
- 4.3.4. 정지/재시작 기능 102
- 4.3.5. 애플리케이션 로그 103
- 4.3.6. 시스템 로그 기능 104
- 4.3.7. 시스템 통계 기능 105
- 4.3.8. 이벤트 통계 기능 106
- 4.3.9. 시스템 로그 기능 108
- 4.3.10. 이벤트 흐름 기능 109
- 4.3.11. 이벤트 트레이서 기능 110
- 4.3.12. 메시지 흐름 기능 111
- 4.3.13. 사용자 관리 기능 112
- 4.3.14. 입력 이벤트 어댑터 기능 113
- 4.3.15. 출력 이벤트 어댑터 기능 115
- 4.3.16. 로깅 기능 117
- 4.4. 모바일 기반 성능평가 항목 테스트 118
- 4.4.1. 모바일 기반 테스트 항목 및 시험 기준 118
- 4.4.2. 모바일 기반 테스트 환경 118
- 4.5. 모바일 기반 기능시험 방법 및 결과 119
- 4.5.1. 센터 리스트 확인 기능 119
- 4.5.2. 진료과 리스트 확인 기능 120
- 4.5.3. 클리닉 리스트 확인 기능 121
- 4.5.4. 인적사항 확인 기능 122
- 4.5.5. 나의식단 확인 기능 124
- 4.5.6. 건강검진 확인 기능 126
- 4.5.7. 건강정보 확인 기능 128
- 4.5.8. NEWS 확인 기능 129
- 4.5.9. 병원 안내 확인 기능 130
- 4.6. 빅데이터 서버 기능 테스트 131
- 4.6.1. 테스트 항목 및 시험 기준 131
- 4.6.2. 테스트 환경 132
- 4.6.3. 기능시험 방법 및 결과 133
- 4.7. 실시간 데이터 처리 알고리즘 실험 결과 137
- 4.7.1. 테스트 방법 및 결과 137
- 4.7.2. 데드라인 파라미터 수정 수 테스트 결과 139
- 4.8. Hadoop 2.0 기반과 제안한 CEP 기반 분석 시스템 성능 테스트 140
- 4.8.1. 테스트 방법 및 성능 테스트 결과 140
- 5. 결 론 144
- 6. 참고문헌 146