의학 기사를 중심으로 한 국내 뉴스 Linked Open Data 구축
http://www.riss.kr/link?id=T14165620 ]
- 기타서명
Linked Open Data Construction for Korean Healthcare News
- 저자
장종선
- 형태사항
vii,53 p. : 삽화 ; 26 cm.
- 일반주기
충북대학교 논문은 저작권에 의해 보호됩니다
지도교수:조완섭
참고문헌 : p.49-51
- 학위논문사항
학위논문(석사)-- 충북대학교 일반대학원 : 비즈니스데이터융합학과 2016. 8
- KDC
005.76 5
- 발행국
충청북도
- 언어
한국어
- 출판년
2016
초록 (Abstract)
- 디지털 기술의 발전과 인터넷 환경의 보급으로 말미암아 언론 소비의 형태는 인터넷신문·포털뉴스 등과 같은 ‘디지털 형태’로 바뀌고 있다. 인터넷신문사는 해마다 빠르게 급증하고 있...
- 디지털 기술의 발전과 인터넷 환경의 보급으로 말미암아 언론 소비의 형태는 인터넷신문·포털뉴스 등과 같은 ‘디지털 형태’로 바뀌고 있다. 인터넷신문사는 해마다 빠르게 급증하고 있으며, 이는 기사 대 기사의 심화된 경쟁을 유발하는 계기가 되었다. 언론사들은 새로운 가치를 찾기 위해, 누적된 지적자산을 재활용할 수 있는 방안을 찾고 있다. 세계적인 언론 매체인 BBC에서는 링크드 데이터 모형을 이용해 자사의 뉴스 기사 가치를 지속해서 향상시키고 있다. 따라서 국내 인터넷 신문사들도 Linked Data 모델을 이용하여 누적된 기사를 재활용하고, 새로운 가치를 찾아 뉴스 기사의 가치를 지속해서 향상시킬 필요성이 있다. 본 논문에서는 보건의료 관련 뉴스를 대상으로 Linked Data를 구축하는 연구를 진행한다. 기사문에서 보건의료와 관련된 개체명을 인식하여 데이터화하고, 이를 공개된 다른 정보들과 연결하고 구조화하여 Linked Open Data 서비스를 제공한다. 연구의 결과는 무분별하게 쌓여있는 뉴스데이터를 체계적으로 정리하고, 공개된 다른 정보들과 연결함으로써 기존에 발견하지 못했던 새로운 인사이트를 찾는 기회를 제공하고, 뉴스 데이터가 재활용될 수 있는데 기여할 수 있다. 마지막으로 SPARQL 질의 언어를 이용하여 뉴스 데이터를 대화식으로 탐색할 수 있는데 기여할 수 있다.
목차 (Table of Contents)
- Ⅰ. 서 론 1
- 1.1 연구 배경 1
- 1.2 연구범위 및 목적 6
- 1.3 연구 프로세스 7
- 1.3.1 데이터 수집 7
- 1.3.2 개체명 인식 8
- 1.3.3 링크드 데이터 모델 구축 8
- 1.3.4 다른 공개된 데이터와 연결 8
- 1.3.5 SPARQL Endpoint 9
- Ⅱ. 이론적 배경 및 관련연구 10
- 2.1 개체명 인식 10
- 2.1.1 규칙 기반 개체명 인식 11
- 2.1.2 통계 기반 개체명 인식 12
- 2.2 링크드 오픈 데이터 12
- 2.2.1 시맨틱 웹 12
- 2.2.2 온톨로지 15
- 2.2.3 링크드 데이터 16
- 2.2.4 링크드 오픈 데이터 21
- 2.3 관련 연구 24
- 2.3.1 관련 논문 24
- 2.3.2 관련 사례 25
- Ⅲ. 국내 의학 뉴스 LOD 구축 27
- 3.1 데이터 수집 및 범위 27
- 3.2 개체명 인식 28
- 3.2.1 사전 구축 29
- 3.2.2 사전 기반 개체명 인식 31
- 3.3 국내 의학 뉴스 LOD 구축 33
- 3.3.1 Specify 34
- 3.3.2 Model 36
- 3.3.3 Generate 38
- 3.3.4 Publish & Exploit 40
- Ⅳ. 활용 방법 41
- 4.1 활용 프로세스 41
- 4.2 활용 방법 42
- Ⅴ. 결론 47
- 4.1 연구 공헌 47
- 4.2 한계점 및 향후연구 48
- 참 고 문 헌 49