발행년 : | 2012 |
---|---|
구분 : | 국내학술지 |
학술지명 : | 한국차세대컴퓨팅학회 논문지 |
관련링크 : | http://www.riss.kr/link?id=A60025136 |
유전체 데이터를 위한 효율적인 데이터 관리자의 구현 및 성능분석
= Implementation and Performance Analysis of Efficient Data Manager for Genome Data
제어번호 60025136
저자명 송명선 ,김희대 ,이현조 ,장재우 ,엄정호 ,최동훈
학술지명 한국차세대컴퓨팅학회 논문지
권호사항 Vol.8 No.1 [2012]
발행처 한국차세대컴퓨팅학회
자료유형 학술저널
수록면 24-33(10쪽)
언어 Korean
발행년도 2012년
KDC 028
등재정보 KCI등재
비고 학회 요청에 의해 무료로 제공
판매처 학술교육원
초록
최근 의료 분야에 대한 관심이 높아짐에 따라 유전체 데이터를 관리 및 분석하는 기술에 대한 많은 연구가 수행되고 있다. 유전체 데이터 분석은 유전체 데이터의 매핑(mapping) 및 태깅(tagging)을 수행하는 전처리단계와 변이된 유전체 데이터를 생성하고 분석하는 후처리단계로 구성된다. 전처리 단계는 약 30억 개 이상의 염기 서열 조합에 대해 분석 작업을 수행하기 때문에 많은 시간이 소요된다. 그러나 입력된 데이터가 동일할 경우 동일한 결과 데이터가 생성되는 특징을 지닌다. 한편, 후처리단계에서는 각종 변이 알고리즘 종류 및 적용 순서 등에 의해, 매번 상이한 결과 데이터가 생성되는 특징을 지닌다. 이와 같은 특성을 고려하면, 효율적인 유전체 분석 데이터 공유 및 유전체 데이터 분석 과정, 즉, 유전체 데이터 유래의 검색을 지원해야한다. 따라서 본 논문에서는 유전체 데이터의 특성을 고려하여, 대용량 유전체 데이터를 위한 효율적인 데이터 관리자를 구현한다. 첫째, 원활한 데이터 공유를 위해 공유 권한 테이블을 설계한다. 둘째, 각 파이프라인의 결과 데이터 및 유사한 유전체 데이터 관리를 위해 유전체 데이터 유래 관리 기법를 설계한다. 셋째, 설계한 데이터 공유 및 유래 관리 기법을 기반으로 데이터 관리자의 주요 알고리즘을 설계한다. 마지막으로 설계된 알고리즘을 구현하여 성능평가를 수행한다.
목차
요약
Abstract
1. 서론
2. 관련 연구
3. 유전체 데이터를 위한 효율적인 데이터관리자
3.1 유전체 데이터 분석 과정의 특성
3.2 전체 시스템 구조
3.3 유전체 데이터의 공유 및 유래 관리 알고리즘
4. 성능평가
4.1 성능평가 환경 및 고려사항
4.2 성능평가
4.3 성능고찰
5. 결론
참고문헌
주제어
유전체 데이터 ,웹기반 유전체 데이터 분석 서비스 ,유전체 데이터 관리 ,유전체 데이터 유래 색인 ,유전체 데이터 공유 ,Genome data ,Web-based genome data analysis service ,Genome data management ,Genome data provenance indexing ,Genome data sharing