발행년 : | 2011 |
---|---|
구분 : | 학위논문 |
학술지명 : | 학위논문(박사)-- 忠南大學校 大學院 : 統計學科 統計學 專攻 |
관련링크 : | http://www.riss.kr/link?id=T12381594 |
유전적 연관 및 유전자-유전자간 상호작용 분석
= Genetic Association and Gene-Gene Interaction Analysis
초록[abstracts]
Recently, disease-genetic association using SNPs(single nucleotide polymorphisms) and haplotypes in family-based genetic study have come into the spotlight. In binary trait, the classic TDT(transmission disequilibrium test) can only be applied if genetic information of parents and their offspring in available. In case that no parental genotype data is available, an alternate method using genetic sib information is proposed instead. Due to the fact complex disease such as diabetes occurs by interactions, gene-gene interaction or gene-environment interaction caught the attention, so that numerous methods were invented and proposed. Logistic regression, decision tree and neural network were generally used, but MDR(multifactor dimensionality reduction), which was designed specifically to identify gene-gene or gene-environment interactions, has been recently applied. MDR is an approach for detecting optimum interactions after simplifying genetic combinations into high and low risk groups, and new approaches improving MDR are now reported. In this study, methods using genetic sib information in family-based study are reviewed and powers of those are compared through simulation. Analysis and comparison among logistic regression, decision tree, neural network and MDR detecting the gene-gene interaction are also conducted. Finally, two analytical methods, RRIE(relative risk interaction explorer) and OIE(overall interaction explorer), testing interactions by calculating relative risk between the control and disease group from genetic combinations, are presented. Applying well-known two dimensional 8 genetic models and MDR open source data, utility is verified with comparison from MDR results.
초록[abstracts]
가족기반 유전연구에서 단일염기다형성(SNP) 및 일배체형(haplotype)을 이용한 질병-유전자간 연관성 분석은 주요 관심부분 중 하나이다. 이진형질(binary trait)인 경우 사용되는 고전적인 TDT (transmission/ disequilibrium test)는 부/모/자의 유전정보를 모두 알 수 있을 때에 쓸 수 있다. 그러나 경우에 따라서는 부모의 유전자형을 모를 때 이를 대체할 수 있는 방법으로 형매(sib)의 유전정보를 이용하는 방법이 있다. 하지만 당뇨와 같은 복합 질환에서는 유전자-유전자간 상호작용(gene-gene interaction)이나 유전자와 환경인자간 상호작용(gene- environment interacion)에 의해 질병이 생긴다. 그러므로 유전자간 상호작용이나 환경인자와의 상호작용에 대해 관심을 갖게 되었고, 이를 위해 많은 방법들이 제시되고, 개발되고 있다. 일반적으로 통계학에서 사용되는 로지스틱 회귀분석(logistic regression)과 의사결정나무(decision tree), 신경망(neural netwok) 분석이 많이 사용되고 있다. 최근에는 유전자-유전자간 상호작용이나 유전자-환경인자간 상호작용을 찾는 방법으로 각각의 유전자-유전자의 조합에서 모든 가능한 유전자형 조합을 고위험군과 저위험군으로 단순화한 뒤, 최적의 상호작용을 찾아주는 MDR(multifactor dimensionality reduction) 방법이 많이 사용되었다. 그리고 MDR 방법의 단점들을 개선하여 나온 방법들이 발표되고 있다. 본 연구에서는 가족기반연구에서 형매의 유전정보를 이용하는 분석방법에 대해 고찰하고 모의실험을 통해 이들의 검정력을 비교하였다. 그리고 유전자간 상호작용 탐색에서 많이 사용되는 로지스틱 회귀분석과 의사결정나무, 신경망 분석, MDR 방법에 분석하여 비교하였다. 마지막으로 유전자형 조합에서의 대조군과 질환군의 상대위험률을 이용하여 유전자-유전자간 상호작용을 탐색하는 RRIE(relative risk interaction explorer)와 OIE(overall interaction explorer) 방법을 제안하였다. 그리고 MDR 공개 자료와 2차원의 8가지 잘 알려진 유전 모형을 적용하여 MDR과 비교를 통해 유용성을 확인하였다.