GWAS 手册 A tutorial on conducting genome!wide association studies: Quality control and statistical analysis

摘要:
PRS是个体水平的score,它的统计基于个体携带风险变异的数量,通过SNP效应量来评估特定性状的geneticrisk。https://github.com/MareesAT/GWA_tutorial/.2.1定性性状Binary统计检验value1=unaffectedandvalue2=affected;0and-9representmissing检验用-assoc运行X2检验;--logistic运行logistic回归,logistic可以输入协变量covariates。--assoc运行Student'stest来比较两个平均值。GCTA和LDscoreregression分析用于计算SNP-basedheritability。Gene-basedtests对表型和一个基因内的多个SNPs关联分析。

文章GWAS分析脚本在:https://github.com/MareesAT/GWA_tutorial/

GWAS的目的是检测不同群体(case-control)间allele frequency 显著差异(5*10^-8)的SNP。

因为GWAS结果展示几个SNPs的effect size较小,所以开发了结合多个SNPs效应量为一个score的方法来预测disease risk。这个方法就是PRS,polygenic risk score。PRS是个体水平的score,它的统计基于个体携带风险变异的数量,通过SNP效应量来评估特定性状的genetic risk。

1.GWAS 首先就是七部过滤

GWAS 手册 A tutorial on conducting genome!wide association studies: Quality control and statistical analysis第1张

值得注意是最后一步对群体分层的控制。方法可以用plink的MDS方法(the multidimensional scaling)。https://github.com/ MareesAT/GWA_tutorial/ (2_Population_stratification.zip)

GWAS 手册 A tutorial on conducting genome!wide association studies: Quality control and statistical analysis第2张

2.接下来就是对Binary(定性)以及QUANTITATIVE定量性状的关联统计检验。https://github.com/MareesAT/GWA_tutorial/ (3_Association_GWAS.zip).

2.1 定性性状Binary统计检验

value 1 = unaffected and value 2 = affected; 0 and -9 represent missing

检验用-assoc 运行X2检验;--logistic运行logistic 回归,logistic可以输入协变量covariates。--logistic要比--assoc更灵活,只是运行时间较久。

2.2 定量性状

--assoc或--linear。--assoc 运行Student's test来比较两个平均值。--linear可以输入协变量,执行linear regression 分析。只是比--assoc慢一点。

2.3 校正多重检验 Correction for multiple testing

广泛应用的genome-wide显著阈值是5*10^-8,欧洲群体尤其如此。但是因为African popultaion更多的遗传多样性,需要设为1*10^-8.三个广泛用于检测genome-wide显著性的方法是Bonferroni correction、FDR(Benjamini-Hochberg false discovery rate),permutation testing。

--adjust运行Bonferroni和FDR correction

3.PRS 分析

要开展PRS分析,首先要从GWAS得到continuous traits的beta;binary traits的odds ratios的log值。

首先clumping。其次计算risk scores,plink的--score可以计算;PRSice会考虑clumping,p value,MDS components以及plots attrative graphs,很好。https://github.com/MareesAT/GWA_tutorial/ (4_PRS.doc)

GWAS 手册 A tutorial on conducting genome!wide association studies: Quality control and statistical analysis第3张

在GWAS之后,通常会有很多的post-GWAS分析,下面提到的可以用来做summary statistics。

GTEx用于SNPs和基因表达关联分析。

Ensembl和FUMA用于功能注释funcitonal annotation。

GCTA和LD score regression分析用于计算SNP-based heritability。

Gene-based tests对表型和一个基因内的多个SNPs关联分析。

pathway/gene-set分析生物学通路。

注:

Clumping: This is a procedure in which only the most significant SNP (i.e., lowest p value) in each LD block is identified and selected for further analyses. This reduces the correlation between the remaining SNPs, while retaining SNPs with the strongest statistical evidence.

Heterozygosity杂合度:一个个体的杂合度是杂合genotypes的比例。个体杂合度过高可能表明样本质量低,杂合度过低表明近亲结婚。

Summary statistics: These are the results obtained after conducting a GWAS, including information on chromosome number, position of the SNP, SNP(rs)! identifier, MAF, effect size (odds ratio/beta), standard error, and p value. Summary statistics of GWAS are often freely accessible or shared between researchers.

免责声明:文章转载自《GWAS 手册 A tutorial on conducting genome!wide association studies: Quality control and statistical analysis》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇OpenCASCADE动画功能2Ogre骨骼动画下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

GWAS学习笔记(一) | 质量控制(QC)

本系列文章采用的数据集与代码来自https://github.com/MareesAT/GWA_tutorial。 该教程获得了许多人的推荐,是一份很详细的step-by-step guide。 本文将介绍该教程中的QC部分(1_QC_GWAS.zip),后续或将继续添加有关QC的其他细节。 0. 目录 目录 0. 目录 1. 准备 2. 数据简介...

孟德尔随机化 Mendelian randomization,MR

孟德尔随机化分析 Mendelian randomization,MR使用遗传变异作为工具变量,推断暴露因素与结局之间的因果关系,能有效克服混杂合反向因果问题所导致的偏倚。 1986年,Katan提出MR思想:由于配子形成时,遵循“亲代等位基因随机分配给子代”的孟德尔遗传规律,如果基因型决定表型,基因型通过表型而与疾病发生关联,因此可以使用基因型作为工具变...

GWAS: 阿尔兹海默症和代谢指标在大规模全基因组数据的遗传共享研究

今天要讲的一篇是发表于 Hum Genet 的 "Shared genetic architecture between metabolic traits and Alzheimer's disease: a large-scale genome-wide cross-trait analysis" 。很中规中矩的一篇文章,没有什么大的亮点的。写它的主要原...

GWAS 画曼哈顿图,QQ plot,膨胀系数manhattan、Genomic Inflation Factor

转载自生信技能树 http://www.biotrainee.com/thread-496-1-1.html: 转载自陈文燕: https://mp.weixin.qq.com/s?__biz=Mzg2MDA2MDQzMQ==&mid=2247483759&idx=1&sn=4069ccf557f2efcdba3e5b19b0d20...