Independent significant SNPs: P 值小于 5e-8 的 SNP 位点,且 SNP 位点之间的 r2<0.6(注意,这里的 r2 指的是 LD 的 r2 值,不是相关性哦,别误解了,0.6 也是我设定的,不同文献给定的 r2 值不一样,主流设定是 0.6 )
Lead SNPs: Independent significant SNPs 中 r2 值小于 0.1 的 SNP(同样的,这里的 0.1 也是我设定的,不同文献阈值不一样,主流设定是 0.1 )
如果文字描述还不清楚的话,请看图片版的:
在 locus1 中,SNP1, SNP2, SNP3都达到了显著水平(P< 5e-8),SNP1 和 SNP2 的 r2=0.8, SNP2 和 SNP3 的 r2=0.4, SNP1 和 SNP3 的 r2=0.05。
假定我们设定 Independent significant SNPs 的阈值为:P<5e-8 且 r2<0.6,那么locus1 只有 SNP1 和 SNP3 是 Independent significant SNPs。
假定我们设定 Lead SNPs 的阈值为:r2 < 0.1,那么只有SNP3是Lead SNPs
看明白其中的逻辑了吗,也就是说,Lead SNPs 的数量一定是小于等于 Independent significant SNPs 的数量,因为 Lead SNPs 是在 Independent significant SNPs 的基础上进行了二次clump。
以上,就是 Independent significant SNPs 和 Lead SNPs 的定义。
理解了 Independent significant SNPs 和 Lead SNPs 的定义后,我们就可以借助工具鉴定 Independent significant SNPs 和 Lead SNPs。
目前挺多工具支持 Independent significant SNPs 和 Lead SNPs 的识别,比如PLINK。
我来推荐一个比较友好的网页工具 FUMA(https://fuma.ctglab.nl/snp2gene) 。
进入网址:https://fuma.ctglab.nl/snp2gene 后,
只需要输入 GWAS summary 文件,就可以得到 Independent significant SNPs 和 Lead SNPs。
步骤一:上传 GWAS summary文件,把 GWAS summary 文件的表头信息(比如染色体,位置,rs号等)补充在下图中
步骤二:设定 Independent significant SNPs 和 Lead SNPs 的阈值
步骤三:点击 submit job, 然后就可以等结果了
以下是 FUMA 网站给出的 Independent significant SNPs 和 Lead SNPs 结果: