我们做完GWAS的关联分析后需要查看显著性SNP在我们数据中的频率分布情况。这时候我们需要用到plink和我们做关系分析所用的二进制文件datas.
第一步,我们用R语言读取分析结果,即*.assoc文件,按P值倒序排列,即出现上图的结果。
第二步,查看单个SNP位点(即上述结果中的kgp4382537)在数据中的频率。打开Plink,使用指令:
“plink --bfile datas --snp kgp4382537 --freq --out kgp4382537_freq”.
随后查看所生成的文档kgp4382537_freq.frq就可以看到我们想要的结果,如下图:
第三步,如果我们想查看多个SNP位点在数据中的频率分布情况。则使用指令:
“plink --bfile datas --snps kgp4382537, imm_5_141397471,ilmnseq_14:52985654,rs12538214,kgp297205 --freq --out snps_freq”。
注意:这里用的指令是“--snps”而不是“--snp”。具体情况可查看plink使用文档中的“Extract a subset of SNPs"。