Plink是一款开源的,用于全基因组关联分析的工具集;它一般用于对基因型数据进行基本的操作。
以下是记录了关联分析中常见的一些操作
提取指定SNP的坐标信息
- 基于SNP id进行提取
--recode
将会提取SNP的信息生成对应的map和ped文件--extract
则可以进行多个SNP信息的批量提取,后面接一个SNP id的文件
1 | #* 提取单个SNP信息 |
- 基因染色体坐标进行提取
提取指定基因组范围的SNP信息,使用
--extract range 范围文件名
;范围文件中包含四列信息分别是
- 染色体编号(可能是数字)
- 起始位置
- 终止位置
- 区域的label(随便起名字)
1 | #* 提取指定范围的SNP信息 |
计算任意两个SNP之间的连锁度
1 | plink --bfile genotypeFile --ld SNP1 SNP2 |