之前介绍过Excel的SNP数据(Excel格式的SNP数据怎么变为plink格式),转为plink的方法,如果要导入plink格式中,会报错:
报错:显示超过区间
problem: string index out of range: 30 file
因为plink编码的是AA TT的格式,变为A A T T的格式才可以。
报错的plink数据:可以看到GG CC两个是连续的。
用--recode
处理一下,变为test再进行读取:
plink --file file --recode --out test
查看正确的plink格式:
使用TASSEL读取:
读取成功:
搞定!!!