斯达本的秘密花园 发表于 2018-01-03 20:13

关于提取信息的问题

文件一
目标基因的位点和基因ID,三列分别是起始,终止,基因ID
25 35 AT1G05469 #为了方便理解位点随便给的
37 40 AT1G10565
28 33 AT2G01564

文件二
基因的每个位点上的信息,四列分别是染色体,位点,甲基化计数,未甲基化计数
1 26 2 3
1 28 1 2
1 29 1 1
1 32 1 1
1 33 1 1
1 35 1 1
1 39 1 1
1 40 1 1
2 28 1 1
2 30 1 1
2 31 1 1
2 32 1 1
现在就是要计算这三个基因的平均甲基化水平,就是位点内的甲基化数除以甲基化数与未甲基化数之和,me/(me+unme)
主要问题就是不同染色体之间会有位点交叉,不知怎么解决
页: [1]
查看完整版本: 关于提取信息的问题