- 论坛徽章:
- 0
|
本帖最后由 feiyue0908 于 2012-07-12 21:36 编辑
文件格式是(我只粘贴了一行,行用\t分开,为了显示的正确,我用数字标记了列数,总共11列):
1 2 3 4 5 6 7 8 9
1440 NM_000038 chr5 + 112073555 112181936 112090587 112179823 16
10
112073555,112090569,112102022,112102885,112111325,112116486,112128142,112136975,112151191,112154662,112157592,112162804,112163625,112164552,112170647,112173249,
11
112073622,112090722,112102107,112103087,112111434,112116600,112128226,112137080,112151290,112155041,112157688,112162944,112163703,112164669,112170862,112181936,
列5,列6是一对,是这行,也是一个基因,总的起点和终点。
列7,列8是一对,是列5,6内部的一部分。
列9是列10和列11逗号分开的数的个数。
列10和列11是把列5列6之间,分割成exon1,intron1,exon2, intron2.............(意思是112073555到112073622是exon1,112073622到112090569是intron1, 112090569到112090722是exon2,112090722到112102022是intron2.......)
-----------------------------------------------------------------------------------------------------------------------------------------------
计算
例如已知 chr5 112176756
想得到的结果是112176756属于哪个exon或者intron
两个文件都有很多行,只粘贴了一行来解释
|
|