免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: yanglc2013
打印 上一主题 下一主题

20积分悬赏,求个perl程序,新手,写了好几个都无果。 [复制链接]

论坛徽章:
0
21 [报告]
发表于 2013-03-28 11:49 |只看该作者
回复 20# yanglc2013


    反正是用脚本划分文件,效率应该不会低,这个4万多条记录的文件,划分小文件,差不多1秒就完成了。这种划分小文件是为后面的对比做准备,提高后面对比的效率。
   

论坛徽章:
0
22 [报告]
发表于 2013-03-28 12:00 |只看该作者
回复 16# picbhan

区间是基因的起始和终止位置。就是比如,lnc中有很多chr1,ref中也有很多chr1,lnc中的每个chr1都要和ref的chr1分别比较。


   

QQ截图20130328115513.png (4.9 KB, 下载次数: 32)

QQ截图20130328115513.png

论坛徽章:
0
23 [报告]
发表于 2013-03-28 12:02 |只看该作者
回复 21# climby
谢谢啊,下次我用这个方法。


   

论坛徽章:
0
24 [报告]
发表于 2013-03-28 12:29 |只看该作者
回复 22# yanglc2013


    好吧,明白你说的了。但是显然你没看懂程序里的算法。因为你要的只是找出inc中每条染色体上每个区间是否与ref中相同染色体上的区间有交集(完全包含,部分交集,不包含),所以在算法上不需要在两个文件间一一比较,这样很费时间。我在读入文件的时候先按染色体分类,完了用每个区间的起始位置排序了,这样就不需要全部比较。就好像如果你要找出 2 在数组 1, 5, 7, 19, 21 中的位置,只需要找出大于和小于2的临界位置就行了,不需要和5以后的数据比较。如果还不理解我再给你仔细分析算法吧。

论坛徽章:
0
25 [报告]
发表于 2013-03-28 13:23 |只看该作者
回复 24# picbhan
谢了啊 大哥。我测试了下,你的程序可以达到要求,但是还有一种情况就是 lnc中的范围超出了ref中的范围,就是,lnc的范围包含ref的范围,这种情况能帮我输出到另一个文件吗。您的结果中把ref包含lnc和lnc包含ref都输入到了同一个文件,我试着改了下,但没改好。

   

论坛徽章:
0
26 [报告]
发表于 2013-03-28 13:25 |只看该作者
回复 24# picbhan
您的思路确实很厉害啊,


   

论坛徽章:
0
27 [报告]
发表于 2013-03-28 15:16 |只看该作者
回复 25# yanglc2013


    我想问一下就是你要的结果是不是只是inc这个文件的?或者是两个文件的?
    比如inc的一个区间包含ref里的一个区间,我是输出ref的那个区间还是inc的?在原来的程序里我只输出inc里的区间,没输出任何在ref里的数据。在原来的程序里你要的最后一种情况的结果应该在overlap的数据里,而不是在include的文件里。其实原来的程序里有点bug。我写好再给你新的代码。

论坛徽章:
0
28 [报告]
发表于 2013-03-28 16:13 |只看该作者
回复 27# picbhan
还是输出lnc的。因为可能会出现这种情况。真谢谢你啊。看你的程序收货很大,排版好,思路也巧妙。

论坛徽章:
0
29 [报告]
发表于 2013-03-28 16:14 |只看该作者
回复 27# picbhan

ref只是一个数据库。
   

论坛徽章:
0
30 [报告]
发表于 2013-03-28 16:52 |只看该作者
本帖最后由 yanglc2013 于 2013-03-28 16:59 编辑

回复 2# picbhan
大哥,文件中 不是还有 + -之分。表示正链和负链,同一个染色体(比如chr1),他可以是正链也可以是负链,如果我还得加上++,--,+-,-+(前一个正负号为lnc中,后一个为ref中)必须也相同这个条件(就是除了必须染色体(chr)相同,而且lnc的+和ref中的+,lnc的-和ref的-,lnc的+和ref的-,lnc的-和ref的+),输出的结果还是lnc中的数据,ref作为一个数据库。那应该在你的程序上怎么修改?

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP