免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 8141 | 回复: 10
打印 上一主题 下一主题

求用perl取出fastq中的质量分数的脚本 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-17 19:30 |只看该作者 |倒序浏览
我是一个新手,向各位大神求一个脚本,用perl写的,但不要用bioperl的模板,要求是:
   将fastq文件中的质量数提取出来,从每一行质量数的最后一个开始倒着来小于等于20的不要,大于20的留下,如果到32bp还没有大于20的就整行质量数全留下

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
2 [报告]
发表于 2013-09-18 01:25 |只看该作者
~ ,这题目我都看不懂。

论坛徽章:
0
3 [报告]
发表于 2013-09-18 08:35 |只看该作者
回复 2# rubyish

如图所示fastq格式中每四行为一个组,第四行就是质量数它需要用ASCII转成数字的形式,我需要的perl脚本就是把每组的第四行质量数提出来,从质量数的右边倒着一个个的开始比较,大于20的留下,小于等于20的不要,到第32位的时候如果还没有能留下的,那就一行都留下,这就是我要的perl脚本,麻烦你了
   

论坛徽章:
0
4 [报告]
发表于 2013-09-18 08:56 |只看该作者
你這個問題沒有給比較明確的條件喔

不同的系統他20的值會不一樣

http://en.wikipedia.org/wiki/FASTQ_format

請看下面那一張表

雖然可以從內容來猜測

不過還是請你確定一下比較好

论坛徽章:
0
5 [报告]
发表于 2013-09-19 10:41 |只看该作者
回复 4# afukada


    用ASCII码就可以转了呀

论坛徽章:
0
6 [报告]
发表于 2013-09-25 11:15 |只看该作者
ascii碼表

http://zh.wikipedia.org/wiki/ASCII

你確定那些ascii碼有小於20的嗎

我的意思是fastq有不同的系統

雖然可以猜測出來你的這個檔案是哪個系統的

不過你還是確認一下會比較好

不然就算高手給你code

還是有可能會出錯

论坛徽章:
0
7 [报告]
发表于 2013-09-25 11:15 |只看该作者
ascii碼表

http://zh.wikipedia.org/wiki/ASCII

你確定那些ascii碼有小於20的嗎

我的意思是fastq有不同的系統

雖然可以猜測出來你的這個檔案是哪個系統的

不過你還是確認一下會比較好

不然就算高手給你code

還是有可能會出錯

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
8 [报告]
发表于 2013-09-25 16:06 |只看该作者
回复 7# afukada 你確定那些ascii碼有小於20的嗎


    强!牛!

论坛徽章:
0
9 [报告]
发表于 2013-09-25 21:00 |只看该作者
回复 6# afukada

我用的是windows的
   

论坛徽章:
7
巳蛇
日期:2014-04-10 08:54:57白羊座
日期:2014-04-22 20:06:262015年亚洲杯之沙特阿拉伯
日期:2015-02-10 14:18:532015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之吉达阿赫利
日期:2015-06-02 11:34:112015亚冠之武里南联
日期:2015-06-24 12:13:082015亚冠之阿尔纳斯尔
日期:2015-08-03 09:08:25
10 [报告]
发表于 2013-09-25 21:20 |只看该作者
yang7473453 发表于 2013-09-25 21:00
回复 6# afukada

我用的是windows的

这跟你用什么操作系统没关系,FASTQ文件的质量值表示方式不同公司不一样,即使同一个公司不同版本的测序仪的表示方式都可能不一样(如果没记错的话illumina公司之前使用的格式和现在使用的格式就不一样,一年多没从事生物信息行业了,都不确定了,也懒得去查资料了)。不过好在FASTQ的质量值都是用一个范围的ASCII字符表示,这个字符减去一定值(比如有减32的,也有减其它值的)就是质量值。楼上想让你确定的就是你所说的20是FASTQ里ASCII字符减去多少以后得到的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP