免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: mswsg
打印 上一主题 下一主题

文本格式转换 [复制链接]

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
11 [报告]
发表于 2016-06-22 17:26 |只看该作者
谢谢大神有时间帮我,这个判断条件看不懂,感觉比python简单?能否进一步解释下?
if ((@aData = split /\n/) and (@aData = $aData[-1] =~ /[A-Z]+/g)回复 9# sunzhiguolu


   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
12 [报告]
发表于 2016-06-22 17:32 |只看该作者
回复 11# mswsg
您老是想问啥, 能否用颜色勾出个重点?

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
13 [报告]
发表于 2016-06-22 17:38 |只看该作者
本帖最后由 sunzhiguolu 于 2016-06-22 17:40 编辑

与下面这个等价:

  1. @aData = split /\n/;
  2. if (@aData){
  3.     @aData = $aData[-1] =~ /[A-Z]+/g;
  4.     print @aData, "\n" if (@aData);
  5. }
复制代码

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
14 [报告]
发表于 2016-06-22 20:56 |只看该作者
其实,我看不懂perl代码的。。。你得那个判断条件会转成python?回复 13# sunzhiguolu


   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
15 [报告]
发表于 2016-06-22 21:57 |只看该作者
本帖最后由 sunzhiguolu 于 2016-06-22 22:10 编辑

回复 14# mswsg
转换成您那个示例文件:
185 : GCCCCTCCAACGACGCCCTGTCCAG  >>>> Target Intron 1 >>>>  GCACTACGAG : 219
       |||||||||| ||||||||||||||++          67 bp          ++||||  ||||
195 : GCCCCTCCAATGACGCCCTGTCCAGgt.........................agGCACCGCGAG : 296

$aData[0], $aData[1], $aData[-1]
上面的代码就是干了这个事情 => @aData = split /\n/


185 : GCCCCTCCAACGACGCCCTGTCCAG  >>>> Target Intron 1 >>>>  GCACTACGAG : 219
       |||||||||| ||||||||||||||++          67 bp          ++||||  ||||
195 : GCCCCTCCAATGACGCCCTGTCCAGgt.........................agGCACCGCGAG : 296
195 : GCCCCTCCAATGACGCCCTGTCCAGgt.........................agGCACCGCGAG : 296
@aData = $aData[-1] =~ /[A-Z]+/g

@aData 等价于下面的
$aData[0]   => GCCCCTCCAATGACGCCCTGTCCAG
$aData[-1] => GCACCGCGAG

我不会写 python 代码, 希望对您有帮助...

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
16 [报告]
发表于 2016-06-22 22:02 |只看该作者
本帖最后由 mswsg 于 2016-06-22 22:11 编辑

对正则表达式不是太熟,借鉴楼上两位re.sub,我自己改写了一个。
最主要的思路:首先记录‘|’所在行的下一行的行号到一个列表a,然后文件指针归零,重新判断,并打印符合行号(列表a)的行
  1. import re
  2. with open('result.exonerate.txt', 'r') as f:
  3.     a =[]
  4.     for num, line in enumerate(f):
  5.         if '|' in line:
  6.             a.append(num + 1)
  7.     f.seek(0, 0)
  8.     for num, line in enumerate(f):
  9.         if 'Query:' in line:
  10.             print ">" + line.strip().split()[1],
  11.         elif 'Target:' in line:
  12.             print line.strip().split()[1]
  13.         elif num in a:
  14.             b = re.sub(r'[^A-Z]','', line[2:-2])
  15.             print b
复制代码
好像文件指针不用归零,修改代码
  1. import re
  2. with open('result.exonerate.txt', 'r') as f:
  3.     a =[]
  4.     for num, line in enumerate(f):
  5.         if '|' in line:
  6.             a.append(num + 1)
  7.         if 'Query:' in line:
  8.             print ">" + line.strip().split()[1],
  9.         elif 'Target:' in line:
  10.             print line.strip().split()[1]
  11.         elif num in a:
  12.             b = re.sub(r'[^A-Z]','', line[2:-2])
  13.             print b
复制代码

评分

参与人数 1信誉积分 +10 收起 理由
sunzhiguolu + 10 赞一个!

查看全部评分

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
17 [报告]
发表于 2016-06-22 22:05 |只看该作者
thank you,原谅wo看到perl一脸懵逼回复 15# sunzhiguolu


   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
18 [报告]
发表于 2016-06-22 22:15 |只看该作者
回复 17# mswsg
原谅wo看到python一脸懵逼

















   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
19 [报告]
发表于 2016-06-22 22:17 |只看该作者
本帖最后由 sunzhiguolu 于 2016-06-22 22:17 编辑

其实大家在一起切磋的是解决问题的思路, 与语言无关 与技术无关; 相互借鉴 相互学习...

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
20 [报告]
发表于 2016-06-22 22:28 |只看该作者
是呀,好思路很重要回复 19# sunzhiguolu


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP