免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4187 | 回复: 3
打印 上一主题 下一主题

统一格式的输出 [复制链接]

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-04 13:54 |只看该作者 |倒序浏览
文件的如下:
ENSG0000023      2        A3SS(2);CLE(5);ES(4);A5SS(2);CFE(1);IR(1);
ENSG0000022      3        CLE(1);ES(2);CFE(1);


我想输出这样的统一格式:
id-number number A3SS CLE  ES A5SS CFE IR
ENSG0000023        2       2 5 4 2 1 1
ENSG0000022        3       0 1 2 0 1 0

即在文件第三列中提取出括号内的数字,把没有出现的补零,请问
python 如何实现,谢谢大家:

论坛徽章:
4
金牛座
日期:2013-10-11 16:12:50卯兔
日期:2014-07-31 09:17:19辰龙
日期:2014-08-08 09:28:02狮子座
日期:2014-09-14 20:32:05
2 [报告]
发表于 2013-09-04 18:52 |只看该作者
本帖最后由 ssfjhh 于 2013-09-04 18:57 编辑
  1. >>> s = ' ENSG0000022      3        CLE(1);ES(2);CFE(1);'
  2. >>> sl = ('A3SS', 'CLE', 'ES', 'A5SS', 'CFE', 'IR')
  3. >>> l = s.split()[:2]
  4. >>> l
  5. ['ENSG0000022', '3']
  6. >>> for x in sl:
  7.         try:
  8.                 r = re.search('(?<={}\()\d+(?=\))'.format(x), s).group()
  9.         except:
  10.                 r = 0
  11.         l.append(r)

  12.        
  13. >>> l
  14. ['ENSG0000022', '3', 0, '1', '2', 0, '1', 0]
  15. >>>
复制代码

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
3 [报告]
发表于 2013-09-05 14:07 |只看该作者
膜拜大神~ 太感谢了。
继续学习。

论坛徽章:
4
金牛座
日期:2013-10-11 16:12:50卯兔
日期:2014-07-31 09:17:19辰龙
日期:2014-08-08 09:28:02狮子座
日期:2014-09-14 20:32:05
4 [报告]
发表于 2013-09-05 18:11 |只看该作者
回复 3# pitonas


    大神这词真不敢当。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP