忘记密码   免费注册 查看新帖 | 论坛精华区

ChinaUnix.net

  平台 论坛 博客 认证专区 大话IT HPC论坛 徽章 文库 沙龙 自测 下载 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
12下一页
最近访问板块 发新帖
查看: 1079 | 回复: 16

求助小脚本编写 [复制链接]

论坛徽章:
1
15-16赛季CBA联赛之天津
日期:2017-03-21 18:26:14
发表于 2017-02-26 09:40 |显示全部楼层
脚本读入两个文件 lst1和lst2
lst1:
RRA45973,RRA45973,CACTTCGA,,
RRA45974,RRA45974,CAGCGTTA,,
RRA45975,RRA45975,CATACCAA,,
RRA45976,RRA45976,CCAGTTCA,,
RRL06701,RRL06701,ATCCTGTA,,
需求把后面的8个碱基加两个逗号删除,碱基有的时候是6个。
lst2:
ATTACTCG        TATAGCCT
ATTACTCG        ATAGAGGC
ATTACTCG        CCTATCCT
ATTACTCG        GGCTCTGA
ATTACTCG        AGGCGAAG
要求把中间的空格换成逗号隔开。
写一个脚本把做完修改的两个文件对应行粘到一起,结果就像
RRA45973,RRA45973,ATTACTCG,TATAGCCT
.
.
.
请教各位大神应该怎么写,小弟初学,自己写的运行起来有问题。

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2017-02-26 13:43 |显示全部楼层
能否将你的要求说的详细一点,对生物信息的知识比较匮乏。另外,将希望得到的结果提出来。

论坛徽章:
1
15-16赛季CBA联赛之天津
日期:2017-03-21 18:26:14
发表于 2017-02-26 14:02 |显示全部楼层
回复 2# sunzhiguolu
就是说lst1那个文件每行的最后两个逗号加上【ATGC】组成的8个(有的时候是六个)字符我要把它删了,替换成list2中的相应行,但是list2中的每行要把中间的空格换成逗号,最终的结果就是我贴子上已经粘的那个结果,只不过我只是贴了一行,已知lst1和lst2这两个文件行数是一样的,有多少行就输出多少个合并后的行。

论坛徽章:
1
15-16赛季CBA联赛之天津
日期:2017-03-21 18:26:14
发表于 2017-02-26 14:10 |显示全部楼层
回复 2# sunzhiguolu
lst1每行改完后的结果就像这样:RRA45973,RRA45973,
lst2每行改完后的结果就像这样:ATTACTCG,TATAGCCT
最终希望的结果是把这两行粘成一行
RRA45973,RRA45973,ATTACTCG,TATAGCCT
lst1中有多少行就打印出多少行。

论坛徽章:
27
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
发表于 2017-02-26 14:25 |显示全部楼层

  1. paste -d '' <(sed 's/\w*,*$//' lst1) <(sed -r 's/\s+/,/' lst2)
复制代码

?

论坛徽章:
1
15-16赛季CBA联赛之天津
日期:2017-03-21 18:26:14
发表于 2017-02-26 14:35 |显示全部楼层
回复 5# moperyblue
因为这是这两个文件的一部分,如果只是用paste命令用正则的话会把一些不需要修改的地方也改了,我粘出来的只是这两个文件需要修改的部分。所以我还是希望能有一个只是针对上面我给出的两个文件的小脚本。

论坛徽章:
27
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
发表于 2017-02-26 17:44 |显示全部楼层
回复 6# kevin_furant

可以只针对符合条件的记录修改后 再 连接起来

论坛徽章:
0
发表于 2017-02-26 18:04 |显示全部楼层
感觉怎么像index
来自安卓客户端来自客户端

论坛徽章:
1
15-16赛季CBA联赛之天津
日期:2017-03-21 18:26:14
发表于 2017-02-26 18:09 |显示全部楼层
回复 8# 华小飞_Perl
其实就是index,拆分双端index的时候有些东西需要改,显得麻烦所以就想搞一搞。楼上的方法其实就能实现,不过我正在学perl,我想看一下别人怎么写的  为什么我自己写的不能达到效果。

论坛徽章:
0
发表于 2017-02-26 19:04 |显示全部楼层
回复 9# kevin_furant

楼上大神们的建议很不错,双端拆分的话应该是miseq / nextseq / miniseq平台的下机数据咯~
您需要登录后才可以回帖 登录 | 注册

本版积分规则

SACC2017购票8.8折优惠进行时

2017中国系统架构师大会(SACC2017)将于10月19-21日在北京新云南皇冠假日酒店震撼来袭。今年,大会以“云智未来”为主题,云集国内外顶级专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。本届大会共设置2大主会场,18个技术专场;邀请来自互联网、金融、制造业、电商等多个领域,100余位技术专家及行业领袖来分享他们的经验;并将吸引4000+人次的系统运维、架构师及IT决策人士参会,为他们提供最具价值的交流平台。
----------------------------------------
优惠时间:2017年8月2日前

活动链接>>
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP