免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1535 | 回复: 7
打印 上一主题 下一主题

[文本处理] 如何批量替换文件header [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-02-20 21:40 |只看该作者 |倒序浏览
遇上点麻烦的文本处理问题,想请教一下各位大神:
1.txt:(高两部分为header,长得不一样,但是都是以">"开头的,header为一行,下面的每个为一行)
>m161112_061847_42213_c101125762550000001823268105221784_s1_p0/64139/30_1259_CCS strand=+;fiveseen=1;polyAseen=1;threeseen=1;fiveend=30;polyAend=1259;threeend=1290;primer=1;chimera=0
ATCTAATATTGGTTGGATATTTTCCAGAGATAGTTTAATAATTGGATCAAAAATTGGAGAAGGCGCCTTT
GGTATTGTGTACTCAGCTTTGGTCAAATCTTTCTCCGAAAATTCAGCTAGTGTAGAAGTAGCAATTAAAA
CTTTACACACGTCATTTGGAGATCAAGACGTCATAAACCTAATTCAGGAA
>m161112_061847_42213_c101125762550000001823268105221784_s1_p0/76726/1088_68_CCS strand=-;fiveseen=1;polyAseen=1;threeseen=1;fiveend=31;polyAend=1051;threeend=1090;primer=1;chimera=0
AGAAGGAATGGAATATTTGTCATCACGAAAGATAATTCACAGAGATTTGGCAGCGAGAAATGTATTAGTT
GATCAATATGTAGAAATGAAAATAGCAGATTTCGGTCTAACAAGAATTGTTGAAAATTATTATCGTAAAA
CTACTGACGGACGTCTGCCTATTAAATGGATGGCTCCTGAATGCCTACT
···

header大概有超过80,000个

现在因为软件需要,想要把表头做成这种格式:
>dj_1
>dj_2
···
>dj_3

也就是说1.txt成这样:
>dj_1
ATCTAATATTGGTTGGATATTTTCCAGAGATAGTTTAATAATTGGATCAAAAATTGGAGAAGGCGCCTTT
GGTATTGTGTACTCAGCTTTGGTCAAATCTTTCTCCGAAAATTCAGCTAGTGTAGAAGTAGCAATTAAAA
CTTTACACACGTCATTTGGAGATCAAGACGTCATAAACCTAATTCAGGAA
>dj_2
AGAAGGAATGGAATATTTGTCATCACGAAAGATAATTCACAGAGATTTGGCAGCGAGAAATGTATTAGTT
GATCAATATGTAGAAATGAAAATAGCAGATTTCGGTCTAACAAGAATTGTTGAAAATTATTATCGTAAAA
CTACTGACGGACGTCTGCCTATTAAATGGATGGCTCCTGAATGCCTACT

期待大神相助




论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
2 [报告]
发表于 2017-02-20 21:50 |只看该作者

  1. awk '/^>/{print ">dj_"++i;next}1' 1.txt
复制代码

?

论坛徽章:
0
3 [报告]
发表于 2017-02-20 22:05 |只看该作者
回复 2# moperyblue

哇塞,可以哎,谢谢大神多次的帮助,写了打赏,我看看怎么使

论坛徽章:
0
4 [报告]
发表于 2017-02-20 22:07 |只看该作者
回复 2# moperyblue

知识就是金钱,再次O(∩_∩)O谢谢您一直的帮助

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
5 [报告]
发表于 2017-02-20 22:21 |只看该作者
  1. perl -ple "s/\A>.*/q(dj_).++$n/es" f
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
6 [报告]
发表于 2017-02-20 22:26 |只看该作者
  1. perl -nle "print />/?q(dj_).++$n:$_" f
复制代码

论坛徽章:
0
7 [报告]
发表于 2017-06-02 16:33 |只看该作者
回复 6# sunzhiguolu

O(∩_∩)O谢谢

论坛徽章:
0
8 [报告]
发表于 2017-06-05 14:05 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP