免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5959 | 回复: 5
打印 上一主题 下一主题

[文本处理] 重新编号:同一列中连续相同i的ID编号一致 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2020-12-21 11:35 |只看该作者 |倒序浏览
如A文件:有三列:
ID strat End
Chr1 29 50
Chr1  80 100
Chr1 120 150
Chr2 37 50
Chr2 70 90
Chr1 200 300
Chr1 400 500
Chr3 488 900
Chr2 69 80
Chr3 900 1200
Chr3 2000 4000
Chr2 200 400

B文件,如下:
ID strat End
Chr1_1 29 50
Chr1_1  80 100
Chr1_1 120 150
Chr2_1 37 50
Chr2_1 70 90
Chr1_2 200 300
Chr1_2 400 500
Chr3_1 488 900
Chr2_2 69 80
Chr3_2 900 1200
Chr3_2 2000 4000
Chr2_3 200 400



问题:如何通过A文件得到B文件?

论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-10-11 06:20:0015-16赛季CBA联赛之山东
日期:2016-05-28 18:18:5615-16赛季CBA联赛之新疆
日期:2017-04-12 22:55:4715-16赛季CBA联赛之青岛
日期:2017-06-26 18:30:0315-16赛季CBA联赛之四川
日期:2017-09-04 12:27:0315-16赛季CBA联赛之福建
日期:2018-02-09 14:28:3315-16赛季CBA联赛之同曦
日期:2018-04-17 12:43:3415-16赛季CBA联赛之浙江
日期:2018-07-14 13:27:4015-16赛季CBA联赛之吉林
日期:2018-09-13 15:48:2915-16赛季CBA联赛之新疆
日期:2016-05-07 05:05:3215-16赛季CBA联赛之八一
日期:2016-03-14 12:32:06程序设计版块每日发帖之星
日期:2015-12-12 06:20:00
2 [报告]
发表于 2020-12-23 10:55 |只看该作者
本帖最后由 baby_神 于 2020-12-23 15:40 编辑
  1. awk 'NR==1{print;next}{$1==b?(c[$1]=c[$1]!=1?c[$1]:1):c[$1]++;b=$1;$1=$1"_"c[$1]}1' a.txt
复制代码

论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-10-11 06:20:0015-16赛季CBA联赛之山东
日期:2016-05-28 18:18:5615-16赛季CBA联赛之新疆
日期:2017-04-12 22:55:4715-16赛季CBA联赛之青岛
日期:2017-06-26 18:30:0315-16赛季CBA联赛之四川
日期:2017-09-04 12:27:0315-16赛季CBA联赛之福建
日期:2018-02-09 14:28:3315-16赛季CBA联赛之同曦
日期:2018-04-17 12:43:3415-16赛季CBA联赛之浙江
日期:2018-07-14 13:27:4015-16赛季CBA联赛之吉林
日期:2018-09-13 15:48:2915-16赛季CBA联赛之新疆
日期:2016-05-07 05:05:3215-16赛季CBA联赛之八一
日期:2016-03-14 12:32:06程序设计版块每日发帖之星
日期:2015-12-12 06:20:00
3 [报告]
发表于 2020-12-23 11:28 |只看该作者
本帖最后由 baby_神 于 2020-12-23 11:30 编辑
  1. <span style="background-color: rgb(255, 255, 255);">perl -ape '$.>1&&s#$F[0]#$s eq[        DISCUZ_CODE_1        ]amp;?[        DISCUZ_CODE_1        ]amp;."_$h{[        DISCUZ_CODE_1        ]amp;}":[        DISCUZ_CODE_1        ]amp;."_".++$h{[        DISCUZ_CODE_1        ]amp;}#e;$s=[        DISCUZ_CODE_1        ]amp;' a.txt</span>
复制代码
为毛乱码


论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-10-11 06:20:0015-16赛季CBA联赛之山东
日期:2016-05-28 18:18:5615-16赛季CBA联赛之新疆
日期:2017-04-12 22:55:4715-16赛季CBA联赛之青岛
日期:2017-06-26 18:30:0315-16赛季CBA联赛之四川
日期:2017-09-04 12:27:0315-16赛季CBA联赛之福建
日期:2018-02-09 14:28:3315-16赛季CBA联赛之同曦
日期:2018-04-17 12:43:3415-16赛季CBA联赛之浙江
日期:2018-07-14 13:27:4015-16赛季CBA联赛之吉林
日期:2018-09-13 15:48:2915-16赛季CBA联赛之新疆
日期:2016-05-07 05:05:3215-16赛季CBA联赛之八一
日期:2016-03-14 12:32:06程序设计版块每日发帖之星
日期:2015-12-12 06:20:00
4 [报告]
发表于 2020-12-23 15:33 |只看该作者
  1. awk 'NR==1{print;next} a[$1]+1!=NR {b[$1]++} {a[$1]=NR;$1=$1"_"b[$1]}1' a.txt
复制代码

论坛徽章:
1
19周年集字徽章-年
日期:2020-10-29 09:39:21
5 [报告]
发表于 2020-12-24 07:55 |只看该作者
perl -pe'$.>1&&s#\S+\K#$s eq$`?"_$h{$`}":"_".++$h{$`}#e;$s=$`'

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
6 [报告]
发表于 2020-12-27 16:11 |只看该作者
  1. awk 'NR==1{print;next}last!=$1{a[$1]++;last=$1}{$1=$1"_"a[$1]}1' f1
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP