免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4972 | 回复: 12

[文本处理] awk 按行切割文件? [复制链接]

论坛徽章:
0
发表于 2015-11-11 18:23 |显示全部楼层
本帖最后由 ppjer 于 2015-11-11 18:24 编辑

现在有个文本,每行1个uid ;使用awk 进行处理 1行 要10个 uid 且要用逗号分隔~
示例文本:
154891
145690
165211
190189
135901
290134
........

结果:
1行 10个uid , 逗号分隔。
154891,145690,165211,190189,135901,290134....

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
发表于 2015-11-11 18:30 |显示全部楼层
  1. awk '!(NR%10){print;next}{printf $0","}'  file
复制代码

评分

参与人数 1信誉积分 +5 收起 理由
ppjer + 5 5

查看全部评分

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
发表于 2015-11-11 18:33 |显示全部楼层
  1. awk 'ORS=NR%10?",":"\n"'
复制代码

评分

参与人数 2信誉积分 +10 收起 理由
ppjer + 5 好精炼。
haooooaaa + 5 很给力!

查看全部评分

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
发表于 2015-11-11 18:37 |显示全部楼层
  1. sed ':1;N;s/\n/,/;0~10b;t1'
复制代码

论坛徽章:
0
发表于 2015-11-11 18:51 |显示全部楼层
本帖最后由 ppjer 于 2015-11-11 19:01 编辑
haooooaaa 发表于 2015-11-11 18:30

!(NR%10)这个模式条件,不是太明白。条件为10再取非 , 就是true, 执行 {print;next} {printf %0","}

如果此时读进来第10个元素,!(NR%10) ==False  ; {print;next} 不执行; 但应该会执行这个action {printf %0","}; 那么第10个元素后就会有个 ","  我是这样理解的。

1,2,3,4,5,6,7,8,9,10,
11,,,,,,,,,,,,,,20,
.....

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
发表于 2015-11-11 20:00 |显示全部楼层
回复 5# ppjer


    NR为 1时, 1%10 为 1, 1取反为0 ,不执行。。。

NR为10 , 10%10为0, 0取反 为 1, 执行。 print 后, next, 后面不执行

论坛徽章:
0
发表于 2015-11-11 22:06 |显示全部楼层
本帖最后由 ppjer 于 2015-11-11 22:10 编辑

回复 6# haooooaaa


       NR 为 1时, 1%10 为 1, 1取反为0 ,应该是不执行{print;next}第1个action;而会执行第2个action{printf $0","}。
       NR 为10时,10%10 为0,0取反为1,则执行第1个action {print;next}; 此时第2个action 不执行。

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
发表于 2015-11-19 22:53 |显示全部楼层
  1. awk '{printf "%s%s",$0,(NR%10?",":RS)}' file
复制代码

论坛徽章:
0
发表于 2015-11-23 10:37 |显示全部楼层
xargs -n 岂不是更方便?

论坛徽章:
1
15-16赛季CBA联赛之江苏
日期:2016-10-26 16:19:04
发表于 2016-05-18 11:36 |显示全部楼层
awk '{if(NR%10==0)print $0;else printf $0","}' file
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP