免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3504 | 回复: 14
打印 上一主题 下一主题

[文本处理] sed怎么匹配文件中含有9个不连续逗号的行 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-06-05 16:55 |只看该作者 |倒序浏览
本帖最后由 4578004 于 2013-06-05 17:14 编辑

如题,应用生成的文件中怎样匹配到含有9个不连续逗号的行并删除这行数据?谢谢

43206133,2013-06-02 20:00:00,19,19,9_1_5,,2013-06-02,20
43443893,2013-06-02 23:00:00,5,1,9_1_5,1379,2013-06-02,23
43443894,2013-06-02 23:00:00,1,1,m0_1674_109_001,1647,2013-06-02,23
43443895,2013-06-02 23:00:00,5,5,9_1_5,,2013-06-02,23
43443896,2013-06-02 23:00:00,5,1,9_1_5,1341,2013-06-02,23
43443897,2013-06-02 23:00:00,2,1,33,1369,2013-06-02,23
43443898,2013-06-02 23:00:00,4,4,m0_1674_118_001,1647,2013-06-02,23
43206140,2013-06-02 20:00:00,0,1,,1331,2013-06-02,20
43443899,2013-06-02 23:00:00,0,111,1000,1674,2013-06-02,23
43443900,2013-06-02 23:00:00,5,3,9_1_5,1394,2013-06-02,23
43443901,2013-06-02 23:00:00,0,1,33, 33, 33,1368,2013-06-02,23                     ================〉匹配这行并删除
43443902,2013-06-02 23:00:00,5,1,9_1_5,1370,2013-06-02,23
43443903,2013-06-02 23:00:00,2,1,33,1377,2013-06-02,23
43443904,2013-06-02 23:00:00,0,3,ch27,30,2013-06-02,23
43443905,2013-06-02 23:00:00,5,3,9_1_5,1368,2013-06-02,23
43443906,2013-06-02 23:00:00,4,1,,1368,2013-06-02,23
43443907,2013-06-02 23:00:00,0,1,null,1375,2013-06-02,23

论坛徽章:
1
技术图书徽章
日期:2013-09-25 21:06:29
2 [报告]
发表于 2013-06-05 17:04 |只看该作者
sed -ne '/\,[0-9]+\,[0-9]+\,[0-9]+\,[0-9]+\,[0-9]+\,[0-9]+\,[0-9]+\,[0-9]+\,[0-9]+/p' filename

论坛徽章:
0
3 [报告]
发表于 2013-06-05 17:06 |只看该作者
回复 2# yuloveban


    数据行不是纯数字哦,所以这个匹配不到-

论坛徽章:
0
4 [报告]
发表于 2013-06-05 17:10 |只看该作者
  1. egrep  '([^,]+,){9}' file
复制代码

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
5 [报告]
发表于 2013-06-05 17:11 |只看该作者
  1. awk -F , 'NF==10'
复制代码

论坛徽章:
0
6 [报告]
发表于 2013-06-05 17:12 |只看该作者
回复 4# llh580110


    嗯 这个可以匹配到 但是我想在匹配到之后删除这行数据该怎么操作呢

论坛徽章:
0
7 [报告]
发表于 2013-06-05 17:12 |只看该作者
awk -F, '{if(NF>9)print $0}' filename

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每月发帖之星
日期:2015-09-11 19:30:52IT运维版块每周发帖之星
日期:2015-09-11 19:20:31IT运维版块每日发帖之星
日期:2015-08-26 06:20:00每日论坛发贴之星
日期:2015-08-20 06:20:00IT运维版块每日发帖之星
日期:2015-08-20 06:20:002015年辞旧岁徽章
日期:2015-03-03 16:54:15金牛座
日期:2014-05-04 16:58:09双子座
日期:2013-12-17 16:44:37辰龙
日期:2013-11-22 15:20:59狮子座
日期:2013-11-18 22:55:08射手座
日期:2013-11-12 10:54:26
8 [报告]
发表于 2013-06-05 17:14 |只看该作者
5L精简。赞一下。

论坛徽章:
0
9 [报告]
发表于 2013-06-05 17:19 |只看该作者
回复 6# 4578004
  1. sed -r '/([^,]+,){9}/d' file
复制代码

论坛徽章:
0
10 [报告]
发表于 2013-06-05 17:32 |只看该作者
回复 9# llh580110
  1. egrep -v '([^,]+,){9}'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP