免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3530 | 回复: 12
打印 上一主题 下一主题

[文本处理] sed模式匹配问题,请教,多谢谢,非常紧急。 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-04-21 19:10 |只看该作者 |倒序浏览

[root@datanode6 IUT]# cat bb
aa,1,2,3,4,5,aaa,,ccc,dd,ee,1,2,3,4,,h
[root@datanode6 IUT]#
把所有字符串上加""双引号,数字不加,两个逗号之间的加""最后形成
"aa",1,2,3,4,5,"aaa","","ccc","dd","ee",1,2,3,4,"","h"

sed 一行最多允许保存9个模式,但我一行多于9个啊,如何解决,提示,可以把1,2,3,4,5看成一个模式,但小弟还是没有实现,请教 了。多谢。

我这里举了一个例子,我的文件是上万行。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2014-04-21 19:25 |只看该作者
回复 1# gxlxld


try:
  1. sed 's/[^0-9]\+/"&"/g;:a;s/,,/,"",/g;ta' file
复制代码

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
3 [报告]
发表于 2014-04-21 20:40 |只看该作者
本帖最后由 klainogn 于 2014-04-22 09:29 编辑

:b;s/,,/,"",/g;tb;s/[a-zA-Z]\+/"&"/g

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
4 [报告]
发表于 2014-04-21 21:14 |只看该作者
本帖最后由 yestreenstars 于 2014-04-21 21:57 编辑
  1. awk -F, -vOFS=, '{for(i=0;i++<NF;)if($i!~/^[0-9]+$/)$i="\""$i"\""}1'
复制代码
  1. sed -r 's/[^0-9,]+/"&"/g;:1;s/,,/,"",/g;t1'
复制代码

论坛徽章:
0
5 [报告]
发表于 2014-04-21 21:52 |只看该作者
如果是这样的话呢?上面的aa,1,2,3,4,5,aaa,,ccc,dd,ee,1,2,3,4,,h它为aa,1,2,3,4,5,aaa,,,dd,ee,1,2,3,4,,h 存在连续的,,, 这个需要,"","",

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
6 [报告]
发表于 2014-04-22 09:10 |只看该作者
  1. sed -e 's/[a-z]\+/"&"/g' -e ':1;s/,,/,"",/;t1'
复制代码
回复 5# gxlxld


   

论坛徽章:
0
7 [报告]
发表于 2014-04-22 19:07 |只看该作者
回复 4# yestreenstars

's/[^0-9,]+/"&"/g;:1;s/,,/,"",/g;t1'  可也实现同样的功能~

标签 :1  t1  是什么意思, 一直没有搞懂,是循环的意思吗?

   

论坛徽章:
0
8 [报告]
发表于 2014-04-22 21:25 |只看该作者
学习下~
  1. [root@localhost awk_and_sed]# sed 's/[^0-9|^,]\+/"&"/g;s/,,/,"",/g' t8
  2. "aa",1,2,3,4,5,"aaa","","ccc","dd","ee",1,2,3,4,"","h"
  3. [root@localhost awk_and_sed]# awk -F"," '{OFS=",";for(i=1;i<=NF;i++)if($i !~ /^[0-9]/)$i="\""$i"\"";print}' t8
  4. "aa",1,2,3,4,5,"aaa","","ccc","dd","ee",1,2,3,4,"","h"
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
9 [报告]
发表于 2014-04-22 21:29 |只看该作者
回复 7# ppjer

:1是标签,你也可以用其他的字符代替。
t1是指s///执行成功时返回标签1处。
   

论坛徽章:
3
酉鸡
日期:2014-04-23 17:17:56丑牛
日期:2014-05-08 11:41:302015亚冠之德黑兰石油
日期:2015-08-03 11:14:27
10 [报告]
发表于 2014-04-22 21:46 |只看该作者
echo aa,1,2,3,4,5,aaa,,ccc,dd,ee,1,2,3,4,,h | sed -r 's/([a-z]+)/"\1"/g' | sed -r 's/,,/,"",/g'
"aa",1,2,3,4,5,"aaa","","ccc","dd","ee",1,2,3,4,"","h"
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP